答えです


わかりました?

いや、サンプリングされてないとか、適当にとってきたんだろうとか、B型が偶然多かったんだろうとか、そういうのもいいですけど、最大の問題は、「その日迷子じゃなかった子供は何人だったんだ?」です。まず、データが推論のために不完全。

血液型 迷子だった 迷子じゃなかった
B型 28人 28人
O型 18人 18人
A型 15人 15人
AB型 12人 12人

もしこんなだったら、どうする?どんな血液型でも、迷子になりやすさは50%で全く同じだ。要するに、分母がわからなきゃ、多いか少ないかなんてわからない、ということ。これは、何の結論も引き出せない不完全なデータだ。もし、本当は上のようなデータだったら、せいぜい言えることは、「この日はB型の子供がよく来ていたんだなあ」ということ。それでおしまい。B型の子供が他の血液型に比べて迷子になりやすいわけじゃない。それは、データを誤読した決めつけだ。

迷子じゃなかった方の人数がもし変わったら、もしかしたらO型が迷子になる可能性が高かったかもしれないし、A型の方が迷子になりやすかったかもしれない。でも、この不完全なデータじゃ、何も言えないわけ。全体を調べてないんだもの。

 

もっとありそうなのは、こっちだな。

血液型 迷子だった 総来園子供数 迷子になる確率
B型 28人 21800人 0.12%
O型 18人 30700人 0.05%
A型 15人 38100人 0.03%
AB型 12人 9400人 0.12%

確実に、休日に都心の3つの大遊園地に来た子供の数は、迷子になった数に比べて極端に多い(とりあえず、よくわからないところを推定するために、血液型人口比であわせてみたが、ここが全然違ったら話がまた変わる。おそらくもっと多いだろう)。上の表では、迷子になった子供の割合は、各血液型で0.1%前後だ。そして各血液型ごとに迷子になる確率の違いも、やはり0.1%も差があるわけじゃない。迷子になりやすさって、そんな1000人や10000人に1人といったレベルの、誤差みたいな微妙なところの違いを問題にしているのだろうか(心は微妙だからそういうところに出るのだって?そんなばかな。4〜5回測れば結果ははっきりするだろう。それにこんな微細な差から、△型は○○な性格なんて、とても決めつけられるはずがない)。少なくとも、確率から言ったら、B型が迷子になりやすいわけじゃないですね、おそらく(迷子になる確率は、一見人数が少ないAB型と全く変わらず、またO型は実際には比較的迷子になりにくいが、そうすると何だか主張と全く一致しない)。

ここには、血液型と性格判断の代表的なトリックが隠されているので、考察に値する。迷子になった子供の数の多さの順に血液型の特性を並べていくと、B「好奇心旺盛、無鉄砲」→O「大胆、行動的」→A「おとなしい、慎重」→AB「冷静、気まま」なのだそうだ。そうか、確かにこういう順番で迷子が多いなあと、一見思わせる。Aはおとなしくて慎重だし、ABは冷静だから迷子にならないなあ、と。でも割合を考慮すると、順番が入れ替わって、最低にランクされていたABが今度はトップになる。すると、「そうだよ、ABって、気ままだから。やっぱり当たってる」となるのだろう(あげくの果てに、血液型性格判断は解釈が柔軟だ、人は血液型だけでは全ては決まらないから、などと言い出すのだ)。そして、「大胆で行動的」なはずのOが割合的には実際は迷子が少ないことは、「そんなもんかなあ」と軽視される。要するに、結果によって、いかようにも解釈でき、また結果の都合のいい部分だけをとりあげるようになっているのだ。

でも全体を見せないで、かつ人数や回数など実際の数(特に小さい数の場合、偶然変動で大きく変わる)を出すから、「血液型によって迷子になりやすさが倍以上も違う、すごい」という強い印象を感じさせることができる。これは、差を大きく見せ、自分の主張を通すためにいろいろなところで実際に使われている常套のテクニックだ(全体のごまかしは、グラフを描くときに非常によく使われている)。これが、いわば、(たとえ有意であっても)無意味な差の意味。まあどっちにしろ、データの集め方が不完全だから、何だかよくわからないけど。

都合よく取ってきたデータで、ごまかされないようにしましょう。特に、逆のデータ(ここでは「迷子じゃなかった」方)を構造的に調べようがないデータを使ったトリックは、結構あるので、要注意ですよ。

このような発想の練習として、手に入りやすい本としては、以下のものがあります。

ダレル・ハフ 統計でウソをつく法 講談社ブルーバックス(120)

また、さまざまなデータ解釈の穴を考えるトレーニングブックとして有用な本は、英語ですが、以下のものが優れています。

Huck, S. W. and Sandler, H. M. 1979 Rival Hypothesis: Alternative Interpretations of Data Based Conclusions. Harper Collins.