「統計でウソをつく法」

統計でウソをつく法―数式を使わない統計学入門 (ブルーバックス)

統計でウソをつく法―数式を使わない統計学入門 (ブルーバックス)

統計の話なのに数式は全然出てこなかったので読みやすい。が、古さや外国の本であることや訳の仕方にやや戸惑うところも。

印象深かったのは「平均」のはなし。算術平均(合計÷個数)ならA「600、500、400、300、200(=2000)」でもB「1200、400、300、50、50(=2000)」でも同じ「400」が平均。だが、Bの場合、最大の1200を抜けば算術平均はたったの「200」であり、1200という飛びぬけた数値の影響がわかる。
こういうように算術平均は見かけは同じでもその構成が全然違うことがあるのだ。

上の例に万円をつけて平均年収と考えるとよりわかりやすい。Aは最大でも400万円の格差しかないが、Bなら1150万円もの格差がある。だから職業選択のときには平均年収だけで判断するよりもその構成に目を向けるべきだろう。


「平均」には以上の様な算術平均の他に、構成している数値の真ん中を取った中央値(Aなら400、Bなら300)や、一番たくさん出てくる最頻値(Aなし、Bなら50)というものもあるので、「平均」という単語を見ただけで早合点しないことが大切。

民主党は最賃の全国「平均」を1000円にすると言っているがどういう平均像なのか?
算術?中央値?最頻地?  はたまたどういう構成を描いているのか?