日陰者の復讐 / ヤバい統計学

ヤバい統計学


 最近何かと統計学がピックアップされている。「統計学が最強の学問である」とか、やれビッグデータだ、やれデータマイニングだ、と世間ではブームが起こっているらしい。私のような狂信的物理学愛国主義の頑固者は、数学を単に物理学の侍女であるとみなしている。統計学も然り。従って、そんなに有用ならば学ばない理由はない。数式をいじってじっくり学ぶ前に、導入として読んでみた。

 本書は、以下の一見関係なさそうな10のエピソード ー ディズニーランドと高速道路、大腸菌の集団感染とクレジットカードの審査、フロリダ州の住宅保険とSAT、ドーピング検査と嘘発見器、ロトくじと飛行機の墜落事故 ー を例にとり、統計学の視点で世界を見るための重要な概念を説明していく。その過程で読者は極めて地味ながら偉大な統計学の世界を垣間見ることができる。

日陰者としての統計学

 「世の中には3つの嘘がある。嘘、真っ赤な嘘、そして統計だ」と言ったのは、ベンジャミン・ディズレーリ元英首相だ。このことは弱い論証を支えるために統計が使用されることを表した表現である。科学は数字だ。なぜなら数字は客観的証拠のうち最強の説得力を持つからである。だが一方で数字は、世論を操作する政治家や、うかつなアナリスト、未熟なエコノミスト、押し付けがましい広告屋によっても悪用されてきた。都合のいい数字を選ぶ、単純化しすぎる、わざと曖昧にする、といったように。

 また統計学は地味だ。私も物理学を学んでいながら、体系的に統計学を学ぶカリキュラムはなかった。標準偏差や線形回帰を実験の授業でやる程度であった。しかも90分程度で。また、この本で取り上げる人々は統計を用いて特別な成果を挙げた人々だが、公に賞賛されることはない。むしろ、批判されているものもいるぐらいだ。

 以上のような理由から、統計学はずっと日陰者であった。そんな彼らに日の光を当てたのが本書だ。

統計的思考とは

 「統計的思考は難しい」これはノーベル経済学賞を受賞したダニエル・カーマンの言葉である。ノーベル章を受賞したような頭のいいひとにとっても難しい「統計的思考」とはどのようなものだろうか。どこが普通の思考と違うのか。本書では次の5つの特徴を挙げている。

  1. 統計上の「平均」よりも「ばらつき」に着目する
  2. 真実よりも実用性を優先させる
  3. 似たもの同士を比べる
  4. 2種類の間違いの相互作用に注意する
  5. 稀すぎる事象を信じない

 どれも普通っぽい気がする。だが、上で挙げた10のエピソードを突き詰めていくと、これら5つの特徴をよく表していることがわかる。そしてそのどれもが、普通ではなく、「統計的思考」の産物であるとわかるだろう。

物理学と比較して

 私の専攻は物理学なので、どうしても物理との違いが気になってしまう。本書では、統計学と物理学のスタンスの違いを端的に表した言葉として、次のセリフを引用している。

すべてのモデル*1には間違いがあるが、役に立つモデルもある。

 これはどういうことだろうか。単刀直入にいうと、最良の統計モデルでも現実の世界を完璧に表現することはできない、という意味だ。だから彼らは間違ったモデルだろうと、有用ならば使う、というスタンスをとっている。彼らは完璧なモデルを構築することに興味はない。興味があるのは、現在のモデルよりも優れたモデルを作り出すことだ。だから相関関係でよい。そこがを因果関係を求める物理学者と違うところだと、著者は述べている。

 私はそこが統計学の良いところだと思う。まず、本書でも扱われているようなマーケティングで統計を扱う場合、因果関係は必要ないからだ。A/Bテストで一方がより多く選ばれた理由を知ったからといって、売上が変わるわけではない。また、人の振る舞いほど変化に富むものが、単純な原因で決まるとは信じがたい。それをいちいち調べるのはコストパフォーマンスが悪すぎる。

 また、因果関係が知りたければ、経験や他の分野の知識に頼ればいい。本書で扱われている疫学者は、微生物学者や農業部門の調査官、患者など、統計以外のさまざまなところに裏付けとなる証拠を求めている。統計で無数に考えられる仮説を絞り込んで、あとは実地的な知識から因果関係を見出す。そのように使えるため、統計はまことに使い勝手がいい。

まとめ

 統計は使い勝手がいい。そのうえ、数字に強くなれる。世間ではビッグデータとか機械学習など、ビジネスやテクノロジーの道具として使われることに注目されているけれども、日常生活でも十分使える*2。だから、知っていて損はない。大学では学問をやるところだけど、学校は勉強をするところだから、高校ではこういった役に立つことを教えればいいのに。

ヤバい経済学 [増補改訂版]

ヤバい経済学 [増補改訂版]

運は数学にまかせなさい――確率・統計に学ぶ処世術 ((ハヤカワ文庫NF―数理を愉しむシリーズ))

運は数学にまかせなさい――確率・統計に学ぶ処世術 ((ハヤカワ文庫NF―数理を愉しむシリーズ))

*1:複数の仮説を組み合わせたシステム、言い換えれば仮説の集合体を「モデル」という。飛行機や軍艦のプラモデルはそれらの主要な特徴をとらえた、プラスチックの模型である。

*2:テレビを見ていて、サンプリングが少なすぎだと気付いたり、比較対象がおかしいと思ったり。