小島寛之「完全独習 統計学入門」

Amazonで評判のこの本を、統計学にほとんど素養のない自分が読んだらどうなったか。
まず最初に、自分がどの程度統計学のことを知っていたかを書く。

  1. 自然科学にたずさわっているので、有意とはなにか、仮説検定とは何をやっているか、くらいは何となくわかる。
  2. t検定という言葉は知っているが、何をしているのかはわからない。
  3. 平均、分散の求め方くらいはわかる。標準偏差も一応わかるが、SDとSEMの違いはたぶんわかっていない。
  4. 正規分布の形はわかる。

このような状態から読んでみたが、まずは構成がいい。
前半では標準偏差を説明し、検定とは、区間推定とは、というところまでざっくりと一通り見せてくれる。後半では、区間推定について今度は一段階ずつ丁寧に説明し、「現実の計測値から不確定現象の素性を知るにはどうすればいいか」という目標を常に置きながら、さまざまな推測統計の手法を一つずつ、わからなくならないように紹介していく。

そして、これらを説明していくとき、一つ一つの段階を追うことを非常に重要視してくれているおかげで、ほぼ素人の自分にもとてもわかりやすかった。
例えば前半。いきなり正規分布に入らず、データの特殊性の評価基準としての標準偏差の意味を第3講から第6講にかけてしつこく説明するところはとても親切だ。何せ、後半にかけて繰り返しこの概念が出てくるので、このくらいしつこいおかげで読み進めていく際にとても役立った。
標準偏差を説明するとき、金融商品の例を含めて解説が入っているところも、流れから一度離れるようでありながら、実にためになる。少し前に読んだ「リスク」という本で扱われている金融の世界で統計の手法が使われていることが改めて実感できた。シャープレシオなど、すっきり理解できる。
もちろん、わかりやすいとはいえ、統計学という難しいことを扱っているだけあって、読む人によってところどころつまづくところはあると思う。自分のことについて書くと、第9講に書いてある「仮説検定」「棄却する/されない」についてまでは、普段よく見るだけによくわかった。しかし、次の講で「区間推定」「信頼区間」という概念が導入されるところの理解が引っかかるようで、繰り返し戻って読んで理解した。そして、この「区間推定」の概念が最後のt検定まで効いてくるのがうれしいところ。

段階を追った説明のすばらしさは後半でも発揮される。t検定にいきなり入るのではなく、「母集団の平均もしくは標準偏差をどう推測するか」という実例を、一番簡単なところから個別に説明していく。その過程でカイ二乗分布などを自然に紹介して、最後にt検定に至る。
前の講までで説明してくれていたことときっちり関連をつけて説明してくれるので、あいまいなところがない。おや、と思っても、前に戻って読み返せばよりよくわかるようになっている。だから、なぜそういう式になるのか、そういう数字を出す必要があるのか、について自分で考えて進むことができる。
本全体を通して、正規分布の重要性とか、標準偏差の意味について少しずつ違う見方で何度も考えさせられるので、理解もそれだけ深い。最初に書いた、自分の読む前の状況に比べると、かなりわからなかったことがわかるようになったことは確かである。
それにしても、こういう、「人にわかりやすく教えること」の裏にどれだけの面倒な言葉や流れの吟味があるかを想像すると実に頭が下がる。勉強になったうれしさとともに、そのわかりやすいということのすごさをつくづく感じた。

久々に根気強く勉強した感がある。これから統計についていろいろ勉強していく際に、戻るべき場所になり得る一冊だと思った。