2013年3月24日日曜日

 「ステューデント」のt検定(閑話休題)

統計学の理論的な(堅苦しい)話が続いているので、今回は少し柔らかい話をしたいと思います。統計学を勉強した人なら誰もが知っていると思われるステューデントのt検定に関連する話題です。話は約100年前に遡ります。

■ ゴセットとギネスビール

オックスフォード大学で数学と化学の学位を得たウィリアム・シーリー・ゴセット(William Sealy Gosset:1876~1937)は、アイルランドの老舗ビール会社であるギネスビール醸造所へ入社しました。ちなみに、ギネス社は「ギネスビール」の他、ギネスブックの出版元としても有名です。

ビール会社と統計学に何の関係があるのでしょうか?

実は、ビールの製造過程では麦芽汁を発酵させる必要があり、発酵に必要な酵母の数を出来るだけ精緻に計算する必要があるのです。酵母が少なければ充分に発酵しませんし、多すぎると逆に苦くなってしまうのです。

酵母は生き物なので(酵母)細胞は絶えず増殖・分裂します。また、発酵に使う酵母細胞のすべてを検査するわけにもいきませんから、一部分をサンプル(標本)として抜き取って数えることになります。この少数のサンプルから全体を推定することがゴセットの課題でした。 


■ その名は「ステューデント」

ゴセットは自宅で小さなサンプルを繰り返し抽出し、何度も数値計算を行い、その結果を記録していきました。コンピュータなどない時代ですからすべて手計算です。このような作業には、相当の忍耐力が必要だったことは想像に難くありません。ゴセットの研究は当時バイオメトリカ誌の編集者であったカール・ピアソン(K. Pearson)の目に留まり、1年間の研究休暇をとってピアソンの下で研究を行いました。ゴセットが酵母に関する研究成果をまとめたとき、ピアソンは自分が編集しているバイオメトリカ誌に論文として公表したいと考えました。
ところが、ゴセットは会社に内緒で研究していました。また、研究発表の内容は(ゴセットの貢献が大きいとはいえ)ギネス社の企業秘密に関するものです。そこで、論文発表の際には「ステューデント」というペンネームを使って発表することにしたのです。これが「ステューデント」の由来です。その後約30年間にわたって、「ステューデント」は、数々の重要な論文を書き、その大半がバイオメトリカ誌に掲載されたそうです。中でも特に重要な研究成果の一つが、ステューデントのt検定と呼ばれるものです。この考え方は、The Probable Error of a Mean(1908)という論文で初めて公表され、以後、統計学の発展において極めて重要な役割を果たしました。


■ すべては秘密裏に


生前、ゴセットの研究活動は(少なくともギネス社のオーナーである)ギネス家には気づかれなかったようです。これを裏付けるかのように、アメリカ人の統計学者であるハロルド・ホテリング(H. Hotelling)が、当時「ステューデント」ことゴセットに会おうとした時、『すべて秘密裏に準備が整えられ、さながらスパイ・ミステリーのようだった』と述懐しています(ホテリングについては、後日とりあげる予定です。)

ゴセットはギネス社にとって重要な人材だったようで、ロンドン醸造所所長というポストを得ています。ゴセットが61歳で亡くなった後、彼の友人がゴセットの論文集を一冊の本にまとめるため、ギネス家に印刷費の援助を求めました。その時なって初めて、ギネス家はゴセットの活動を知ったということです。


参考文献:『統計学を拓いた異才たち』 David S. Salsburg (原著) 日本経済新聞社 2006年


清水公認会計士事務所(Shimizu CPA Office

0 件のコメント:

コメントを投稿