k.style

R で学ぶ確率統計学 多変量統計編

最終更新日: 2023 年 12 月 31 日

一変量統計編でも「統計学は数学ではない。アートなのだ。」と述べているが、統計学を学べば学ぶほどにそう思う。どのモデルを選択するのか、どう結果を解釈するのか。もちろん目安は存在するが、それも結局は習慣に過ぎない。経験がものを言う世界なのだろう。

本書でも『ベイズ統計モデリングによるデータ分析入門』と同様に一般化線形モデルが登場する。最初どこまでがベイズ統計学と呼ばれるものなのか多少混乱したが、一般化線形(混合)モデルを(主に MCMC を活用して)ベイズ統計の枠組みで再構築したものが階層ベイズモデルであると理解した。

前編でも書いたとおり、幅広い分野のデータを使ってモデルを紹介しているところが本書の一番よいところだと思う。特に重回帰分析でボルドーワインの価格を予想している部分などは、非常に楽しかった。ちなみにこれはワイン愛好家でもある経済学者オーリー・アッシェンフェルターが算出したもので、「log( ボルドー赤ワインの平均価格 ) = 定数 + 0.001173 * 冬の降雨量 + 0.616 * 育成期平均気温 - 0.0386 * 収穫期降雨量 + 0.0238 * 熟成年数」で表される。当初ワイン評論家たちを激怒させたと言うが、この公式はかなり当てはまりがよく、彼らの予測をも凌いだらしい。