2009年7月25日土曜日

情報量規準を学ぶ

昨日・一昨日は,統計数理研究所で開かれた公開講座「赤池情報量規準と統計モデリング-実際の野外生物データからの入門-」に参加してきました.

赤池情報量規準(AIC)は統計モデルの良さに関する指標で,「AIC = -2 x (最大対数尤度) + 2 x (パラメータ数)」という式で定義されます.この値が小さいほどよいモデルであるということで,複数の候補からもっともよいモデルを選ぶときなどに使われます.このように定義がシンプルで使い方が簡単なことから,生態学でも多くの人がこの規準を使っているようです.

ところが,シンプルな定義の一方で,AICの数学的な側面はかなり複雑で,生態学の研究者が独力で教科書を読んで理解することはかなり難しいです.

簡単な最尤推定をするだけなら,天下り的にAICを使うだけでも十分なのかも知れません.しかし,ベイズ統計などの最尤法の枠組みを超えた統計手法を使う場合,AIC以外にもいくつかの情報量規準を使うことがあります.それらはいずれも異なる考え方のもとに提唱されているので,どれを選ぶべきなのか判断するためには情報量規準についての基本的な理解を持っていることが必要でしょう.

そういうわけで,もっとも広く使われているAICの数学的な背景をごく簡単に勉強できた今回の公開講座は,有意義なものだったと思います.今後は時間を作って,自分でも教科書を読んで勉強したいものです.

3 件のコメント:

  1. お疲れ様でした。うちからも一人参加しましたが、お会いになりましたか?私も行きたかったのですが、その頃私は調査でお山の上でした。

    AICがモデル選択基準たりえる理論的根拠については私は理解が不十分ですが、頻繁に利用している現実があるので、これからしっかりフォローアップして行きたいと思います(赤池情報量基準という本を読んだのですが理解できず......)。


    それにしてもなんだかずいぶん雰囲気が変わった気がします、このblog^^;)。口調だけじゃない気が......

    返信削除
  2. コメントありがとうございます.そちらから来ていた方は,残念ながらお会いできませんでした.声をかけてもらえればよかったのですが….

    数学の本を読んだだけでAICを理解するのは相当キツイです.ある程度の数学の知識がないと,書いてある式を追えないですよ.

    ちなみに,ブログに移った理由は,今までの日記の散漫すぎるスタイルを一新するためでもあります.

    返信削除
  3. こんちわ。ブログいつも拝見しております。
    ポット実験、制御実験だけでなんとか生きてきた私も、
    野外調査を加えていよいよAICさまのお力を借りることになりそうです。

    僕は当分、盲目的に使わせていただこうと思います。

    そいではまた。
    雨ばかりの札幌より。

    返信削除