=20061028=
とうとう、山が動いた…。「ロジスティック回帰するのがいいよ」と説明していた後輩が指導教官に計算結果を見せたらしく、先生がやって来て、GLMについて説明して欲しいと言われた。はっきり言って、聞く相手が間違っている!ので、「私に聞いてもどうしようもないですけど…」と前置きしつつ、私のザルのような頭の中に残った正答率30%くらいの知識をつぶやいてみた。先生は古い手法に固執したりしないので、先生がGLM転換されれば、うちの研究室のGLM化は一気に進むんじゃないかと思う。そうすれば!ゼミで「GLMって何?」と質問される恐怖から解放されるのだ。素晴らしい!!
と言う、夢の世界に近づくためにはその前に押し寄せるであろう「あのー、GLM使った方が良いって言われたんですけど…」と言うinnocentなつぶやきに答えなければならないのだろうか…。どっかで見た風景だなぁ(汗)。しかし、「独学反対の歌」を掲げる身としてはここをチャンスとばかりに、ふつうの学生がGLMが分かった気分になるコースを作り上げるべきなんでしょう。当然ながら、私もそのサンプルの1つなわけで、先生に説明すべく悪戦苦闘していたら、いきなりlink関数の意味が分かった…。なんだよ、すごい大切じゃん(笑)。やっぱり、先生聞く相手間違ってますよ。
=20061111追記=
AICは説明変数間の多重共線性は考慮してないの?と言われたので、きっと考慮してません、と答えた。あってるのかね…(いや、多重共線性のある変数ならばどちらかが落ちて行くってことじゃないのかね。それともそもそも、相関の高いもの入っている時点でAICが上手く計算できなくなるってことなのか?)。じゃぁ、どうやって多重共線性のあるなしをはかるのか?と言われたので、うーん、あるとは思えないんですけどと散布図見せたら、「これなら大丈夫だね」と解決したようです。でも、処理区ごとに点のばらつき方が違うのには何も言われなかった。このままだと、処理区(カテゴリー)と環境変量たちを一緒に説明変数としてglm()に投入するのを上手く説明できそうにないな…。自分が非独立だと思って設定した変数でも実際のデータがそうなっていなければ(独立なら)それぞれ変数として入れてよいのだと思ったのだけど、違うのか??なんか、glm以前の問題でつまづいているよなぁ。
to be continued...