コメントを下さいと言われて読んでいた資料の中に妙なグラフがあったので、一体何が妙なのかちゃんと説明しないとな…と教科書を確認していたら、いきなりGLMのLink関数が何なのかが分かった。あー、神が降りてきた(今ごろ…)。GLM使いながらも、一体Link functionって何よ。とずっと思っていたわけです。線形予測子と平均値をつなぐ関数ですとか言われてもさ、「そうですか、うーむ、それでそれはどうやって選ぶんですか?」、「確率分布ごとにオススメlink関数があるんですか…。」、「で、なにがどうオススメなのよ…。」とずーーーーっと思っていたわけです。
線形予測子と平均値をつなぐって、まさに推定曲線(直線)の形のことなんですね。あはは、そりゃそうだわ。自分でさんざん推定曲線書いてたし…。ちゃんと、
講義資料(5ページ)にもちゃんと「log link関数を適用すると、μ = exp(β1 + β2 × (要因1) + β3 × (要因2) + · · ·) といった統計モデルのパラメーター推定も可能になる」って書いてるわ。これが、logじゃなくてidentity link関数なGLM (family=Poisson) だと誤差分布はPoissonだけど推定曲線は直線なモデリングになるわけですね。で、まぁ、Poisson使う状況ではあまりそうはならないと。これって、単純に平均値 (μ) が負にならないだけじゃなくて、指数関数的増加をするってことも大切だよね。いやー、まったくGLM理解していませんでしたねー。でも、もうこれでスッキリ!!
実はGLMは修士の時の統計の授業でもちゃんと習っていたんですね。S-plusでほんのちょっとスクリプト書いた記憶しか残ってないけど(まぁ、あの頃はすべての情報が目の前を流れていってましたからね…)。偉大なるRamsey先生の教科書「The Statistical SleuthーA Course in Methods of Data Analysis」の
サイトのResourcesから素敵なグラフが見れるので、ぜひぜひ、ideal models of GLMを堪能して下さい。
・
Gaussian with identity link funtion: 112枚目、Displary 7.5 (p. 180)
・
Poisson with log link function: 89枚目、Display 22.5 (p. 650)
・”
岩波本”にも素敵な
図がのるようです。
.