はまりにはまっていた
Retrun level plot問題。自分で納得いくレベルまで理解できたのでひとまず決着。問題は「日本でよく使われている「
水文統計ユーティリティ」の結果とRのlibrary(ismev)が返す結果が異なるのはなぜか?」という事で、解析方法が違うから結果が異なっていたんですが、さて、どこがちがうのか。
--------------------
『GEVの再現レベルプロット(Yp, Zp)は以下に従う。
Zp = mu - sigma/xi {1-Yp^(-xi)}, where Yp=-log(1-p)』
という事が一般極値分布から導かれます。
どちらのソフトも以下の計算は同じ。
観測値の非超過確率:Fr=r/(n+1) (n:データ数, r:順位)
観測値の超過確率:p=1-Fr
観測値をプロットする際の超過確率:Ypの計算が異なる。
「水文統計ユーティリティ」Yp = p = 1-Fr
「library(ismev)」Yp = -log(1-p) = -log(Fr)
特に、0.5< p <1の観測値のプロット位置(再現期間:T=1/Yp)が大きく異なる。
-------------------
例えば、19年間の観測場合、最小観測値のFr=1/20となり、
「水文統計ユーティリティ」
Yp = 1-(1/20) = 0.95、再現期間:T = 1/0.95 = 1.001年、
「library(ismev)」
Yp = -log(1/20) = 2.996、再現期間:T = 1/2.996 = 0.334年
Tが大きい時の結果にあまり差違はありませんが、小さい時はけっこう違います。GEVから導出される式に素直に従っているのはlibrary(ismev)の方なのですが、それでも、Tが小さい時の推定精度がどれくらいなのかは気になるところですね。library(ismev)は信頼区間出してくれますがー。