デビアンス(Deviance)

デビアンス(deviance)は、統計モデルがデータにどの程度当てはまるかを示す尺度である。通常データの変動は次の二つの要因から起こる。一つはデータに関する偶然因子(ランダム成分)であり、もう一つは平均を左右する因子、変量(系統的成分)である。考慮される変量は、年齢、性、放射線被曝、食事、職種などである。データ解析は、両方の成分を含むモデルに基づいて行われる。ランダム成分は統計分布を通してとらえ、系統成分は変量および母数の関数として扱われる。その未知母数はデータに最もよく当てはまるモデルを見つけることにより推定される。そこでデビアンスが利用される。モデルを推定した後、それぞれの観測値に対してモデルから得られた理論値あるいは平均の推定値が得られる。デビアンスは、統計分布により説明される偶然変動を考慮して、観測値と理論値との食い違いを測る。モデルがデータ中の偶然変動をうまく説明しているならば、データと理論値の食い違いは小さく、モデルは受け入れられる。一方、もし食い違いが大きいならばモデルを再考すべきである。

放射線影響研究所において原爆被爆者データの解析の大部分は、デビアンスを用いて求められたモデルに基づいている。報告書では通常、「デビアンス差」を略して「デビアンス」として表現している。一方のモデルが他方のモデルに含まれている(ネスティッドされている、または、入れ子されている)場合は、特に系統的成分に関するモデル間のデビアンスの差は有用となる。この時、ネスティッド・モデルとは、より大きいモデルの未知母数の幾つかを定数として固定することにより得られる。統計理論によれば、このような二つのモデルのデビアンス差は、固定された未知母数の数と等しい自由度を持ったカイ二乗の分布に漸近的に従う。これは、制約付きモデル(固定された未知母数を持つモデル)がより大きいモデルと同等にデータに当てはまっているか、あるいはこれらの未知母数がモデルに必要かどうかを検定する基となる。例えば、放射線の感受性に性による差があるかどうか検定する際に、性と線量反応との相互作用を示す未知母数をモデルに含めることができる。そのモデルと制約付きのモデル(このモデルでは相互作用の未知母数はゼロに等しいとみなす)の間のデビアンス差が統計的に有意でなければ、相互作用はないと結論付けられる。

数学的に考えると、デビアンスは特定の推定されたモデルと「フルモデル」とを比較する尤度比統計量の対数値となる。「フルモデル」においては、観察データを理論値として用いているので、すべての変動は、ランダム成分ではなく系統的成分に起因するものとみなすことになる。逆に、共通の平均をすべてのデータに当てはめるのが、いわゆる「ヌルモデル」である。ヌルモデルには変量は含まれないので、すべての変動は系統的成分ではなくランダム成分に起因する。統計解析の目的は、フルモデルのようにデータをモデル中で再び使用するのではなく、ヌルモデルよりもデータをよりよく説明するモデル(そのようなモデルがあるとすれば)を見つけることである。モデルの推定は、幾つかのネスティッド・モデル間でデビアンス差を調べ、データに一番よく当てはまり、できるだけ少ない数の母数を持つモデルを見つけることである。というのは、データが多種の変量に依存しているか、もしそうならばその依存がどのようなものかを研究者が知りたいと考えているためである。

戻る