回帰分析

単回帰分析は、2変数間の変動傾向または関係をまとめるために用いる一つの統計処理です。グラフ上に直線または曲線で表される結果は、データの全般的関係を述べるモデル(数学的関数)を示します。

最も単純なモデルは、直線(線形モデル)の Y = a + bX です。変数 Y反応変数または目的変数であり、グラフの縦軸に示されます。変数 X予測変数または説明変数であり、グラフの横軸に示されます。モデル中の他の数値はパラメータと呼び、 a切片b は傾きを表します。放影研の放射線生物学研究者によって作成された赤血球の対放射線量突然変異率の図を例に取ると、そこでは Y が突然変異率、X が放射線量です。

回帰分析では、データに対して最もよく当てはまるモデルが得られるような手法を用いて、パラメータの数値である a および b を推定します。データのタイプによって異なる手法を使います。一般的手法としては、連続したデータ(身長、体重、血圧など)に用いる線形回帰(最少二乗法)、計数データ(例えば、ある集団中で白血病を患っている人数)に用いるポアソン回帰、2値データ(ある症状があるかないかといった、結果が「はい」または「いいえ」で表せるもの)に用いるロジスティック回帰、および事象の期間(例えば、がん患者が治療後どれくらいの期間再発せずに過ごせるか)に用いるコックス回帰などがあります。

多くのタイプのモデルが可能です。 XY の関係を述べる(簡略に図示する)ために用いるモデルは、記述モデルと呼びます。線形モデルはその典型的な例です。線形-二次モデル、すなわち Y = a + bX + cX2 は、曲率(パラメータ c曲率と呼ぶ)を表示するデータを記述するのに用いることができます。また、説明変数 X が目的変数 Y にいかに影響を与えるか、あるいは説明変数 X が目的変数 Y をいかに導き出すかといった、機序に関する生物学的または生理学的前提に基づくモデルは、機序モデルと呼びます。機序モデルでは数学的関数がかなり複雑になりがちですが、パラメータは生物学的または生理学的な数量を意味しています。重回帰分析では多くの説明変数を含めることも可能であり、 Y に複数の関連変数が関係している場合(交絡)にはそれが必要となります。二つ以上の説明変数の同時効果には、ある説明変数が他の説明変数の効果を修飾する機序的交互作用(効果修飾)もあります

線量反応線形線量反応、および線形-二次線量反応も参照してください。

戻る