ロジスティック回帰モデル
定義
ベルヌーイ分布にしたがう確率変数 を応答としてもつ場合を考えます。このとき、2値応答の期待値 を 個の説明変数 から推定するモデルとして、ロジスティック回帰モデル:
を与えることができます。
シグモイド
簡単のために、ロジスティック単回帰:
を考えます。これを目的変数 について解くと、
という関数 を得ます。 を適当に決めたときのこの関数のグラフを示します:
import numpy as np
import matplotlib.pyplot as plt
# sigmoid function
def theta(x, alpha = 0, beta = 1):
return 1 / (1 + np.exp(-(alpha + beta * x)))
x = np.arange(-10, 10, 0.1)
plt.plot(x, theta(x))
plt.title(r"Sigmoid function ($\alpha = 0, \beta = 1$)")
plt.xlabel(r"$x$")
plt.ylabel(r"$\theta(x)$")
plt.grid()
plt.show()
以上の関数は2値変数 を実数領域でなめらかに補間した形になっています。このようなS字の関数を シグモイド といいます。
回帰係数の効果
2つの事象が発生する確率の比:
を応答 の オッズ といい、一方の事象がもう一方の事象に対して何倍程度起こりやすいかを表します。回帰係数 は、説明変数 がオッズに与える寄与の大きさであることが上式よりわかります。
ロジスティック回帰モデルの最尤推定
個の説明変数からなるロジスティック回帰モデルにおいて、データ を与えて回帰係数 を最尤推定することを考えます:
番目の観測値 による応答値を とします。このとき、モデルの対数尤度関数は、 なベルヌーイ分布 からの尤度関数を用いて
と表すことができます。最尤推定量 は から求められますが、陽に解くことはできません。最尤推定量 を用いると、
が成り立ちますから、 番目の観測値における生起確率の最尤推定量 は、
と与えられます。
ポアソン回帰モデル
定義
応答 が計数値であり、 である場合には、その期待値 に対する ポアソン回帰モデル:
を考えることができます。
回帰係数の効果
上式を母数 に対して解くと、
です。 はポアソン分布の平均であり、めったに起こらない事象の生起回数を表しますから、回帰係数 は説明変数 が平均 回起きる事象をどれほど起こりやすくするかの効果を表します。
ポアソン回帰モデルの最尤推定
個の説明変数からなるポアソン回帰モデルにおいて、データ を与えて回帰係数 を最尤推定することを考えます:
番目の観測値 による応答値を とします。このとき、モデルの対数尤度関数は、 なポアソン分布 からの尤度関数を用いて
と表すことができます。最尤推定量 は から求められますが、やはり陽に解くことはできません。
参考
書籍
『統計学実践ワークブック』(学術図書出版社, 2020)第18章