消費行動の統計モデリング #4:選択肢間の相関を組み込んだプロビットモデル

購買の行動や意思決定にまつわるビッグデータの出現や消費者の多様化が進む中、企業のマーケティング活動においてはミクロな市場に対して理解を深め、的確なインサイトを突いた訴求を実現することが求められています。SEEDATAでは定性的なリサーチに加え、統計モデルを駆使した消費者の理解に取り組んでおり、今回は選択肢間に相関を考慮したプロビットモデルについて説明していきます。

1. 共分散構造分析とモデルの識別性


 前回は、離散選択行動モデルで選択肢を階層状に仮定した、ネステッドロジットモデルについて解説しました。このモデルでは、主にロジットモデルで発生していた問題である、選択肢の変化に対して確率に影響が及ばないIIA特性を解消しています。

消費行動の統計モデリング #2:ロジットモデルとその尤度関数
購買の行動や意思決定にまつわるビッグデータの出現や消費者の多様化が進む中、企業のマーケティング活動においてはミクロな市場に対して理解を深め、的確なインサイトを突いた訴求を実現することが求められています。SEEDATAでは定性的なリサーチ...

 今回は、モデルに対して元から選択肢間の相関が組み込まれたプロビットモデルを紹介します。このモデルでは、例えば行動選択が合計\(J\)個の選択肢からなるときには、それぞれの効用の誤差項が\(J\)次元の多変量正規分布に従います。つまりパラメタのなかであらかじめ選択肢間の相関が考慮されており、仮に選択肢\(j\)の効用が大きいときに選択肢\(k\)の効用が著しく小さくなるような関係がある場合、分散共分散行列の成分\(\sigma_{j,k}\)は負の値をとるでしょう。

 このように、共分散構造によって構成要素や顕在変数の関係を調べる手法を一般に共分散構造分析といい、多変量解析の第二世代と呼ばれることもあります。(Fornell,1982) まずは、この共分散構造分析において重要な問題であるモデルの識別性について、効用最大化理論とプロビットモデルになぞらえて説明していきます。

1.1 モデルの識別性

 モデルの識別性とは、共分散構造分析において推定するモデルの未知数が一意に定まるか、つまりモデルそのものが与えられたデータに対して一つに決まるかという問題を表しています。とてもシンプルな例として、観測されたデータ\(\boldsymbol{\rm X}\)が、パラメタ\(\boldsymbol{\rm \Lambda}\)と潜在変数\(\boldsymbol{\rm Z}\)の積と誤差項\(\boldsymbol{\rm \epsilon}\)で表される場合を考えてみましょう。

\begin{eqnarray}
\boldsymbol{\rm X}=\boldsymbol{\rm \Lambda}\boldsymbol{\rm Z}+\boldsymbol{\rm \epsilon}\tag{1}
\end{eqnarray}

 観測データより潜在変数が低い次元であれば、これは因子分析の表式に一致します。ここでモデルは式(1)そのものになりますが、この状態では与えられたデータは\(\boldsymbol{\rm X}\)のみで、未知数が二つであるためパラメタと潜在変数は一意に決まらないことが分かります。仮に式(1)を満たすようなパラメタと潜在変数\(\boldsymbol{\rm (\Lambda,Z)=(\Lambda^*,Z^*)}\)を発見したとしても、この場合は\(\boldsymbol{\rm (\Lambda,Z)}=(\boldsymbol{\rm \Lambda}^*/2,2\boldsymbol{\rm Z}^*)\)も解になるでしょう。モデルは無数に存在し、まさに識別ができない状態となります。

 効用最大化理論に戻ってモデルの識別性について考えてみます。個人\(i\)が時点\(t\)で\(j\)という選択肢を選ぶ効用を\(U_{j,t,i}\)とし、その際の選択肢の集合を\(A_{t,i}\)、また\(j\)が選ばれる確率を\(p_{j,t,i}\)とおきます。効用最大化理論による選択確率\(p_{j,t,i}\)については、あらゆる選択肢の効用に対して共通の定数\(C\)を加えても、または正の定数\(D\)を乗しても変化がないことが分かります。

\begin{eqnarray}
p_{j,t,i}&=&{\rm Prob}\bigg(U_{j,t,i}>\max_{j\neq k,j,k\in A_{t,i}}\ U_{k,t,i}\bigg)\tag{2}\\[1.0em]
&=&{\rm Prob}\bigg((U_{j,t,i}+C)>\max_{j\neq k,j,k\in A_{t,i}}\ (U_{k,t,i}+C)\bigg)\tag{3}\\[1.0em]
&=&{\rm Prob}\bigg((D\times U_{j,t,i})>\max_{j\neq k,j,k\in A_{t,i}}\ (D\times U_{k,t,i})\bigg)\tag{4}
\end{eqnarray}

式(3)にあるような状態は、この行動選択モデルが位置パラメタ\(C\)に対して識別性がないこと、式(4)については尺度パラメタ\(D\)について識別性がないことを表しています。先述の式(1)について定数倍した\(\boldsymbol{\rm\Lambda= \Lambda^*}/2\)や\(\boldsymbol{\rm Z} = 2\boldsymbol{\rm Z}^*\)も解になるというのは、尺度パラメタについて識別性がないことに一致します。

1.2 位置パラメタと尺度パラメタについての識別性

位置パラメタについて識別性を持たせるためには、シリーズ1回目で説明したような相対効用を定義することが有効です。

消費行動の統計モデリング #1:定量分析の意義と効用最大化理論
購買の行動や意思決定にまつわるビッグデータの出現や消費者の多様化が進む中、企業のマーケティング活動においてはミクロな市場に対して理解を深め、的確なインサイトを突いた訴求を実現することが求められています。SEEDATAでは定性的なリサーチ...

 例えば全\(J\)個の選択肢について\(J\)番目を基準に全ての選択肢について効用の差をとることで、選択肢は\(J-1\)となって自由度が一つ減り、位置パラメタについての識別性が確保されます。

\begin{eqnarray}
u_{j,t,i}&=&U_{j,t,i}-U_{J,t,i}\tag{5}\\[1.0em]
&=&(Z^0_{j,t,i}-Z^0_{J,t,i})\beta_0+(Z^1_{j,t,i}-Z^1_{J,t,i})\beta_1+…+(Z^p_{j,t,i}-Z^p_{J,t,i})\beta_0+\epsilon_{j,t,i}-\epsilon_{J,t,i}\tag{6}\\[1.0em]
&\equiv&\boldsymbol{\rm Z}_{t,i}\boldsymbol{\rm \beta}+\epsilon^*_{j,t,i}\ \ \ \ \ \  \ \ (j=1,2,..,J-1)\tag{7}
\end{eqnarray}

この\(\boldsymbol{\rm Z}_{j,t,i}\)は観測データや潜在変数など、モデルに対する説明変数の差\(\boldsymbol{\rm Z}_{j,t,i}-\boldsymbol{\rm Z}_{J,t,i}\)であり、効用の確定項は係数\(\boldsymbol{\rm \beta}\)と説明変数の線形結合\(\boldsymbol{\rm Z}_{t,i}\boldsymbol{\rm \beta}\)で表されます。つまり相対効用を考えることで入力の説明変数も差をとる必要が生じますが、この処理によって位置パラメタの識別性が保たれます。

 また尺度パラメタについての識別性を確保するためには、式(7)で表される相対効用の分散共分散について条件を課す必要があります。この識別性は式(4)のように全体のスケーリングに関わることであり、しばしば分散共分散行列\(\Sigma\)の(1,1)成分である\(\sigma_{1,1}\)を\(1\)に固定します。

\begin{eqnarray}
\Sigma = \left(
\begin{array}{ccc}
1 & \sigma_{1,2} & \dots & \sigma_{1,J-1} \\
\sigma_{2,1} & \sigma_{2,2} & \dots & \sigma_{2,J-1} \\
\vdots & \vdots & \ddots & \vdots\\
\sigma_{J-1,1} & \sigma_{J-1,2} & \dots & \sigma_{J-1,J-1}\\
\end{array}\right)\tag{8}
\end{eqnarray}

この分散共分散行列は対象行列であるため、推定すべきパラメタの数は\(\frac{(J-1)J}{2}-1=\frac{(J+1)(J-2)}{2}\)となります。

 

2. プロビットモデルの表式と尤度関数の導出


2.1 選択確率の定式化

 プロビットモデルは、先述の通り誤差項が多変量正規分布に従うと仮定され、明に選択肢間の相関が含まれたモデルです。したがって、ロジットモデルで生じていたIIA特性はそもそも生じません。また計算においては、モデルの識別性を確保するために相対効用を用います。式(7)にあるような誤差項が正規分布に従うため、個人\(i\)が時点\(t\)で\(j\)を選択する確率\(p_{j,t,i}\)は以下のようになります。

\begin{eqnarray}
p_{j,t,i}&=&{\rm Prob}(y_{t,i}=j|\boldsymbol{\rm \beta},\Sigma)\tag{9}\\[1.0em]
&=&{\rm Prob}(\boldsymbol{ \rm u}_{t,i}\in R^{J-1}_{j,i}|\boldsymbol{\rm \beta},\Sigma)\tag{10}\\[1.0em]
&=&\int_{R^{J-1}_{t,i}}p(\boldsymbol{ \rm u}_{t,i}|\boldsymbol{\rm \beta},\Sigma)du_{j,t,i}\tag{11}\\[1.0em]
&=&\int_{R^{J-1}_{t,i}}\frac{\exp\bigg( -\frac{1}{2}\big(\boldsymbol{ \rm u}_{t,i}-\boldsymbol{\rm Z}_{t,i}\boldsymbol{\rm \beta} \big)^t\Sigma^{-1}\big(\boldsymbol{ \rm u}_{t,i}-\boldsymbol{\rm Z}_{t,i}\boldsymbol{\rm \beta} \big)\bigg)}{(2\pi)^{\frac{J-1}{2}}|\Sigma|^{1/2}}\tag{12}
\end{eqnarray}

ここで積分範囲の\(R^{J-1}_{t,i}\)は、実数値をとる積分変数の効用\(u_{1,t,i},u_{2,t,i},..,u_{J-1,t,i}\)それぞれが持つ空間の直積\(R^{J-1}_{j,i}=R_{1,t,i}\times R_{2,t,i}\times \dots \times R_{J,t,i}\)である\(J-1\)次元のユークリッド空間を表しており、式(2)にあるような効用最大化理論に従うように選択肢\(j\)の効用が最大になる領域のみを積分しています。具体的に\(R_{j,t,i}\)とは、\(j\)に応じて以下のような2つの条件のどちらかが真となるような領域です。

\begin{eqnarray}
R_{j,t,i}=
\begin{cases}
(u_{j,t,i}>u_{k,t,i}) \land (u_{j,t,i}>0\ \forall k \neq j) \\
u_{k,t,i}<0\ (\forall k)\tag{13}
\end{cases}
\end{eqnarray}

上段は、\(j\)以外のすべての選択肢\(k\)について相対効用\(u_{j,t,i}\)が最も大きく、また\(u_{j,t,i}\)そのものが正である(\(J\)が最も効用が高いわけではない)という領域を示しています。したがって、消費者にとって最も効用が大きく合理的な判断として\(j\)を選択する領域になります。下段は、すべての選択肢\(k\)について相対効用\(u_{k,t,i}\)が負であるので、選択肢\(J\)が最も効用が大きいときに対応します。すべての選択肢\(j\)に対して、選択確率\(p_{j,t,i}\)はこの条件でカバーされます。

 この定義によって、プロビットモデルも他のモデルと同様に条件\(0<p_{j,t,i}<1\)と\(\sum_j p_{j,t,i}=1\)を満たすことになります。特にすべての\(j\)について和をとることは、積分領域を効用という潜在変数が持つ\(J-1\)次元の全空間で積分することに対応するため、多変量正規分布の正規化に対応しています。これを用いて、効用確定項の係数を決定するために尤度関数を計算しましょう。

2.2 プロビットモデルの尤度関数

 個人\(i\)としていたものは計\(I\)人おり、それぞれの個人から\(T_i\)個のデータを得ていたとします。これまでの議論と同じく選択肢は合計\(J\)個、各個人での選択や個人内の選択は全て独立であるとします。選択したかどうかを\(\{0,1\}\)の2値で返す変数として\(y_{j,t,i}\)とすると、パラメタ\(\boldsymbol{\rm \theta}=\{\boldsymbol{\rm \beta},\Sigma \}\)に対する尤度関数は以下のようになります。

\begin{eqnarray}
L(\boldsymbol{\rm \theta})
&=&\displaystyle \prod_{i=1}^{I}\displaystyle \prod_{t=1}^{T_i}
p_{1,t,i}^{y_{1,t,i}}\dots p_{J,t,i}^{y_{J,t,i}}\tag{14}\\[1.0em]
&=&\displaystyle \prod_{i=1}^{I}\displaystyle \prod_{t=1}^{T_i}
\Bigg(\int_{R^{J-1}_{t,i}}p(\boldsymbol{ \rm u}_{t,i}|\boldsymbol{\rm \beta},\Sigma)du_{j,t,i}\Bigg)^{y_{1,t,i}}\dots\Bigg(\int_{R^{J-1}_{t,i}}p(\boldsymbol{ \rm u}_{t,i}|\boldsymbol{\rm \beta},\Sigma)du_{j,t,i}\Bigg)^{y_{J,t,i}}\tag{15}
\end{eqnarray}

ロジットモデルやネステッド・ロジットモデルと異なって、正規分布の積分にはかなり複雑な計算を要するように見えますが、マルコフ連鎖モンテカルロ法に基づくサンプリングで計算時間は劇的に短縮されます。

まとめ


今回は、選択肢間に相関を持たせた離散選択行動モデルであるプロビットモデルについて解説しました。また説明に際し、多変量解析の第二世代と呼ばれる共分散構造分析とモデルの識別性について説明し、これをロジットモデルで解消されることを確認し、尤度関数までの表式を行いました。

参考文献
[1] ビッグデータ時代のマーケティング, (著)佐藤忠彦,樋口知之,講談社 理工学専門書

広本拓麻
Written by
広本拓麻(Hiromoto Takuma)
SEEDATA Technologies