ガチャと損保と推移行列 -線形代数の応用-
線形代数の応用の1つである推移行列について概説する。固有値、固有ベクトルといった概念が確率的現象の解析に利用できる様を見る。本稿は大学初年度レベルの線形代数の知識を前提とする。
推移行列
定義
有限個の状態を考える。ある時刻の状態がであるとき次の時刻の状態がである確率がで与えられている確率的現象があるとする。成分がで与えられる行列をの推移行列という。
の推移行列をとおき、ある時刻でが状態である確率をとし、これらを縦に並べた状態分布ベクトルをとおく。即ち
とする。
このとき が成り立つ。
例えば2つの状態を考え、からになる確率を0.4、からになる確率を0.3とすると推移行列は
となる。
定常分布
推移行列に対してとなる状態確率ベクトルをの定常分布と呼ぶ。即ち次の時刻においても各状態をとる確率が変わらない状態のことである。これに関して以下の命題が成り立つ。
任意の推移行列に対して定常状態が少なくとも1つは存在する。
定常分布は線形代数的に言えばの固有値1に関する固有ベクトルなのでこの命題は
「推移行列は固有値1を持ち、その固有ベクトルとして状態分布ベクトルとなるものが存在する」
ということを主張している。
命題1の証明を与えよう。
まず固有値1を持つことを示す。
であることからとおけばが成り立つ。
これはがの右作用に関する固有値1の固有ベクトルであるということである。右作用と左作用の固有値は等しい(言い方を変えれば転置行列と元の行列の固有値は等しい)のでは(左作用に関して)固有値1を持つ。
ある次元実ベクトルが状態分布ベクトルであることとかつのすべての成分が0以上であることは同値である。あるベクトルのすべての成分が非負または非正ならばそのベクトルに適当に何倍かしてとできるので、の固有値1の固有ベクトルとしてすべての成分が非負または非正なものが存在することを示せばよい。
これを示すために状態集合が"確率的に分割可能"という概念を導入する。これは状態集合を2つに分割してそのどちらかからもう一方に到達する確率が0となるようにできる、ということである。即ち、状態集合の添え字の集合が2つの共通部分を持たない空でない2つの部分集合の和集合となっており、がすべてのに対して成り立つとき、は確率的に分割可能であるという。
の固有値1の固有ベクトルとしてすべての成分が非負なものが存在することを示す。状態集合は確率的に分割可能でないと仮定してよい。なぜならばもしが確率的に分割可能であるならば分割されたより小さい状態集合に対して定常分布を求めればよいからである。
をの固有値1の固有ベクトルとし、の第成分をとかく。
とおく。このとき
であり、1つ目の不等式の等号が成立するのは のときで、2つ目の等号が成立するのは のとき。もしのいずれも空集合でないならば状態集合は確率的に分割可能でないことと矛盾する。よってかのいずれかは空集合。即ちの成分はすべて非負あるいはすべて負となる。これが求めるベクトルである。(証明終わり)
一般に定常分布はただ1つとは限らない。また、時刻が十分経過したときに定常分布に収束するとも限らない。実際、推移行列がで与えらえる場合、すべての状態分布ベクトルが定常分布となるし、推移行列がで与えらえる場合、定常分布を除くすべての状態分布ベクトルは収束しない。
自動車保険料率
推移行列の応用の1つとして自動車保険のクラス別料率が挙げられる。
ある期間に事故を起こしたかどうかに応じて保険加入者のクラスが決定され、それによって保険料の異なる自動車保険を考える。保険料を決定する時点では加入者のクラス分布はわからないため、これに対してなんらかの仮定を置いて将来予想される保険料収入と保険金支払いがバランスるように保険料を設定する必要がある。この際にクラス分布として前項で述べた定常分布を用いるという考え方がある。その正当性を簡単な例を用いて説明しよう。
3つのクラスが存在する自動車保険を考える。ある期間の事故発生確率はクラスによらずで与えらており、ある期間に事故を起こすと次の期間では一つ下のクラスになり、無事故であると1つ上のクラスになる契約であるとする。このとき上のクラスから順に番号付けされているものとするとクラス分布の推移行列は
で与えらえる。
この推移行列はただ1つ定常分布を持ち、どのような初期状態から始めても定常分布に収束することを証明しよう。
推移行列の固有多項式を計算することで固有値がであることがわかる。したがって推移行列は対角化可能である。固有値の固有ベクトルを1つずつとりとおく。ただしとしては定常分布をとる。このとき、は3次元ベクトル空間の基底となっているので任意の初期状態は の形に書ける。
このとき
であり、よりで.
極限においても各成分の合計が1であるという条件は成り立つのでがいえる。即ち. つまりは定常分布に収束する。(証明終わり)
上記の証明が具体的に固有ベクトルを求めることなく完了している点に線形代数のありがたみがある。つまり対角化可能であることさえわかれば時刻における分布が指数関数の線形結合であることわかるのである。この例のように対角化可能であることさえわかれば固有ベクトルを具体的に求めることなく有用な情報を引き出せることが多々ある。
ガチャ
推移行列のもう1つの応用例として最近のゲームにおけるガチャで特定の数の景品をそろえる確率を計算しよう。
即ち、以下のような問題を考える。
種類のあたり景品があるくじ(復元抽出) を考える。あたりを引く確率はどれも同じであるとする。この確率をとおく。くじを回引いた後、あたり景品を種類持っている確率をに対して求めよ。
景品を種類持っている状態を第状態とすると推移行列は
で与えられる。
初期状態は(確率1で0種類の景品を持っている)なので求める確率は となる。
これを求めるために固有値、固有ベクトルを計算する。
が三角行列なので固有値は対角成分に並んでいる数である。いくつかの固有ベクトルを具体的に計算することで固有ベクトルは以下となることが予想できる。
ただし、は二項係数でのときと定義する。
これらは実際、の固有ベクトルとなっている。即ち、以下の命題が成り立つ。
に対して
が成り立つ。
証明は二項係数の計算に習熟していれば容易なので省略する。
さらにの変換行列との変換行列は互いに逆行列となる。即ち、
これも証明は二項係数の計算をがんばるだけである。
これらの命題よりとおくとであり、
が成り立つ。
これより景品を持っていない状態から始めて回くじを引いた後、景品を種類持っている確率は
と計算できる。(これも二項係数の計算をがんばる。)
例えば の場合で100回くじを引いた後、景品を持っている確率はおよそ
0種類 : 0.59%
1種類 : 5.47%
2種類 : 19.73%
3種類 : 34.65%
4種類 : 29.65%
5種類 : 9.89%
と計算できる。