確率行列

出典: フリー百科事典『ウィキペディア(Wikipedia)』

出典: フリー百科事典『ウィキペディア(Wikipedia)』

数学における確率行列(かくりつぎょうれつ、: stochastic matrix)とは、マルコフ連鎖の遷移確率を表す正方行列である。全ての成分が、確率を表す非負実数となっている[1][2]:9-11。文脈によって遷移行列置換行列マルコフ行列と呼ばれることもある(順にtransition matrix, substitution matrix, Markov matrix)。また英語では probabilistic matrix と呼ばれることもある[2]:9-11

確率行列は20世紀初頭にアンドレイ・マルコフによって初めて導入され、確率論統計学数理ファイナンス線形代数学計算機科学集団遺伝学といった様々な分野で活用されてきた[2]:1-8

確率行列には、いくつかの異なる定義・形式がある[2]:9-11

右確率行列(right stochastic matrix)とは、任意の行の和が1となる非負実数成分の正方行列である。
左確率行列(left stochastic matrix)とは、任意の列の和が1となる非負実数成分の正方行列である。
二重確率行列(doubly stochastic matrix)とは、任意の行、任意の列の和が1となる非負実数成分の正方行列である。

同様にして、確率ベクトル英語版(stochastic vector または probability vector) を、全ての成分が非負の実数で和が1となるベクトルと定義できる。右確率行列の全ての行(左確率行列の全ての列)は確率ベクトルである[2]:9-11

数学の文献での慣習に従い、本項では行ベクトルが確率ベクトルとなる右確率行列について述べる[2]:1-8

歴史[編集]

アンドレイ・マルコフ(1886年)

確率行列は、ロシア人数学者サンクトペテルブルク大学教授であったアンドレイ・マルコフによってマルコフ連鎖とともに考案された。出版物への初めての記載は1906年である[2]:1-8 [3]。マルコフは当初、これらを言語分析やカードシャッフル等の数学的題材に用いるつもりだったが、たちまち他の分野でも有用であることが分かってきた[2]:1-8 [3][4]

確率行列はアンドレイ・コルモゴロフ等の学者によってさらなる研究がなされ、連続時間マルコフ過程にも適用できるよう拡張が行われた[5]。1950年代までに、計量経済学[6]回路網解析[7]といった分野にも確率行列を用いた論文が現れた。1960年代には行動科学[8]から地質学[9][10]居住地計画[11]まで、さらに広範な科学領域で確率行列が用いられるようになった。同時に、この期間には確率行列やマルコフ過程の応用範囲や有用性を押し広げるような数学的研究もより一般的に行われた。

1970年代から現在にかけて、確率行列は建築構造設計[12]から医療診断[13]人事労務管理[14]まで、形式的な分析を必要とするほとんどあらゆる分野で用いられるようになってきた。土地利用変化モデリング英語版(land change modeling、この分野では「マルコフ行列」と呼ばれることが多い)においても広範に応用されている[15]

定義と性質[編集]

確率行列は、要素が有限個の状態空間 S濃度 )上のマルコフ連鎖 を記述する。

1ステップで状態 から状態 へ遷移する確率が であるとき、確率行列 行・列成分を とする行列で与えられる。例えば、

状態 から次の状態へ遷移する確率の総和は1なので、

となり右確率行列であるための条件を満たす[2]:1-8

行列 の各 行成分の和は とより簡潔に書くこともできる。ここで は全ての成分が1の 次元列ベクトル。これを使うと、2つの確率行列 , もまた右確率的であることがわかる:

一般に、確率行列 もまた確率行列である。状態 から状態 へ2ステップで遷移する確率は の第 成分

に等しく、さらに一般に、ある状態から次の状態へ k ステップで遷移する確率は で与えられる。

初期状態の確率分布(系がどのような状態をどのような確率でとっているか)は行ベクトルとして与えられる。

定常(stationary)確率ベクトル とは、右確率行列が右から作用しても不変な行確率ベクトルのことである。つまり、集合 上の確率分布であって、左固有値1に対する左固有ベクトルとなるもののことである:

任意の右確率行列のスペクトル半径の最大値は1であることがゲルシュゴリンの定理によりわかる。また右固有値1に対する右固有ベクトル が存在することは明らかである。正方行列に対する右固有値と左固有値は一致するから、右確率行列に対して左固有値1が存在し、全ての左固有値の絶対値が1以下であることも同時に分かる。

行確率ベクトルに右確率行列を右から作用させて得られる行ベクトルもやはり確率ベクトルであるから、(各成分が非負で和が1に等しい n次元実ベクトル全体がコンパクト凸集合をなすことに注意すると)ブラウワーの不動点定理より定常な確率ベクトルが少なくとも一つは存在することが分かる。

一方でペロン=フロベニウスの定理によっても、任意の既約な確率行列(任意の に対し の第 成分が正になる自然数 が存在するような行列。行列の既約性を参照)が定常な確率ベクトルを持ち、固有値の絶対値の最大値が1となることが分かる。しかし、この定理は既約であるとは限らない確率行列には直接的に適用できない。

一般に定常な確率ベクトルは複数存在するかもしれないが、確率行列の全ての成分が正であれば(より一般的には、確率行列が既約かつ非周期的(エルゴード的英語版(ergodic))であれば)、このようなベクトルは一意的であり、任意の状態 に対し次の極限をとることで計算できる。

ここで は行ベクトル の第 成分。これより、長期的に見たとき状態 に到る確率は初期状態 に依らないことが分かる。どのような初期分布から計算しても極限では同一の定常分布に到るという事実はエルゴード定理の一形態であり、多様な散逸構造(系が時間発展し、安定的な状態に達する)において一般的に成り立っている。

直観的には確率行列はマルコフ連鎖を表し、(行ベクトルとしての)確率分布に右確率行列を右から作用させることは、元の分布の確率質量を(総和1を保ちつつ)次の確率分布へ再分配することに相当する。この作用を反復していくとマルコフ連鎖の定常状態に収束する[2]:55–59

例:ネコとネズミ[編集]

5つの一列に並んだ箱と単位時間ずつ進むタイマーがあり、時刻0で、1番目の箱にはネコが、5番目の箱にはネズミが入っているとする。タイマーが進むたびに、ネコとネズミは隣の箱に全くのランダムに飛び移る。

例えば、ネコが2番目の箱・ネズミが4番目の箱に入っていれば、次の時刻にネコが1番目の箱・ネズミが5番目の箱にいる確率は 1/4、ネコが1番目の箱・ネズミが5番目の箱に入っていれば、ネコが2番目の箱・ネズミが2番目の箱に移る確率は 1 である。ネコとネズミが同じ箱に飛び移った時点でネコはネズミを食べてしまうものとし、これを「ゲーム終了」の時刻とする。確率変数 K でゲーム終了までの時間を表すことにする。

このゲームを表すマルコフ連鎖は以下のような(ネコ,ネズミ)の5通りの状態で表せる。状態の組み合わせは単純に数えると25通りだが、「ネズミの箱の番号はネコの箱の番号より小さくはならず」、「2つの箱の番号の和は偶数でなければいけない」ことから、多くの組み合わせは排除される。また、ネズミがネコに食べられる3つの場合は1つの状態としてまとめるものとする:

  • 状態 1: (1,3)
  • 状態 2: (1,5)
  • 状態 3: (2,4)
  • 状態 4: (3,5)
  • 状態 5: ゲーム終了 (2,2), (3,3), (4,4)

以下の行列 で、このゲームの遷移確率を表す(行と列の番号は上記の状態の番号と対応する:行番号が遷移前の状態で、列番号が遷移後の状態[2]:1-8)。例えば状態 1 から始めたとすると、この状態に留まったり、状態 2、状態 4 に遷移することはできない( )が、状態 3 または 5 への遷移は可能である( )。

長時間平均[編集]

初期状態がいずれであっても、ネコは最終的にはネズミを捕えて、定常状態 π = (0,0,0,0,1) に到達する[2]:55–59。生存時間の平均(期待値)を計算するには、すべての状態 Sj と時間 tk についての寄与 Yj,k·P(S=Sj,t=tk) を足しあげればよい。ここで Y は生存状態に対しては Yj,k=1、死亡状態に対しては Yj,k=0 の2値をとる変数である(Y=0は和に寄与しない)。

相型分布としての表現[編集]

ネズミの生存確率関数。少なくとも最初の1ステップでは生き残っている。

状態 5 は吸収状態であり、吸収までの時間は離散的相型分布英語版に従う。系が状態 2 から始まったとする(ベクトルで表すと )。ネズミが死んでしまう状態は平均生存時間に寄与しないから、状態 5 は考えなくてよい。すると初期状態と遷移確率を表す行列は次のように縮小化できる。

また、

ここで 単位行列 は全ての成分が1の列ベクトルであり、各状態に対してその状態への遷移確率を合計するはたらきをする。

各ステップで系はどれかの状態をとるから、ネズミの平均生存時間は、系がいずれかの生存状態にある確率を全ての時間にわたって合計したものに等しく(和は行列項級数として考える)、

となる。高次のモーメントは

で与えられる。

関連項目[編集]

脚注[編集]

  1. ^ Asmussen, S. R. (2003). “Markov Chains”. Applied Probability and Queues. Stochastic Modelling and Applied Probability. 51. pp. 3–8. doi:10.1007/0-387-21525-5_1. ISBN 978-0-387-00211-8. 
  2. ^ a b c d e f g h i j k l Gagniuc, Paul A. (2017). Markov Chains: From Theory to Implementation and Experimentation. USA, NJ: John Wiley & Sons. pp. 9–11. ISBN 978-1-119-38755-8. 
  3. ^ a b Hayes, Brian (2013年). “First links in the Markov chain”. American Scientist 101 (2): 92–96. 
  4. ^ Charles Miller Grinstead; James Laurie Snell (1997). Introduction to Probability. American Mathematical Soc. pp. 464–466. ISBN 978-0-8218-0749-1.
  5. ^ Kendall, D. G.; Batchelor, G. K.; Bingham, N. H.; Hayman, W. K.; Hyland, J. M. E.; Lorentz, G. G.; Moffatt, H. K.; Parry, W. et al. (1990年). “Andrei Nikolaevich Kolmogorov (1903–1987)”. Bulletin of the London Mathematical Society 22 (1): 33. doi:10.1112/blms/22.1.31. 
  6. ^ Solow, Robert (1952年1月1日). “On the Structure of Linear Models”. Econometrica 20 (1): 29–46. doi:10.2307/1907805. JSTOR 1907805. 
  7. ^ Sittler, R. (1956年12月1日). “Systems Analysis of Discrete Markov Processes”. IRE Transactions on Circuit Theory 3 (4): 257–266. doi:10.1109/TCT.1956.1086324. ISSN 0096-2007. http://ieeexplore.ieee.org/abstract/document/1086324/. 
  8. ^ Evans, Selby (1967年7月1日). “Vargus 7: Computed patterns from markov processes” (英語). Behavioral Science 12 (4): 323–328. doi:10.1002/bs.3830120407. ISSN 1099-1743. http://onlinelibrary.wiley.com/doi/10.1002/bs.3830120407/abstract. 
  9. ^ Gingerich, P. D. (1969年1月1日). “Markov analysis of cyclic alluvial sediments” (英語). Journal of Sedimentary Research 39 (1): 330–332. doi:10.1306/74d71c4e-2b21-11d7-8648000102c1865d. ISSN 1527-1404. http://archives.datapages.com/data/doi/10.1306/74D71C4E-2B21-11D7-8648000102C1865D. 
  10. ^ Krumbein, W. C.; Dacey, Michael F. (1969年3月1日). “Markov chains and embedded Markov chains in geology” (英語). Journal of the International Association for Mathematical Geology 1 (1): 79–96. doi:10.1007/BF02047072. ISSN 0020-5958. https://link.springer.com/article/10.1007/BF02047072. 
  11. ^ Wolfe, Harry B. (1967年5月1日). “Models for Conditioning Aging of Residential Structures”. Journal of the American Institute of Planners 33 (3): 192–196. doi:10.1080/01944366708977915. ISSN 0002-8991. https://doi.org/10.1080/01944366708977915. 
  12. ^ Krenk, S.. “A Markov matrix for fatigue load simulation and rainflow range evaluation” (英語). Structural Safety 6 (2–4): 247–258. doi:10.1016/0167-4730(89)90025-8. http://www.sciencedirect.com/science/article/pii/0167473089900258 2017年5月5日閲覧。. 
  13. ^ Beck, J.Robert; Pauker, Stephen G. (1983年12月1日). “The Markov Process in Medical Prognosis” (英語). Medical Decision Making 3 (4): 419–458. doi:10.1177/0272989X8300300403. ISSN 0272-989X. https://doi.org/10.1177/0272989X8300300403. 
  14. ^ Gotz, Glenn A.; McCall, John J. (1983年3月1日). “Sequential Analysis of the Stay/Leave Decision: U.S. Air Force Officers”. Management Science 29 (3): 335–351. doi:10.1287/mnsc.29.3.335. ISSN 0025-1909. http://pubsonline.informs.org/doi/abs/10.1287/mnsc.29.3.335. 
  15. ^ Kamusoko, Courage; Aniya, Masamu; Adi, Bongo; Manjoro, Munyaradzi (2009年7月1日). “Rural sustainability under threat in Zimbabwe – Simulation of future land use/cover changes in the Bindura district based on the Markov-cellular automata model”. Applied Geography 29 (3): 435–447. doi:10.1016/j.apgeog.2008.10.002. http://www.sciencedirect.com/science/article/pii/S0143622808000702.