数学

ポアソン分布を感覚で理解する

ポアソン分布

「1時間に平均1回電話がかかってくる会社が、1時間に2回電話がかかってくる確率」がまさにそうです。

幾何分布や二項分布では試行回数に注目しましたがポアソン分布では単位時間あたりの回数に注目します。

統計検定に頻出ですし、普通に色んな所で使われるような分布です。

定義など

$$Po(\lambda)=P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda}\\
E[X]=\lambda\\
V[X]=\lambda$$

そもそも質量関数が意味不明です。何でこうなったんでしょうね……(後で自分が納得できる説明を載せます)

1時間当たり平均λ回かかってくるので期待値がλになるのは納得できます。

導出

頑張って二項分布にします。n回(n→∞)試行し、事象が起こる確率がλ/nになるような二項分布です。

無理やりに見えますが、個人的にはなるほどなぁってなりました。

$$
\begin{align}
\lim_{n \to \infty}
Bin(n, \frac{\lambda}{n})&=_nC_k(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{n-k}\\
&=\frac{\lambda^k}{k!}(1-\frac{\lambda}{n})^n(1-\frac{\lambda}{n})^{-k}\frac{n!}{(n-k)!n^k}\\
&=\frac{\lambda^k}{k!}1^ke^{-\lambda}1^{-k}\\
&=\frac{\lambda^k}{k!}e^{-\lambda}
\end{align}$$

ここでネイピア数の定義などを用います。(収束)

二項分布の期待値はnp、npはまさにλです。したがって平均はλです。分散はn(λ/n)(1-λ/n)ですが、1-λ/nは1に収束するんでしょうか。nλ/nは約分でλになるのでそうなんですかね。λが定数なら多分収束する気がします。(少し不安だけど)

 

後ろの階乗のところは約分してみると分母がn(n-1)…(n-k-1)、分子がn^kなので1に収束するらしいです。(極限の厳密な定義を知らないので何をもって収束するしないといえないで今度勉強したいです)ただ、感覚では1に収束する感じなので後は知識を取り入れて確認するのみです(知らんけど)

(n-k)/n(kは定数、n→∞)は1に収束するので成り立つっぽいです。

導出に関しては二項分布で考えるととてもわかりやすいと思いました。極限を考えられればポアソン分布を忘れたときでも導出できそうな感じがします(感じがします)

期待値の導出は以下の高校数学の美しい物語の記事がめちゃくちゃわかりやすくてキレイな式だったので紹介します。

ポアソン分布の意味と平均・分散

確率質量関数をΣ[k=0, ∞]でとると必ず1になるということを利用してλをくくりだしています。他の説明よりもシンプルでとてもわかりやすかったし忘れたときにでも簡単に出せそうな式でした。

ポアソン分布の和

普通に
$$X_1〜Po(3)\\
X_2〜Po(4)\\
E[X_1+X_2]=7$$

しかし、以下のように和が条件となっていたらどうなるでしょうか。

X_1は平均いくつの何分布に従いますか?

$$X_1+X_2=5\\$$

感覚に反しますがBin(5,15/7)に従います。(自分はPo(15/7)だと思っていたので間違えた)

これについてもわかりやすい記事があったので紹介しておきます。

ポアソン分布を和で条件付けすると二項分布となる

また、threecourseさんも解説してくれたのでそれも載せておきます。

2つ合わせてどういうことかというと、まずX+Yをくっつけちゃって点数が入るかどうかだけ見る(ここはポアソン分布に従う)

あとはそこで起こった事象をふるい分ける(言い方はわからないけど)ようにλx/(λx + λy)とすると、二項分布になる。

Qiitaの記事でわかりやすかったのが、Xがk回起こり、Y(X_2)がn-k回起こるから二項分布になるっていう説明です。

一見ポアソン分布に見えてしまったのでここで紹介しておきました。

シミュレーションしようとしてわかったことは、ミソなのはX+Yはすでにわかっているということだと思います。

その他

このスライドは超オススメです。ついつい見入ってしまうし勉強になるスライドです。

事象に対する視点に着目して分布を見ています。視点もスライドも面白くて引き込まれました。

指数分布学ぶときにもう一度これ読んで自分なりにシミュレーションでもしてみようと思っています。

ポアソン分布は二項分布との密接な関係もありますし、このように指数分布とは表裏一体です。

あと、ポアソン過程は難しそうなのでやめます。測度論わからない……

COMMENT

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です