最終更新:2019/03/03

最大値と最小値の分布(一般論と例)


$0$ 以上 $1$ 以下の数字をランダムに独立に $n$ 個生成する。このとき,小さい方から $k$ 番目の数の期待値は $\dfrac{k}{n+1}$ となる。

最大値や最小値など「小さい方から $k$ 番目」が従う確率分布の公式について考えます。最後に公式を一様分布に適用することで,上記の性質を確認します。

最大値が従う分布

確率変数 $X_1,\dots, X_n$ が互いに独立に同一の分布(累積分布関数が $F(x)$)に従うとします。このとき,$X_1,\dots,X_n$ の最大値や最小値が従う分布について考えてみます。

まず「最大値の分布」の累積分布関数は $F(x)^n$ になります。

導出

「最大値が $x$ 以下の確率」
=「$X_1,\dots,X_n$ が全て $x$ 以下になる確率」
$=F(x)\times \dots \times F(x)\\
=F(x)^n$

最小値が従う分布

「最小値の分布」の累積分布関数は $1-\{1-F(x)\}^n$ になります。

導出

「最小値が $x$ 以下の確率」
=「少なくとも1つは $x$ 以下になる確率」
=1-「全部 $x$ より大きい確率」
$=1-\{1-F(x)\}^n$

順序統計量が従う分布

「$X_1,\dots,X_n$ のうち,小さい方から $k$ 番目」が従う分布の累積分布関数は,
$\displaystyle\sum_{t=k}^n{}_n\mathrm{C}_tF(x)^t\{1-F(x)\}^{n-t}$

最小値の分布($k=1$ の場合),最大値の分布($k=n$ の場合)の一般化です。

導出の概略

小さい方から $k$ 番目が $x$ 以下である確率
=「$n$ 個のうちちょうど $t$ 個が $x$ 以下である確率」を $t=k$ から $t=n$ まで足し上げたもの
と考える。

累積分布関数はシグマが入っていて少し複雑ですが,実は微分するときれいになります。

「$X_1,\dots,X_n$ のうち,小さい方から $k$ 番目」が従う分布の確率密度関数は,
$k{}_n\mathrm{C}_kF(x)^{k-1}\{1-F(x)\}^{n-k}f(x)$

※もとの分布の確率密度関数 $f(x)$ の存在は仮定します。

導出の概略

上記の累積分布関数を地道に微分すると,
$\displaystyle\sum_{t=k}^n{}_n\mathrm{C}_ttF(x)^{t-1}\{1-F(x)\}^{n-t}f(x)\\
-\displaystyle\sum_{t=k}^n{}_n\mathrm{C}_t(n-t)F(x)^t\{1-F(x)\}^{n-t-1}f(x)\\
=\displaystyle\sum_{t=k}^n\dfrac{n!}{(t-1)!(n-t)!}F(x)^{t-1}\{1-F(x)\}^{n-t}f(x)\\
-\displaystyle\sum_{t=k}^{n-1}\dfrac{n!}{t!(n-t-1)!}F(x)^t\{1-F(x)\}^{n-t-1}f(x)$
となるが,(第1項で $t$ を $t+1$ にすると第2項と一致するので)うまく打ち消し合って,第1項の $t=k$ の項のみが残る。

一様分布の場合の例

区間 $[0,1]$ 上の一様分布に,上記の結果を適用してみます。

累積分布関数は $F(x)=x$ なので「$X_1,\dots,X_n$ のうち,小さい方から $k$ 番目」が従う分布の確率密度関数は,
$Cx^{k-1}(1-x)^{n-k}$
となります(ただし,$C$ は正規化定数)。

これは,パラメータが $(k,n-k+1)$ であるベータ分布です。そこで,ベータ分布の期待値の公式を使うと「小さい方から $k$ 番目」の期待値が
$\dfrac{k}{n+1}$
になることが分かります。

参考:ベータ分布の意味と平均・分散の導出

一般論(確率密度関数の導出で項が打ち消し合うところ)も具体例(乱数の期待値が等間隔に並ぶところ)もきれいです。