2016/11/20

フォンミーゼスフィッシャー分布


「向き」に確率をのせた分布の代表例としてフォンミーゼスフィッシャー分布がある。

まずは(少し難しいですが)定義を紹介して,それから二次元の場合の例を通じて意味を解説します。

定義

確率密度関数が $f(x)=Ce^{k\mu^{\top} x}$ であるような確率分布をフォンミーゼスフィッシャー分布(Von Mises–Fisher distribution)と言います。

ただし,

  • $x$ は $d$ 次元ベクトルで,定義域は $|x|=1$ を満たすもの全体(球面上)
  • $\mu$ はパラメータ(長さが $1$ の $d$ 次元ベクトル)
  • $k$ もパラメータ($0$ 以上の定数)

です。

$C$ は正規化定数です。一般に $C$ をきれいに書き表すことはできません(ベッセル関数というものが登場する)。ですが,$d=3$ の場合はうまく積分できます(後述)。

意味

$d=2$ の場合でフォンミーゼスフィッシャー分布の意味を見てみましょう。定義域は単位円周上です。

単位円周上の点と向きの対応

単位円周上の点には「向き」が対応します。
(例えば赤い点には「右上」が対応する)

つまり,フォンミーゼスフィッシャー分布では平面上の「向き」に対して確率が定義されていると考えることができます。

また,$\mu^{\top}x$ は $\mu$ と $x$ がなす角のコサインなので,向きが似ていれば値が大きくなります。つまり,$\mu$ という向きに近い向きのときほど確率が高いような分布となっています。$\mu$ は「向きの平均」です。そして,$k$ が大きいほど分布が $\mu$ 付近に集中していることが分かります。

$d\geq 3$ のときも同様です。フォンミーゼスフィッシャー分布は $d$ 次元空間内の「向き」に定義された確率分布とみなすことができます。

$d=3$ のときの正規化定数

$d=3$ のときの正規化定数を計算してみましょう。

大学初等レベルの面白い計算問題です。

正規化定数の導出

確率密度関数の定義より,
$\displaystyle\int Ce^{k\mu^{\top}x}dx=1$
ただし,積分範囲は単位球面上($|x|=1$)。

直交座標から $(r,\theta,\phi)$ 極座標へ変換を行う。→三次元極座標についての基本的な知識

  • 球面の微小面積要素は $\sin\theta d\theta d\phi$
  • $\mu^{\top} x=\cos\theta$

なので,
$\displaystyle\int_{0}^{\pi}d\theta\int_0^{2\pi}d\phi\:Ce^{k\cos\theta}\sin\theta d\theta=1$

まず $\phi$ で積分すると,
$2\pi C\displaystyle\int_0^{\pi}\sin\theta e^{k\cos\theta}d\theta=1$

次に,$\theta$ で積分する(高校数学の知識で積分できる!)と,
$2\pi C\left[-\dfrac{e^{k\cos\theta}}{k}\right]_0^{\pi}=1$

$C=\dfrac{k}{2\pi (e^{k}-e^{-k})}$

「向き」を使う統計学として,方向統計学という分野があるようです。

Tag: いろいろな確率分布の平均,分散,特性関数などまとめ