正規・コーシーベイズ推定量というものを勉強した際、そもそも正規分布とコーシー分布ってどう違うねんって思ったので、pythonでプロットしてみること。
正規分布
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
# 正規・コーシー比較 import numpy as np import matplotlib.pyplot as plt from scipy.stats import cauchy,norm N = 10000 #正規分布 norm = np.random.randn(N) #グラフ描画 plt.xlabel("rand") plt.ylabel("freq") plt.hist(norm,bins=40,color="r") plt.show() |
特に難しくはない。標準正規分布で平均0、標準偏差1になるようにランダムに10000点プロットし、ヒストグラムにしたものです。
裾が軽い(外れ値をとるものが少ない)ため、様々な数理モデルに利用される。
コーシー分布
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
# 正規・コーシー比較 import numpy as np import matplotlib.pyplot as plt from scipy.stats import cauchy,norm N = 10000 #コーシー分布 cauchy = np.random.standard_cauchy(size=N) #グラフ描画 plt.xlabel("rand") plt.ylabel("freq") plt.hist(cauchy,bins=100,color="g") plt.show() |
コーシー分布は外れ値をとる確率が高く、外れ値が重要な意味をもつ場合には利用される分布です。株価暴落など、正規分布の裾が軽い分布でモデル化できないときなどに用います。
外れ値と最頻値をとる頻度に差がありすぎて、わかりづらいので120〜240を拡大してみます。
回数は少ないですが存在してます。
もう一つの特徴は「確率密度関数を描画すると左右対称の確率分布にも関わらず、その平均は0ではない」ことです。
-∞〜∞の範囲で広義積分をすると、その極限は存在しないことがわかります。そのため平均(期待値)が存在しないので、大数の法則や中心極限定理が成り立ちません。なので当然モンテカルロ積分で積分計算を近似することもできない(精度がよくない)です。
スポンサーリンク