パレート分布(パレートぶんぷ、英: Pareto distribution)は、イタリアの経済学者ヴィルフレド・パレートが所得の分布をモデリングする分布として提唱した連続型の確率分布である。離散型はゼータ分布(ジップ分布)である。

定義と性質

a, b (a > 0, b > 0) をパラメータ、実数 x (xb) を確率変数とするときのパレート分布の確率密度関数は以下の式で定義される。(注:右InfoBoxでは α = a, Xm = b

a / b ( x / b ) a 1 {\displaystyle {\frac {a/b}{(x/b)^{a 1}}}}

このとき、期待値は a b a 1  for  a > 1 {\displaystyle {\frac {ab}{a-1}}{\mbox{ for }}a>1} 、分散は a b 2 ( a 1 ) 2 ( a 2 )  for  a > 2 {\displaystyle {\frac {ab^{2}}{(a-1)^{2}(a-2)}}{\mbox{ for }}a>2} である。

一般化パレート分布

一般化パレート分布(英: generalized Pareto distributions, GPD) は、確率変数 X がある閾値を超える確率 P(X > a) を推定する場合のモデルとして使用される。例えば、風速、洪水、震度などが一定値以上となる確率のモデル化などに適用される。この分布は 位置母数 μ、尺度母数 σ、形状母数 ξ の3つのパラメータをもち、ξ をパレート指数と言う。

累積分布関数は次式で表される。

(ただし、形状パラメータを κ = −ξ とする書物もある。)

F ( ξ , μ , σ ) ( x ) = 1 ( 1 ξ ( x μ ) σ ) 1 / ξ {\displaystyle F_{(\xi ,\mu ,\sigma )}(x)=1-\left(1 {\frac {\xi (x-\mu )}{\sigma }}\right)^{-1/\xi }}

台は指数部 1 ξ ( x μ ) σ 0 {\displaystyle 1 {\frac {\xi (x-\mu )}{\sigma }}\geq 0} にて制限される。

確率密度関数は

f ( ξ , μ , σ ) ( x ) = 1 σ ( 1 ξ ( x μ ) σ ) ( 1 / ξ 1 ) {\displaystyle f_{(\xi ,\mu ,\sigma )}(x)={\frac {1}{\sigma }}\left(1 {\frac {\xi (x-\mu )}{\sigma }}\right)^{(-1/\xi -1)}}

分類

一般化パレート分布 (GPD) は、一般化極値分布 (GEV) と同様3種類に分類される。

  • ξ > 0 のとき、パレート分布
  • ξ = 0 のとき、指数分布
F ( ξ , μ , σ ) ( x ) = 1 exp ( ( x μ ) σ ) f ( ξ , μ , σ ) ( x ) = 1 σ exp ( ( x μ ) σ ) {\displaystyle {\begin{aligned}F_{(\xi ,\mu ,\sigma )}(x)&=1-\exp \left(-{\frac {(x-\mu )}{\sigma }}\right)\\f_{(\xi ,\mu ,\sigma )}(x)&={\frac {1}{\sigma }}\exp \left(-{\frac {(x-\mu )}{\sigma }}\right)\end{aligned}}}
  • ξ < 0 のとき、タイプ2 パレート分布

参考文献

  • 蓑谷千凰彦、統計分布ハンドブック、朝倉書店 (2003).
  • B. S. Everitt(清水良一訳)、統計科学辞典、朝倉書店 (2002).

関連項目

  • 確率分布
  • 冪乗則

外部リンク

  • 朱鷺の杜Wiki
  • GSL reference manual Japanese version

パレート分布

パレート図

パレート図とは?パレートの法則(8020の法則)とABC分析の活用法 カイゼンベース / KAIZEN BASE

フロー技術を活用した ネットワークセキュリティの研究 ppt download

パレート図作成手順 TIBCOサポート