峰度 (英语:Kurtosis ),亦称尖度 ,在统计学 中衡量实数 随机变量 概率分布 的峰态。峰度高就意味着方差 增大是由低频度的大于或小于平均值 的极端差值引起的。
远红光对小麦 胚芽鞘 向地反应 的平均速度没有影响,但是峰度由低峰态转变成了尖峰态 (−0.194 → 0.055)
定义
总体 峰态系数定义为:
μ
4
σ
4
,
{\displaystyle \frac{\mu_4}{\sigma^4},\! }
即四阶标准矩 ,其中μ4 是四阶中心矩 ,σ是标准差 。
在更通常的情况下,峰度被定义为四阶累积量 除以二阶累积量的平方,它等于四阶中心矩除以概率分布 方差的平方再减去3:
γ
2
=
κ
4
κ
2
2
=
μ
4
σ
4
−
3
{\displaystyle \gamma_2 = \frac{\kappa_4}{\kappa_2^2} = \frac{\mu_4}{\sigma^4} - 3}
这也被称为超值峰度(excess kurtosis)。“减3”是为了让正态分布 的峰度为0。
假定Y 为n 个独立变量之和,且这些变量和X 具有相同的分布,那么:Kurt[Y ] = Kurt[X ] / n ,
但如果峰度被定义为:μ4 / σ4 ,公式可变得更加复杂。
更一般地说,假定X 1 , ..., X n 为方差相等的独立随机变量,那么:
Kurt
(
∑
i
=
1
n
X
i
)
=
1
n
2
∑
i
=
1
n
Kurt
(
X
i
)
,
{\displaystyle \operatorname{Kurt}\left(\sum_{i=1}^n X_i \right) = {1 \over n^2} \sum_{i=1}^n \operatorname{Kurt}(X_i),}
而定义中如果不包含“减3”就无法成立。
如果超值峰度为正,称为高狭峰 (leptokurtic)。如果超值峰度为负,称为低阔峰 (platykurtic)。
样本峰度
对于具有n 个值的样本 ,样本峰度 为:
g
2
=
m
4
m
2
2
−
3
=
1
n
∑
i
=
1
n
(
x
i
−
x
¯
)
4
(
1
n
∑
i
=
1
n
(
x
i
−
x
¯
)
2
)
2
−
3
{\displaystyle g_2 = \frac{m_4}{m_{2}^2} -3 = \frac{\tfrac{1}{n} \sum_{i=1}^n (x_i - \overline{x})^4}{\left(\tfrac{1}{n} \sum_{i=1}^n (x_i - \overline{x})^2\right)^2} - 3 }
其中m 4 是四阶样本中心矩,m 2 是二阶中心矩(即使样本方差 ),x i 是第i th 个值,
x
¯
{\displaystyle \overline{x}}
是样本平均值 。注意此处计算方差的时候除数是N,而不是单独计算样本方差的(N-1)。
有时候也使用公式:
D
=
1
n
∑
i
=
1
n
(
x
i
−
x
¯
)
2
{\displaystyle D = {1 \over n} \sum_{i=1}^n{ (x_i - \bar{x})^2} }
,
E
=
1
n
D
2
∑
i
=
1
n
(
x
i
−
x
¯
)
4
−
3
{\displaystyle E = {1 \over n D^2} \sum_{i=1}^n{ (x_i - \bar{x})^4} - 3 }
其中,n为样本大小,D 为事先计算的方差,xi 为第i个测量值,
x
¯
{\displaystyle \bar{x}}
为事先计算的算术平均数 。
在一些统计软件中,其公式有所差别。如EXCEL,计算样本的峰度公式如下:
Kurtosis
=
n
(
n
+
1
)
(
n
−
1
)
(
n
−
2
)
(
n
−
3
)
∑
i
=
1
n
(
x
i
−
x
¯
StDev
)
4
−
3
(
n
−
1
)
2
(
n
−
2
)
(
n
−
3
)
{\displaystyle \text{Kurtosis} = {n(n+1) \over (n-1)(n-2)(n-3)}\sum_{i=1}^n({x_i-\bar{x} \over \text{StDev}})^4 - {3(n-1) ^2\over (n-2)(n-3)} }
参见
参考资料