標準差:修订间差异

求闻百科,共笔求闻
添加的内容 删除的内容
(修改自此处;原许可:CC BY-SA 3.0[网站升级迁移])
 
(我来啦, replaced: 內 → 内 (6), 參考 → 参考, 開 → 开 (3), 學 → 学 (3), 與 → 与 (7), 間 → 间 (4), 風 → 风 (2), 構 → 构, 關 → 关, 協 → 协 (2), 應 → 应 (3), 來 → 来 (6), 義 → 义 (8), 對 → 对 (2), 爾 → 尔 (2), 樣 → 样 (5), 號 → 号 (2), 體 → 体 (6), 簡 → 简 (3), 稱 → 称 (2), 區 → 区, 為 → 为 (31), 於 → 于 (3), 種 → 种 (3), 數 → 数 (34), 據 → 据 (3), 術 → 术, 標 → 标 (42), 負 → 负, 複 → 复, 離 → 离 (9), 積 → 积, 實 → 实 (4), 際 → 际 (2), 並 → 并 (2), 後 → 后, 論 → 论, 認 → 认, 總 → 总, 統 → 统 (3), 測 → 测 (17), 過 → 过, 確 → 确 (5), 較 → 较 (10), 約 → 约 (3), 個 → 个 (16), 兩 → 两 (3), 資 → 资 (2),…)
第1行: 第1行:
{{noteTA
{{noteTA
|G1=Math
|G1=Math
|1=zh-cn:方差;zh-tw:共變異數;zh-hk:方差;
|1=zh-cn:方差;zh-tw:共变异数;zh-hk:方差;
|2=zh-cn:总体;zh-tw:母;zh:母;
|2=zh-cn:总体;zh-tw:母;zh:母;
}}
}}
{{Redirect4|-{均方差}-|均方差(MSE)|均方差|均方根差(RMSE)|均方根差}}
{{Redirect4|-{均方差}-|均方差(MSE)|均方差|均方根差(RMSE)|均方根差}}
{{Not|差}}
{{Not|差}}
'''準差'''(又'''準偏-{}-差'''、'''-{均方差}- ''',{{Lang-en|'''S'''tandard '''D'''eviation}},縮寫{{lang|en|'''SD'''}}),數學{{lang|el|'''[[σ]]'''}}(sigma),在[[概率]][[統計]]中最常使用作[[量]]一組數值的[[散程度]]之用。準差定[[方差]][[算术平方根]],反映组内個體間散程度;準差[[期望值]]之比[[差率]]。量到分程度的果,原上具有兩種
'''準差'''(又'''準偏-{}-差'''、'''-{均方差}- ''',{{Lang-en|'''S'''tandard '''D'''eviation}},缩写{{lang|en|'''SD'''}}),数学{{lang|el|'''[[σ]]'''}}(sigma),在[[概率]][[统计]]中最常使用作[[量]]一组数值的[[散程度]]之用。準差定[[方差]][[算术平方根]],反映组内个体间散程度;準差[[期望值]]之比[[差率]]。量到分程度的果,原上具有两种
# 負數值(因為開平方再做平方根);
# 负数值(因为开平方再做平方根);
# 與測料具有相同位(這樣才能比)。
# 与测料具有相同位(这样才能比)。


個總量的準差或一[[隨機變量]]的準差,及一[[子集合]]準差之,有所差。其公式如下所列。
个总量的準差或一[[随机变量]]的準差,及一[[子集合]]準差之,有所差。其公式如下所列。


準差的概念由[[卡·皮森]]引入到統計中。
準差的概念由[[卡·皮森]]引入到统计中。


== 闡述及用 ==
== 闡述及用 ==
簡單來說準差是一組數值自[[平均值]]分散開來的程度的一種測念。一個較大的準差,代表大部分的值和其平均值之異較大;一個較小的準差,代表接近平均值。
简单来说準差是一组数值自[[平均值]]分散开来的程度的一种测念。一个较大的準差,代表大部分的值和其平均值之异较大;一个较小的準差,代表接近平均值。


例如,兩組數的[[集合 (数学)|集合]]{0, 5, 9, 14}和{5, 6, 8, 9}其平均值都是7,但第二集合具有小的準差。
例如,两组数的[[集合 (数学)|集合]]{0, 5, 9, 14}和{5, 6, 8, 9}其平均值都是7,但第二集合具有小的準差。


表述“相差k个标准差”,即在 {{lang|el|'''X̄ ± kS'''}} 的[[本 (統計學)|样本]](Sample)范围内考量。
表述“相差k个标准差”,即在 {{lang|el|'''X̄ ± kS'''}} 的[[本 (统计学)|样本]](Sample)范围内考量。


準差可以作不定性的一種測量。例如在[[物理]][[科]]中,做重值集合的準差代表量的[[精度]]。要決定量值是否符合預值,量值的準差佔有決定性重要角色:如果量平均值值相差太(同時與標準差值做比),則認為測量值值互相矛盾。很容易理解,因如果量值都落在一定範圍之外,可以合理推值是否正
準差可以作不定性的一种测量。例如在[[物理]][[科]]中,做重值集合的準差代表量的[[精度]]。要決定量值是否符合預值,量值的準差佔有決定性重要角色:如果量平均值值相差太(同时与标準差值做比),则认为测量值值互相矛盾。很容易理解,因如果量值都落在一定范围之外,可以合理推值是否正


準差[[投]]上,可作量度回報穩定性的指準差值越大,代表回報遠離過去平均值,回報較定故風險越高。相反,準差值越小,代表回報較為穩定,風險小。
準差[[投]]上,可作量度回报稳定性的指準差值越大,代表回报远离过去平均值,回报较定故风险越高。相反,準差值越小,代表回报较为稳定,风险小。


== 母準差 ==
== 母準差 ==
=== 基本定 ===
=== 基本定 ===
:<math>\ SD= \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2}</math>
:<math>\ SD= \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2}</math>
<math>\mu</math>为平均值(<math>\overline{x}</math>)。
<math>\mu</math>为平均值(<math>\overline{x}</math>)。


=== 简化计算公式 ===
=== 简化计算公式 ===
上述公式可以如下代化:
上述公式可以如下代化:


:<math>\begin{align}
:<math>\begin{align}
第47行: 第47行:
</math>
</math>


裡面,亦即[[變異數]](<math>\sigma^2</math>)的易口訣為:「平方和的平均減去平均的平方
裡面,亦即[[变异数]](<math>\sigma^2</math>)的易口訣为:“平方和的平均減去平均的平方


=== 母體為随机变量 ===
=== 母体为随机变量 ===
一[[隨機變量]]<math>X</math>的準差定義為
一[[随机变量]]<math>X</math>的準差定义为


:<math>\sigma = \sqrt{\operatorname{E}((X-\operatorname{E}(X))^2)} = \sqrt{\operatorname{E}(X^2) - (\operatorname{E}(X))^2}</math>
:<math>\sigma = \sqrt{\operatorname{E}((X-\operatorname{E}(X))^2)} = \sqrt{\operatorname{E}(X^2) - (\operatorname{E}(X))^2}</math>


注意非所有隨機變量都具有準差,因有些隨機變量不存在[[期望值]]。
注意非所有随机变量都具有準差,因有些随机变量不存在[[期望值]]。
如果隨機變量<math>X</math><math>x_1, \cdots, x_n</math>具有相同率,可用上述公式準差。
如果随机变量<math>X</math><math>x_1, \cdots, x_n</math>具有相同率,可用上述公式準差。


==== 散随机变量的标准差 ====
==== 散随机变量的标准差 ====
若<math>X</math>是由[[實數]]<math>x_{1}, x_{2}, ..., x_{n}</math>成的[[随机变量|隨機變數]]({{Lang-en|discrete random variable}}),且每值的'''率相等''',<math>X</math>的準差定義為
若<math>X</math>是由[[实数]]<math>x_{1}, x_{2}, ..., x_{n}</math>成的[[随机变量|随机变数]]({{Lang-en|discrete random variable}}),且每值的'''率相等''',<math>X</math>的準差定义为


:<math>\sigma = \sqrt{\frac{1}{N}\left[(x_1-\mu)^2 + (x_2-\mu)^2 + \cdots + (x_N - \mu)^2\right]}</math> ,其中 <math> \mu = \frac{1}{N} (x_1 + \cdots + x_N)</math>
:<math>\sigma = \sqrt{\frac{1}{N}\left[(x_1-\mu)^2 + (x_2-\mu)^2 + \cdots + (x_N - \mu)^2\right]}</math> ,其中 <math> \mu = \frac{1}{N} (x_1 + \cdots + x_N)</math>


成用<math>\sum</math>來寫,就成
成用<math>\sum</math>来写,就成


:<math>\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2}</math> ,其中 <math> \mu = \frac{1}{N} (x_1 + \cdots + x_N)</math>
:<math>\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2}</math> ,其中 <math> \mu = \frac{1}{N} (x_1 + \cdots + x_N)</math>


目前止,體標準差的基本公式一致。
目前止,体标準差的基本公式一致。


然而若每<math>x_i</math>可以有'''不同率'''<math>p_i</math>,<math>X</math>的标准差定義為
然而若每<math>x_i</math>可以有'''不同率'''<math>p_i</math>,<math>X</math>的标准差定义为


:<math>\sigma = \sqrt{\sum_{i=1}^N p_i(x_i - \mu)^2}</math> ,其中 <math>\mu = \sum_{i=1}^N p_i x_i.</math>
:<math>\sigma = \sqrt{\sum_{i=1}^N p_i(x_i - \mu)^2}</math> ,其中 <math>\mu = \sum_{i=1}^N p_i x_i.</math>
第74行: 第74行:


==== 连续随机变量的标准差 ====
==== 连续随机变量的标准差 ====
若<math>X</math>概率密度<math>p(X)</math>的[[随机变量|连续随机变量]]({{Lang-en|continuous random variable}}),<math>X</math>的标准差定義為
若<math>X</math>概率密度<math>p(X)</math>的[[随机变量|连续随机变量]]({{Lang-en|continuous random variable}}),<math>X</math>的标准差定义为


:<math>\sigma = \sqrt{\int (x-\mu)^2 \, f(x) \, dx}</math>
:<math>\sigma = \sqrt{\int (x-\mu)^2 \, f(x) \, dx}</math>
第88行: 第88行:
::其中:
::其中:
::* <math>\mbox{cov}(X,Y)</math>表示随机变量<math>X</math>和<math>Y</math>的[[协方差]]。
::* <math>\mbox{cov}(X,Y)</math>表示随机变量<math>X</math>和<math>Y</math>的[[协方差]]。
::* <math> \sigma^2(X) </math>表示<math> [ \sigma(X) ]^2 </math>,即<math>Var(X)</math>(<math> X </math>的變異數),<math> Y </math>亦同。
::* <math> \sigma^2(X) </math>表示<math> [ \sigma(X) ]^2 </math>,即<math>Var(X)</math>(<math> X </math>的变异数),<math> Y </math>亦同。


== 样本的标准差 ==
== 样本的标准差 ==
在真实世界中,找到一个总体的真实的标准差實際。大多数情况下,总体标准差是通过随机抽取一定量的样本并计算样本标准差估计的。
在真实世界中,找到一个总体的真实的标准差实际。大多数情况下,总体标准差是通过随机抽取一定量的样本并计算样本标准差估计的。


一大組數值<math>X_1, \cdots, X_N</math>中取出一合<math>x_1, \cdots, x_n : n < N</math>,常定其'''準差''':
一大组数值<math>X_1, \cdots, X_N</math>中取出一合<math>x_1, \cdots, x_n : n < N</math>,常定其'''準差''':


:<math>
:<math>
第101行: 第101行:
样本方差<math>s^2</math>是对总体[[方差]]<math>\sigma^2</math>的[[无偏估计]]。之所以<math>s</math>中的分母要用<math>n-1</math>而不是像总体样本差那样用<math>n</math>,是因为<math>\left( x_i - \bar{x} \right)</math>的[[自由度 (统计学)|自由度]]为<math>n - 1</math>,这是由于存在约束条件<math>\sum_{i=1}^{n}\left(x_i - \bar{x}\right) = 0</math>。
样本方差<math>s^2</math>是对总体[[方差]]<math>\sigma^2</math>的[[无偏估计]]。之所以<math>s</math>中的分母要用<math>n-1</math>而不是像总体样本差那样用<math>n</math>,是因为<math>\left( x_i - \bar{x} \right)</math>的[[自由度 (统计学)|自由度]]为<math>n - 1</math>,这是由于存在约束条件<math>\sum_{i=1}^{n}\left(x_i - \bar{x}\right) = 0</math>。


== 例 ==
== 例 ==
裡示如何算一組數準差。例如一群孩童年齡的{ 5, 6, 8, 9 }:
裡示如何算一组数準差。例如一群孩童年齡的{ 5, 6, 8, 9 }:


* 第一步,算平均值<math>\overline{x}</math>︰
* 第一步,算平均值<math>\overline{x}</math>︰


:<math>\overline{x}=\frac{1}{N}\sum_{i=1}^N x_i</math>
:<math>\overline{x}=\frac{1}{N}\sum_{i=1}^N x_i</math>


:<math>\begin{smallmatrix}N = 4\end{smallmatrix}</math>(因集合裏有4個數),分別設為
:<math>\begin{smallmatrix}N = 4\end{smallmatrix}</math>(因集合裏有4个数),分别设为


::<math>
::<math>
第118行: 第118行:
\end{align}
\end{align}
</math>
</math>
平均值
平均值
:<math>\begin{align}\overline{x}&=\frac{1}{4}\sum_{i=1}^4 x_i & (N = 4) \\
:<math>\begin{align}\overline{x}&=\frac{1}{4}\sum_{i=1}^4 x_i & (N = 4) \\
&=\frac{1}{4} \left ( x_1 + x_2 + x_3 +x_4 \right ) \\
&=\frac{1}{4} \left ( x_1 + x_2 + x_3 +x_4 \right ) \\
第125行: 第125行:
</math>
</math>


* 第二步,準差<math>\sigma\,</math>︰
* 第二步,準差<math>\sigma\,</math>︰


:<math>\begin{align}\sigma &= \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2} \\
:<math>\begin{align}\sigma &= \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2} \\
第137行: 第137行:
&\approx 1.58114\, .\end{align}</math>
&\approx 1.58114\, .\end{align}</math>


== 常規則 ==
== 常规则 ==
{{main|常}}
{{main|常}}
[[File:Standard deviation diagram.svg|缩略图|350px|深藍區域是距[[平均值]]小個標準差之範圍,在[[常]]中,此範圍所佔比率全部值之'''68%''';兩個標準差之(深)的比率合起來為'''95%''';三個標準差之(深淺藍)的比率合起來為'''99.7%'''。]]
[[File:Standard deviation diagram.svg|缩略图|350px|深蓝区域是距[[平均值]]小个标準差之范围,在[[常]]中,此范围所佔比率全部值之'''68%''';两个标準差之(深)的比率合起来为'''95%''';三个标準差之(深浅蓝)的比率合起来为'''99.7%'''。]]


實際應用上,常考慮一組數據具有近似[[常]]的率分。若其假則約'''68%'''值分在距平均值有'''1個標準差'''之範圍'''95%'''值分在距平均值有'''2個標準差'''之範圍,以及'''99.7%'''值分在距平均值有'''3個標準差'''之範圍稱為「'''[[68–95–99.7原|68-95-99.7法]]'''
实际应用上,常考慮一组数据具有近似[[常]]的率分。若其假则约'''68%'''值分在距平均值有'''1个标準差'''之范围'''95%'''值分在距平均值有'''2个标準差'''之范围,以及'''99.7%'''值分在距平均值有'''3个标準差'''之范围称为“'''[[68–95–99.7原|68-95-99.7法]]'''


:<math>f(x;\mu,\sigma^2) = \frac{1}{\sigma\sqrt{2\pi}} e^{ -\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2 }
:<math>f(x;\mu,\sigma^2) = \frac{1}{\sigma\sqrt{2\pi}} e^{ -\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2 }
第155行: 第155行:
{| class="wikitable" style="font-size:&nbsp;"
{| class="wikitable" style="font-size:&nbsp;"
|-
|-
! rowspan=2 | 字比率<br/>準差值
! rowspan=2 | 字比率<br/>準差值
!
!
! colspan=2 | 包含之外比例
! colspan=2 | 包含之外比例
|-
|-
第236行: 第236行:
| {{gaps|99.999|320|465|3751%}}
| {{gaps|99.999|320|465|3751%}}
| {{gaps|0.000|679|534|6249%}}
| {{gaps|0.000|679|534|6249%}}
| 1&nbsp;/&nbsp;{{val|147159.5358}}<br>3.4&nbsp;/&nbsp;{{val|1000000}} (''每一'')
| 1&nbsp;/&nbsp;{{val|147159.5358}}<br>3.4&nbsp;/&nbsp;{{val|1000000}} (''每一'')
|-
|-
| {{val|4.891638}}''σ''
| {{val|4.891638}}''σ''
第258行: 第258行:
| 1&nbsp;/&nbsp;{{val|100000000}}
| 1&nbsp;/&nbsp;{{val|100000000}}
|-
|-
| [[六準差#西格玛等级|{{val|6}}''σ'']]
| [[六準差#西格玛等级|{{val|6}}''σ'']]
| {{val|99.9999998027}}%
| {{val|99.9999998027}}%
| {{val|0.0000001973}}%
| {{val|0.0000001973}}%
第284行: 第284行:
|}
|}


== 準差平均值之關係 ==
== 準差平均值之关系 ==
組數據的[[平均值]]及準差常常同為參考的依。从某种意义上说,如果用平均值考量值的中心的话,則標準差也就是对[[机率分布|统计的分散度]]的一个“自然”的测度。因为由平均值所得的标准差要小于到其他任何一个点的标准差。較確切的<math>X_1, \cdots, X_N</math>[[實數]],定[[函数]]:
组数据的[[平均值]]及準差常常同为参考的依。从某种意义上说,如果用平均值考量值的中心的话,则标準差也就是对[[机率分布|统计的分散度]]的一个“自然”的测度。因为由平均值所得的标准差要小于到其他任何一个点的标准差。较确切的<math>X_1, \cdots, X_N</math>[[实数]],定[[函数]]:


:<math>\sigma(\mu) = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2}</math>
:<math>\sigma(\mu) = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2}</math>


使用[[微分]]或者通过[[配方法]],不算出<math>\sigma(\mu)</math>在下面情況下具有唯一最小值:
使用[[微分]]或者通过[[配方法]],不算出<math>\sigma(\mu)</math>在下面情況下具有唯一最小值:


:<math>\mu = \overline{x}</math>
:<math>\mu = \overline{x}</math>
第312行: 第312行:


[[Category:概率与统计]]
[[Category:概率与统计]]
[[Category:技分析]]
[[Category:技分析]]