標準差：修订间差异 - 求闻百科，共笔求闻

第1行：

{{noteTA

|G1=Math

|1=zh-cn:協方差;zh-tw:共~~變異數~~;zh-hk:協方差;

|1=zh-cn:协方差;zh-tw:共变异数;zh-hk:协方差;

|2=zh-cn:总体;zh-tw:母體;zh:母體;

|2=zh-cn:总体;zh-tw:母体;zh:母体;

}}

{{Redirect4|-{均方差}-|均方誤差（MSE）|均方誤差|均方根誤差（RMSE）|均方根誤差}}

{{Redirect4|-{均方差}-|均方误差（MSE）|均方误差|均方根误差（RMSE）|均方根误差}}

'''標準差'''（又稱'''標準偏-{}-差'''、'''-{均方差}- '''，{{Lang-en|'''S'''tandard '''D'''eviation}}，縮寫{{lang|en|'''SD'''}}），數學符號{{lang|el|'''[[σ]]'''}}（sigma），在[[概率]][[統計]]中最常使用作為[[測量]]一組數值的[[離散程度]]之用。標準差定義：為[[方差]]開[[算术平方根]]，反映组内~~個體間~~的離散程度；標準差與[[期望值]]之比為[[標準離差率]]。測量到分佈程度的結果，原則上具有兩種性質：

'''标準差'''（又称'''标準偏-{}-差'''、'''-{均方差}- '''，{{Lang-en|'''S'''tandard '''D'''eviation}}，缩写{{lang|en|'''SD'''}}），数学符号{{lang|el|'''[[σ]]'''}}（sigma），在[[概率]][[统计]]中最常使用作为[[测量]]一组数值的[[离散程度]]之用。标準差定义：为[[方差]]开[[算术平方根]]，反映组内个体间的离散程度；标準差与[[期望值]]之比为[[标準离差率]]。测量到分布程度的结果，原则上具有两种性质：

# 為非負數值（因為開平方後再做平方根）；

# 为非负数值（因为开平方后再做平方根）；

# 與測量資料具有相同單位（這樣才能比對）。

# 与测量资料具有相同单位（这样才能比对）。

一個總量的標準差或一個[[~~隨機變~~量]]的標準差，及一個[[子集合]]樣品數的標準差之間，有所差別。其公式如下所列。

一个总量的标準差或一个[[随机变量]]的标準差，及一个[[子集合]]样品数的标準差之间，有所差别。其公式如下所列。

標準差的概念由[[卡爾·皮爾森]]引入到統計中。

标準差的概念由[[卡尔·皮尔森]]引入到统计中。

== 闡述及應用 ==

== 闡述及应用 ==

~~簡單來說~~，標準差是一組數值自[[平均值]]分散開來的程度的一種測量觀念。一個較大的標準差，代表大部分的數值和其平均值之間差異較大；一個較小的標準差，代表這些數值較接近平均值。

简单来说，标準差是一组数值自[[平均值]]分散开来的程度的一种测量观念。一个较大的标準差，代表大部分的数值和其平均值之间差异较大；一个较小的标準差，代表这些数值较接近平均值。

例如，~~兩組數~~的[[集合 (数学)|集合]]{0, 5, 9, 14}和{5, 6, 8, 9}其平均值都是7，但第二個集合具有較小的標準差。

例如，两组数的[[集合 (数学)|集合]]{0, 5, 9, 14}和{5, 6, 8, 9}其平均值都是7，但第二个集合具有较小的标準差。

表述“相差k个标准差”，即在 {{lang|el|'''X̄ ± kS'''}} 的[[樣本 (~~統計學~~)|样本]]（Sample）范围内考量。

表述“相差k个标准差”，即在 {{lang|el|'''X̄ ± kS'''}} 的[[样本 (统计学)|样本]]（Sample）范围内考量。

標準差可以當作不確定性的一種測量。例如在[[物理]][[科學]]中，做重複性測量時，測量數值集合的標準差代表這些測量的[[精確度]]。當要決定測量值是否符合預測值，測量值的標準差佔有決定性重要角色：如果測量平均值與預測值相差太遠（同~~時與標~~準差數值做比較），~~則認為測~~量值與預測值互相矛盾。這很容易理解，因為如果測量值都落在一定數值範圍之外，可以合理推論預測值是否正確。

标準差可以当作不确定性的一种测量。例如在[[物理]][[科学]]中，做重复性测量时，测量数值集合的标準差代表这些测量的[[精确度]]。当要決定测量值是否符合預测值，测量值的标準差佔有決定性重要角色：如果测量平均值与預测值相差太远（同时与标準差数值做比较），则认为测量值与預测值互相矛盾。这很容易理解，因为如果测量值都落在一定数值范围之外，可以合理推论預测值是否正确。

標準差應用於[[投資]]上，可作為量度回報穩定性的指標。標準差數值越大，代表回~~報遠離過~~去平均數值，回報較不穩定故風險越高。相反，標準差數值越小，代表回~~報較為穩~~定，風險亦較小。

标準差应用于[[投资]]上，可作为量度回报稳定性的指标。标準差数值越大，代表回报远离过去平均数值，回报较不稳定故风险越高。相反，标準差数值越小，代表回报较为稳定，风险亦较小。

== 母體的標準差 ==

== 母体的标準差 ==

=== 基本定義 ===

=== 基本定义 ===

:<math>\ SD= \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2}</math>

<math>\mu</math>为平均值（<math>\overline{x}</math>）。

=== 简化计算公式 ===

上述公式可以如下代換而簡化：

上述公式可以如下代换而简化：

:<math>\begin{align}

第47行：

</math>

根號裡面，亦即[[~~變異數~~]]（<math>\sigma^2</math>）的簡易口訣~~為：「~~平方和的平均」減去「平均的平方」。

根号裡面，亦即[[变异数]]（<math>\sigma^2</math>）的简易口訣为：“平方和的平均”減去“平均的平方”。

=== 母體為随机变量 ===

=== 母体为随机变量 ===

一[[~~隨機變~~量]]<math>X</math>的標準差定義為：

一[[随机变量]]<math>X</math>的标準差定义为：

:<math>\sigma = \sqrt{\operatorname{E}((X-\operatorname{E}(X))^2)} = \sqrt{\operatorname{E}(X^2) - (\operatorname{E}(X))^2}</math>

須注意並非所有~~隨機變~~量都具有標準差，因為有些~~隨機變~~量不存在[[期望值]]。

须注意并非所有随机变量都具有标準差，因为有些随机变量不存在[[期望值]]。

如果~~隨機變~~量<math>X</math>為<math>x_1, \cdots, x_n</math>具有相同機率，則可用上述公式計算標準差。

如果随机变量<math>X</math>为<math>x_1, \cdots, x_n</math>具有相同机率，则可用上述公式计算标準差。

==== 離散随机变量的标准差 ====

==== 离散随机变量的标准差 ====

若<math>X</math>是由[[實數]]<math>x_{1}, x_{2}, ..., x_{n}</math>構成的[[随机变量|離散~~隨機變數~~]]（{{Lang-en|discrete random variable}}），且每個值的'''機率相等'''，則<math>X</math>的標準差定義為：

若<math>X</math>是由[[实数]]<math>x_{1}, x_{2}, ..., x_{n}</math>构成的[[随机变量|离散随机变数]]（{{Lang-en|discrete random variable}}），且每个值的'''机率相等'''，则<math>X</math>的标準差定义为：

:<math>\sigma = \sqrt{\frac{1}{N}\left[(x_1-\mu)^2 + (x_2-\mu)^2 + \cdots + (x_N - \mu)^2\right]}</math>　，其中　<math> \mu = \frac{1}{N} (x_1 + \cdots + x_N)</math>

換成用<math>\sum</math>來寫，就成為：

换成用<math>\sum</math>来写，就成为：

:<math>\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2}</math>　，其中　<math> \mu = \frac{1}{N} (x_1 + \cdots + x_N)</math>

目前為止，與母體標準差的基本公式一致。

目前为止，与母体标準差的基本公式一致。

然而若每個<math>x_i</math>可以有'''不同機率'''<math>p_i</math>，則<math>X</math>的标准差定義為：

然而若每个<math>x_i</math>可以有'''不同机率'''<math>p_i</math>，则<math>X</math>的标准差定义为：

:<math>\sigma = \sqrt{\sum_{i=1}^N p_i(x_i - \mu)^2}</math>　，其中　<math>\mu = \sum_{i=1}^N p_i x_i.</math>

第74行：

==== 连续随机变量的标准差 ====

若<math>X</math>為概率密度<math>p(X)</math>的[[随机变量|连续随机变量]]（{{Lang-en|continuous random variable}}），則<math>X</math>的标准差定義為：

若<math>X</math>为概率密度<math>p(X)</math>的[[随机变量|连续随机变量]]（{{Lang-en|continuous random variable}}），则<math>X</math>的标准差定义为：

:<math>\sigma = \sqrt{\int (x-\mu)^2 \, f(x) \, dx}</math>

第88行：

::其中：

::* <math>\mbox{cov}(X,Y)</math>表示随机变量<math>X</math>和<math>Y</math>的[[协方差]]。

::* <math> \sigma^2(X) </math>表示<math> [ \sigma(X) ]^2 </math>，即<math>Var(X)</math>（<math> X </math>的~~變異數~~），對<math> Y </math>亦同。

::* <math> \sigma^2(X) </math>表示<math> [ \sigma(X) ]^2 </math>，即<math>Var(X)</math>（<math> X </math>的变异数），对<math> Y </math>亦同。

== 样本的标准差 ==

在真实世界中，找到一个总体的真实的标准差並不實際。大多数情况下，总体标准差是通过随机抽取一定量的样本并计算样本标准差估计的。

在真实世界中，找到一个总体的真实的标准差并不实际。大多数情况下，总体标准差是通过随机抽取一定量的样本并计算样本标准差估计的。

從一大組數值<math>X_1, \cdots, X_N</math>當中取出一樣本數值組合<math>x_1, \cdots, x_n : n < N</math>，常定義其'''樣本標準差'''：

从一大组数值<math>X_1, \cdots, X_N</math>当中取出一样本数值组合<math>x_1, \cdots, x_n : n < N</math>，常定义其'''样本标準差'''：

:<math>

第101行：

样本方差<math>s^2</math>是对总体[[方差]]<math>\sigma^2</math>的[[无偏估计]]。之所以<math>s</math>中的分母要用<math>n-1</math>而不是像总体样本差那样用<math>n</math>，是因为<math>\left( x_i - \bar{x} \right)</math>的[[自由度 (统计学)|自由度]]为<math>n - 1</math>，这是由于存在约束条件<math>\sum_{i=1}^{n}\left(x_i - \bar{x}\right) = 0</math>。

== 範例 ==

== 范例 ==

這裡示範如何計算一組數的標準差。例如一群孩童年齡的數值為{ 5, 6, 8, 9 }：

这裡示范如何计算一组数的标準差。例如一群孩童年齡的数值为{ 5, 6, 8, 9 }：

* 第一步，計算平均值<math>\overline{x}</math>︰

* 第一步，计算平均值<math>\overline{x}</math>︰

:<math>\overline{x}=\frac{1}{N}\sum_{i=1}^N x_i</math>

:當<math>\begin{smallmatrix}N = 4\end{smallmatrix}</math>（因為集合裏有4個數），分~~別設為~~：

:当<math>\begin{smallmatrix}N = 4\end{smallmatrix}</math>（因为集合裏有4个数），分别设为：

::<math>

第118行：

\end{align}

</math>

則平均值為

则平均值为

:<math>\begin{align}\overline{x}&=\frac{1}{4}\sum_{i=1}^4 x_i & (N = 4) \\

&=\frac{1}{4} \left ( x_1 + x_2 + x_3 +x_4 \right ) \\

第125行：

</math>

* 第二步，計算標準差<math>\sigma\,</math>︰

* 第二步，计算标準差<math>\sigma\,</math>︰

:<math>\begin{align}\sigma &= \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2} \\

第137行：

&\approx 1.58114\, .\end{align}</math>

== 常態分佈的規則 ==

== 常态分布的规则 ==

[[File:Standard deviation diagram.svg|缩略图|350px|深藍區域是距[[平均值]]小於一個標準差之內的數值範圍，在[[常態分佈]]中，此範圍所佔比率為全部數值之'''68%'''；~~兩個標~~準差之內（深藍，藍）的比率合起來為'''95%'''；三個標準差之內（深藍，藍，淺藍）的比率合起來為'''99.7%'''。]]

[[File:Standard deviation diagram.svg|缩略图|350px|深蓝区域是距[[平均值]]小于一个标準差之内的数值范围，在[[常态分布]]中，此范围所佔比率为全部数值之'''68%'''；两个标準差之内（深蓝，蓝）的比率合起来为'''95%'''；三个标準差之内（深蓝，蓝，浅蓝）的比率合起来为'''99.7%'''。]]

在~~實際應~~用上，常考慮一~~組數據~~具有近似於[[常態分佈]]的機率分佈。若其假設正確，則約'''68%'''數值分佈在距離平均值有'''1個標準差'''之內的範圍，約'''95%'''數值分佈在距離平均值有'''2個標準差'''之內的範圍，以及約'''99.7%'''數值分佈在距離平均值有'''3個標準差'''之內的範圍。~~稱為「~~'''[[68–95–99.7原則|68-95-99.7法則]]'''」。

在实际应用上，常考慮一组数据具有近似于[[常态分布]]的机率分布。若其假设正确，则约'''68%'''数值分布在距离平均值有'''1个标準差'''之内的范围，约'''95%'''数值分布在距离平均值有'''2个标準差'''之内的范围，以及约'''99.7%'''数值分布在距离平均值有'''3个标準差'''之内的范围。称为“'''[[68–95–99.7原则|68-95-99.7法则]]'''”。

:<math>f(x;\mu,\sigma^2) = \frac{1}{\sigma\sqrt{2\pi}} e^{ -\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2 }

第155行：

{| class="wikitable" style="font-size: "

|-

! rowspan=2 | 數字比率<br/>標準差值

! rowspan=2 | 数字比率<br/>标準差值

! 機率

! 机率

! colspan=2 | 包含之外比例

|-

第236行：

| {{gaps|99.999|320|465|3751%}}

| {{gaps|0.000|679|534|6249%}}

| 1 / {{val|147159.5358}}<br>3.4 / {{val|1000000}} (''每一邊'')

| 1 / {{val|147159.5358}}<br>3.4 / {{val|1000000}} (''每一边'')

|-

| {{val|4.891638}}''σ''

第258行：

| 1 / {{val|100000000}}

|-

| [[六標準差#西格玛等级|{{val|6}}''σ'']]

| [[六标準差#西格玛等级|{{val|6}}''σ'']]

| {{val|99.9999998027}}%

| {{val|0.0000001973}}%

第284行：

|}

== 標準差與平均值之間的關係 ==

== 标準差与平均值之间的关系 ==

一~~組數據~~的[[平均值]]及標準差常常同時作為參考的依據。从某种意义上说，如果用平均值來考量數值的中心的话，則標準差也就是对[[机率分布|统计的分散度]]的一个“自然”的测度。因为由平均值所得的标准差要小于到其他任何一个点的标准差。較確切的敘述為：設<math>X_1, \cdots, X_N</math>為[[實數]]，定義[[函数]]：

一组数据的[[平均值]]及标準差常常同时作为参考的依据。从某种意义上说，如果用平均值来考量数值的中心的话，则标準差也就是对[[机率分布|统计的分散度]]的一个“自然”的测度。因为由平均值所得的标准差要小于到其他任何一个点的标准差。较确切的叙述为：设<math>X_1, \cdots, X_N</math>为[[实数]]，定义[[函数]]：

:<math>\sigma(\mu) = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2}</math>

使用[[微積分]]或者通过[[配方法]]，不難算出<math>\sigma(\mu)</math>在下面情況下具有唯一最小值：

使用[[微积分]]或者通过[[配方法]]，不难算出<math>\sigma(\mu)</math>在下面情況下具有唯一最小值：

:<math>\mu = \overline{x}</math>

第312行：

[[Category:概率与统计]]

[[Category:技術分析]]

[[Category:技术分析]]

@@ 第1行： / 第1行： @@
 {{noteTA
 |G1=Math
-|1=zh-cn:協方差;zh-tw:共變異數;zh-hk:協方差;
+|1=zh-cn:协方差;zh-tw:共变异数;zh-hk:协方差;
-|2=zh-cn:总体;zh-tw:母體;zh:母體;
+|2=zh-cn:总体;zh-tw:母体;zh:母体;
 }}
-{{Redirect4|-{均方差}-|均方誤差（MSE）|均方誤差|均方根誤差（RMSE）|均方根誤差}}
+{{Redirect4|-{均方差}-|均方误差（MSE）|均方误差|均方根误差（RMSE）|均方根误差}}
-{{Not|標準誤差}}
+{{Not|标準误差}}
-'''標準差'''（又稱'''標準偏-{}-差'''、'''-{均方差}- '''，{{Lang-en|'''S'''tandard '''D'''eviation}}，縮寫{{lang|en|'''SD'''}}），數學符號{{lang|el|'''[[σ]]'''}}（sigma），在[[概率]][[統計]]中最常使用作為[[測量]]一組數值的[[離散程度]]之用。標準差定義：為[[方差]]開[[算术平方根]]，反映组内個體間的離散程度；標準差與[[期望值]]之比為[[標準離差率]]。測量到分佈程度的結果，原則上具有兩種性質：
+'''标準差'''（又称'''标準偏-{}-差'''、'''-{均方差}- '''，{{Lang-en|'''S'''tandard '''D'''eviation}}，缩写{{lang|en|'''SD'''}}），数学符号{{lang|el|'''[[σ]]'''}}（sigma），在[[概率]][[统计]]中最常使用作为[[测量]]一组数值的[[离散程度]]之用。标準差定义：为[[方差]]开[[算术平方根]]，反映组内个体间的离散程度；标準差与[[期望值]]之比为[[标準离差率]]。测量到分布程度的结果，原则上具有两种性质：
-# 為非負數值（因為開平方後再做平方根）；
+# 为非负数值（因为开平方后再做平方根）；
-# 與測量資料具有相同單位（這樣才能比對）。
+# 与测量资料具有相同单位（这样才能比对）。
-一個總量的標準差或一個[[隨機變量]]的標準差，及一個[[子集合]]樣品數的標準差之間，有所差別。其公式如下所列。
+一个总量的标準差或一个[[随机变量]]的标準差，及一个[[子集合]]样品数的标準差之间，有所差别。其公式如下所列。
-標準差的概念由[[卡爾·皮爾森]]引入到統計中。
+标準差的概念由[[卡尔·皮尔森]]引入到统计中。
-== 闡述及應用 ==
+== 闡述及应用 ==
-簡單來說，標準差是一組數值自[[平均值]]分散開來的程度的一種測量觀念。一個較大的標準差，代表大部分的數值和其平均值之間差異較大；一個較小的標準差，代表這些數值較接近平均值。
+简单来说，标準差是一组数值自[[平均值]]分散开来的程度的一种测量观念。一个较大的标準差，代表大部分的数值和其平均值之间差异较大；一个较小的标準差，代表这些数值较接近平均值。
-例如，兩組數的[[集合 (数学)|集合]]{0, 5, 9, 14}和{5, 6, 8, 9}其平均值都是7，但第二個集合具有較小的標準差。
+例如，两组数的[[集合 (数学)|集合]]{0, 5, 9, 14}和{5, 6, 8, 9}其平均值都是7，但第二个集合具有较小的标準差。
-表述“相差k个标准差”，即在 {{lang|el|'''X̄ ± kS'''}} 的[[樣本 (統計學)|样本]]（Sample）范围内考量。
+表述“相差k个标准差”，即在 {{lang|el|'''X̄ ± kS'''}} 的[[样本 (统计学)|样本]]（Sample）范围内考量。
-標準差可以當作不確定性的一種測量。例如在[[物理]][[科學]]中，做重複性測量時，測量數值集合的標準差代表這些測量的[[精確度]]。當要決定測量值是否符合預測值，測量值的標準差佔有決定性重要角色：如果測量平均值與預測值相差太遠（同時與標準差數值做比較），則認為測量值與預測值互相矛盾。這很容易理解，因為如果測量值都落在一定數值範圍之外，可以合理推論預測值是否正確。
+标準差可以当作不确定性的一种测量。例如在[[物理]][[科学]]中，做重复性测量时，测量数值集合的标準差代表这些测量的[[精确度]]。当要決定测量值是否符合預测值，测量值的标準差佔有決定性重要角色：如果测量平均值与預测值相差太远（同时与标準差数值做比较），则认为测量值与預测值互相矛盾。这很容易理解，因为如果测量值都落在一定数值范围之外，可以合理推论預测值是否正确。
-標準差應用於[[投資]]上，可作為量度回報穩定性的指標。標準差數值越大，代表回報遠離過去平均數值，回報較不穩定故風險越高。相反，標準差數值越小，代表回報較為穩定，風險亦較小。
+标準差应用于[[投资]]上，可作为量度回报稳定性的指标。标準差数值越大，代表回报远离过去平均数值，回报较不稳定故风险越高。相反，标準差数值越小，代表回报较为稳定，风险亦较小。
-== 母體的標準差 ==
+== 母体的标準差 ==
-=== 基本定義 ===
+=== 基本定义 ===
 :<math>\ SD= \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2}</math>
 <math>\mu</math>为平均值（<math>\overline{x}</math>）。
 === 简化计算公式 ===
-上述公式可以如下代換而簡化：
+上述公式可以如下代换而简化：
 :<math>\begin{align}
@@ 第47行： / 第47行： @@
 </math>
-根號裡面，亦即[[變異數]]（<math>\sigma^2</math>）的簡易口訣為：「平方和的平均」減去「平均的平方」。
+根号裡面，亦即[[变异数]]（<math>\sigma^2</math>）的简易口訣为：“平方和的平均”減去“平均的平方”。
-=== 母體為随机变量 ===
+=== 母体为随机变量 ===
-一[[隨機變量]]<math>X</math>的標準差定義為：
+一[[随机变量]]<math>X</math>的标準差定义为：
 :<math>\sigma = \sqrt{\operatorname{E}((X-\operatorname{E}(X))^2)} = \sqrt{\operatorname{E}(X^2) - (\operatorname{E}(X))^2}</math>
-須注意並非所有隨機變量都具有標準差，因為有些隨機變量不存在[[期望值]]。
+须注意并非所有随机变量都具有标準差，因为有些随机变量不存在[[期望值]]。
-如果隨機變量<math>X</math>為<math>x_1, \cdots, x_n</math>具有相同機率，則可用上述公式計算標準差。
+如果随机变量<math>X</math>为<math>x_1, \cdots, x_n</math>具有相同机率，则可用上述公式计算标準差。
-==== 離散随机变量的标准差 ====
+==== 离散随机变量的标准差 ====
-若<math>X</math>是由[[實數]]<math>x_{1}, x_{2}, ..., x_{n}</math>構成的[[随机变量|離散隨機變數]]（{{Lang-en|discrete random variable}}），且每個值的'''機率相等'''，則<math>X</math>的標準差定義為：
+若<math>X</math>是由[[实数]]<math>x_{1}, x_{2}, ..., x_{n}</math>构成的[[随机变量|离散随机变数]]（{{Lang-en|discrete random variable}}），且每个值的'''机率相等'''，则<math>X</math>的标準差定义为：
 :<math>\sigma = \sqrt{\frac{1}{N}\left[(x_1-\mu)^2 + (x_2-\mu)^2 + \cdots + (x_N - \mu)^2\right]}</math>　，其中　<math> \mu = \frac{1}{N} (x_1 + \cdots + x_N)</math>
-換成用<math>\sum</math>來寫，就成為：
+换成用<math>\sum</math>来写，就成为：
 :<math>\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2}</math>　，其中　<math> \mu = \frac{1}{N} (x_1 + \cdots + x_N)</math>
-目前為止，與母體標準差的基本公式一致。
+目前为止，与母体标準差的基本公式一致。
-然而若每個<math>x_i</math>可以有'''不同機率'''<math>p_i</math>，則<math>X</math>的标准差定義為：
+然而若每个<math>x_i</math>可以有'''不同机率'''<math>p_i</math>，则<math>X</math>的标准差定义为：
 :<math>\sigma = \sqrt{\sum_{i=1}^N p_i(x_i - \mu)^2}</math>　，其中　<math>\mu = \sum_{i=1}^N p_i x_i.</math>
@@ 第74行： / 第74行： @@
 ==== 连续随机变量的标准差 ====
-若<math>X</math>為概率密度<math>p(X)</math>的[[随机变量|连续随机变量]]（{{Lang-en|continuous random variable}}），則<math>X</math>的标准差定義為：
+若<math>X</math>为概率密度<math>p(X)</math>的[[随机变量|连续随机变量]]（{{Lang-en|continuous random variable}}），则<math>X</math>的标准差定义为：
 :<math>\sigma = \sqrt{\int (x-\mu)^2 \, f(x) \, dx}</math>
@@ 第88行： / 第88行： @@
 ::其中：
 ::* <math>\mbox{cov}(X,Y)</math>表示随机变量<math>X</math>和<math>Y</math>的[[协方差]]。
-::* <math> \sigma^2(X) </math>表示<math> [ \sigma(X) ]^2 </math>，即<math>Var(X)</math>（<math> X </math>的變異數），對<math> Y </math>亦同。
+::* <math> \sigma^2(X) </math>表示<math> [ \sigma(X) ]^2 </math>，即<math>Var(X)</math>（<math> X </math>的变异数），对<math> Y </math>亦同。
 == 样本的标准差 ==
-在真实世界中，找到一个总体的真实的标准差並不實際。大多数情况下，总体标准差是通过随机抽取一定量的样本并计算样本标准差估计的。
+在真实世界中，找到一个总体的真实的标准差并不实际。大多数情况下，总体标准差是通过随机抽取一定量的样本并计算样本标准差估计的。
-從一大組數值<math>X_1, \cdots, X_N</math>當中取出一樣本數值組合<math>x_1, \cdots, x_n : n < N</math>，常定義其'''樣本標準差'''：
+从一大组数值<math>X_1, \cdots, X_N</math>当中取出一样本数值组合<math>x_1, \cdots, x_n : n < N</math>，常定义其'''样本标準差'''：
 :<math>
@@ 第101行： / 第101行： @@
 样本方差<math>s^2</math>是对总体[[方差]]<math>\sigma^2</math>的[[无偏估计]]。之所以<math>s</math>中的分母要用<math>n-1</math>而不是像总体样本差那样用<math>n</math>，是因为<math>\left( x_i - \bar{x} \right)</math>的[[自由度 (统计学)|自由度]]为<math>n - 1</math>，这是由于存在约束条件<math>\sum_{i=1}^{n}\left(x_i - \bar{x}\right) = 0</math>。
-== 範例 ==
+== 范例 ==
-這裡示範如何計算一組數的標準差。例如一群孩童年齡的數值為{ 5, 6, 8, 9 }：
+这裡示范如何计算一组数的标準差。例如一群孩童年齡的数值为{ 5, 6, 8, 9 }：
-* 第一步，計算平均值<math>\overline{x}</math>︰
+* 第一步，计算平均值<math>\overline{x}</math>︰
 :<math>\overline{x}=\frac{1}{N}\sum_{i=1}^N x_i</math>
-:當<math>\begin{smallmatrix}N = 4\end{smallmatrix}</math>（因為集合裏有4個數），分別設為：
+:当<math>\begin{smallmatrix}N = 4\end{smallmatrix}</math>（因为集合裏有4个数），分别设为：
 ::<math>
@@ 第118行： / 第118行： @@
 \end{align}
 </math>
-則平均值為
+则平均值为
 :<math>\begin{align}\overline{x}&=\frac{1}{4}\sum_{i=1}^4 x_i & (N = 4) \\
 &=\frac{1}{4} \left ( x_1 + x_2 + x_3 +x_4 \right ) \\
@@ 第125行： / 第125行： @@
 </math>
-* 第二步，計算標準差<math>\sigma\,</math>︰
+* 第二步，计算标準差<math>\sigma\,</math>︰
 :<math>\begin{align}\sigma &= \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2} \\
@@ 第137行： / 第137行： @@
 &\approx 1.58114\, .\end{align}</math>
-== 常態分佈的規則 ==
+== 常态分布的规则 ==
-{{main|常態分佈}}
+{{main|常态分布}}
-[[File:Standard deviation diagram.svg|缩略图|350px|深藍區域是距[[平均值]]小於一個標準差之內的數值範圍，在[[常態分佈]]中，此範圍所佔比率為全部數值之'''68%'''；兩個標準差之內（深藍，藍）的比率合起來為'''95%'''；三個標準差之內（深藍，藍，淺藍）的比率合起來為'''99.7%'''。]]
+[[File:Standard deviation diagram.svg|缩略图|350px|深蓝区域是距[[平均值]]小于一个标準差之内的数值范围，在[[常态分布]]中，此范围所佔比率为全部数值之'''68%'''；两个标準差之内（深蓝，蓝）的比率合起来为'''95%'''；三个标準差之内（深蓝，蓝，浅蓝）的比率合起来为'''99.7%'''。]]
-在實際應用上，常考慮一組數據具有近似於[[常態分佈]]的機率分佈。若其假設正確，則約'''68%'''數值分佈在距離平均值有'''1個標準差'''之內的範圍，約'''95%'''數值分佈在距離平均值有'''2個標準差'''之內的範圍，以及約'''99.7%'''數值分佈在距離平均值有'''3個標準差'''之內的範圍。稱為「'''[[68–95–99.7原則|68-95-99.7法則]]'''」。
+在实际应用上，常考慮一组数据具有近似于[[常态分布]]的机率分布。若其假设正确，则约'''68%'''数值分布在距离平均值有'''1个标準差'''之内的范围，约'''95%'''数值分布在距离平均值有'''2个标準差'''之内的范围，以及约'''99.7%'''数值分布在距离平均值有'''3个标準差'''之内的范围。称为“'''[[68–95–99.7原则|68-95-99.7法则]]'''”。
 :<math>f(x;\mu,\sigma^2) = \frac{1}{\sigma\sqrt{2\pi}} e^{ -\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2 }
@@ 第155行： / 第155行： @@
 {| class="wikitable" style="font-size:&nbsp;"
 |-
-! rowspan=2 | 數字比率<br/>標準差值
+! rowspan=2 | 数字比率<br/>标準差值
-! 機率
+! 机率
 ! colspan=2 | 包含之外比例
 |-
@@ 第236行： / 第236行： @@
 | {{gaps|99.999|320|465|3751%}}
 | {{gaps|0.000|679|534|6249%}}
-| 1&nbsp;/&nbsp;{{val|147159.5358}}<br>3.4&nbsp;/&nbsp;{{val|1000000}} (''每一邊'')
+| 1&nbsp;/&nbsp;{{val|147159.5358}}<br>3.4&nbsp;/&nbsp;{{val|1000000}} (''每一边'')
 |-
 | {{val|4.891638}}''σ''
@@ 第258行： / 第258行： @@
 | 1&nbsp;/&nbsp;{{val|100000000}}
 |-
-| [[六標準差#西格玛等级|{{val|6}}''σ'']]
+| [[六标準差#西格玛等级|{{val|6}}''σ'']]
 | {{val|99.9999998027}}%
 | {{val|0.0000001973}}%
@@ 第284行： / 第284行： @@
 |}
-== 標準差與平均值之間的關係 ==
+== 标準差与平均值之间的关系 ==
-一組數據的[[平均值]]及標準差常常同時作為參考的依據。从某种意义上说，如果用平均值來考量數值的中心的话，則標準差也就是对[[机率分布|统计的分散度]]的一个“自然”的测度。因为由平均值所得的标准差要小于到其他任何一个点的标准差。較確切的敘述為：設<math>X_1, \cdots, X_N</math>為[[實數]]，定義[[函数]]：
+一组数据的[[平均值]]及标準差常常同时作为参考的依据。从某种意义上说，如果用平均值来考量数值的中心的话，则标準差也就是对[[机率分布|统计的分散度]]的一个“自然”的测度。因为由平均值所得的标准差要小于到其他任何一个点的标准差。较确切的叙述为：设<math>X_1, \cdots, X_N</math>为[[实数]]，定义[[函数]]：
 :<math>\sigma(\mu) = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2}</math>
-使用[[微積分]]或者通过[[配方法]]，不難算出<math>\sigma(\mu)</math>在下面情況下具有唯一最小值：
+使用[[微积分]]或者通过[[配方法]]，不难算出<math>\sigma(\mu)</math>在下面情況下具有唯一最小值：
 :<math>\mu = \overline{x}</math>
@@ 第312行： / 第312行： @@
 [[Category:概率与统计]]
-[[Category:技術分析]]
+[[Category:技术分析]]