logo
导航

方差与标准差

方差的定义

方差的数学定义

定义:设 XX 是随机变量,E(X)=μE(X) = \mu,如果 E[(Xμ)2]E[(X - \mu)^2] 存在,则称: D(X)=E[(Xμ)2]=E[(XE(X))2]D(X) = E[(X - \mu)^2] = E[(X - E(X))^2]

XX方差,记为 D(X)D(X)Var(X)Var(X)

方差的计算公式

离散型随机变量D(X)=i=1(xiμ)2piD(X) = \sum_{i=1}^{\infty} (x_i - \mu)^2 p_i

连续型随机变量D(X)=+(xμ)2f(x)dxD(X) = \int_{-\infty}^{+\infty} (x - \mu)^2 f(x) dx

方差的简化计算公式

公式D(X)=E(X2)[E(X)]2D(X) = E(X^2) - [E(X)]^2

证明D(X)=E[(Xμ)2]=E(X22μX+μ2)=E(X2)2μE(X)+μ2=E(X2)μ2=E(X2)[E(X)]2D(X) = E[(X - \mu)^2] = E(X^2 - 2\mu X + \mu^2) = E(X^2) - 2\mu E(X) + \mu^2 = E(X^2) - \mu^2 = E(X^2) - [E(X)]^2

方差的直观理解

理解:方差是随机变量取值与其期望的偏离程度的平方的平均值,它反映了随机变量取值的离散程度。

方差的例子

例 1:掷一颗均匀骰子,用 XX 表示出现的点数

  • E(X)=3.5E(X) = 3.5
  • E(X2)=i=16i216=1+4+9+16+25+366=916E(X^2) = \sum_{i=1}^6 i^2 \cdot \frac{1}{6} = \frac{1+4+9+16+25+36}{6} = \frac{91}{6}
  • D(X)=E(X2)[E(X)]2=916(72)2=916494=3512D(X) = E(X^2) - [E(X)]^2 = \frac{91}{6} - (\frac{7}{2})^2 = \frac{91}{6} - \frac{49}{4} = \frac{35}{12}

例 2:在区间 [0,1][0, 1] 上均匀分布的随机变量 XX

  • E(X)=12E(X) = \frac{1}{2}
  • E(X2)=01x21dx=x3301=13E(X^2) = \int_0^1 x^2 \cdot 1 dx = \frac{x^3}{3}\big|_0^1 = \frac{1}{3}
  • D(X)=E(X2)[E(X)]2=13(12)2=1314=112D(X) = E(X^2) - [E(X)]^2 = \frac{1}{3} - (\frac{1}{2})^2 = \frac{1}{3} - \frac{1}{4} = \frac{1}{12}

标准差的定义

标准差的数学定义

定义:随机变量 XX标准差定义为方差的算术平方根: σ=D(X)=E[(XE(X))2]\sigma = \sqrt{D(X)} = \sqrt{E[(X - E(X))^2]}

标准差的直观理解

理解:标准差与随机变量具有相同的量纲,它直接反映了随机变量取值的离散程度。

标准差的例子

例 3:继续例 1,掷骰子的标准差

  • σ=D(X)=35121.71\sigma = \sqrt{D(X)} = \sqrt{\frac{35}{12}} \approx 1.71

例 4:继续例 2,均匀分布的标准差

  • σ=D(X)=1120.289\sigma = \sqrt{D(X)} = \sqrt{\frac{1}{12}} \approx 0.289

方差的性质

非负性

性质 1D(X)0D(X) \geq 0

证明D(X)=E[(Xμ)2]0D(X) = E[(X - \mu)^2] \geq 0,因为平方项非负。

常数的方差

性质 2D(c)=0D(c) = 0,其中 cc 是常数。

证明D(c)=E[(cc)2]=E(0)=0D(c) = E[(c - c)^2] = E(0) = 0

线性变换的方差

性质 3D(aX+b)=a2D(X)D(aX + b) = a^2 D(X),其中 a,ba, b 是常数。

证明D(aX+b)=E[(aX+bE(aX+b))2]=E[(aX+baE(X)b)2]=E[(aXaE(X))2]=a2E[(XE(X))2]=a2D(X)D(aX + b) = E[(aX + b - E(aX + b))^2] = E[(aX + b - aE(X) - b)^2] = E[(aX - aE(X))^2] = a^2 E[(X - E(X))^2] = a^2 D(X)

独立随机变量的方差

性质 4:如果 XXYY 独立,则 D(X+Y)=D(X)+D(Y)D(X + Y) = D(X) + D(Y)

证明D(X+Y)=E[(X+YE(X+Y))2]=E[(XE(X)+YE(Y))2]D(X + Y) = E[(X + Y - E(X + Y))^2] = E[(X - E(X) + Y - E(Y))^2] =E[(XE(X))2]+E[(YE(Y))2]+2E[(XE(X))(YE(Y))]= E[(X - E(X))^2] + E[(Y - E(Y))^2] + 2E[(X - E(X))(Y - E(Y))] 由于 XXYY 独立,E[(XE(X))(YE(Y))]=E(XE(X))E(YE(Y))=0E[(X - E(X))(Y - E(Y))] = E(X - E(X))E(Y - E(Y)) = 0,所以: D(X+Y)=D(X)+D(Y)D(X + Y) = D(X) + D(Y)

方差的可加性

性质 5:如果 X1,X2,,XnX_1, X_2, \dots, X_n 两两独立,则: D(X1+X2++Xn)=D(X1)+D(X2)++D(Xn)D(X_1 + X_2 + \dots + X_n) = D(X_1) + D(X_2) + \dots + D(X_n)

常见分布的方差

两点分布

分布律P(X=k)=pk(1p)1kP(X = k) = p^k(1-p)^{1-k}k=0,1k = 0, 1

方差D(X)=p(1p)D(X) = p(1-p)

证明

  • E(X)=pE(X) = p
  • E(X2)=02(1p)+12p=pE(X^2) = 0^2 \cdot (1-p) + 1^2 \cdot p = p
  • D(X)=E(X2)[E(X)]2=pp2=p(1p)D(X) = E(X^2) - [E(X)]^2 = p - p^2 = p(1-p)

二项分布

分布律P(X=k)=Cnkpk(1p)nkP(X = k) = C_n^k p^k(1-p)^{n-k}k=0,1,2,,nk = 0, 1, 2, \dots, n

方差D(X)=np(1p)D(X) = np(1-p)

证明

  • E(X)=npE(X) = np
  • E(X2)=k=0nk2Cnkpk(1p)nkE(X^2) = \sum_{k=0}^n k^2 C_n^k p^k(1-p)^{n-k}
  • 通过计算可得 E(X2)=np+n(n1)p2E(X^2) = np + n(n-1)p^2
  • D(X)=E(X2)[E(X)]2=np+n(n1)p2n2p2=np(1p)D(X) = E(X^2) - [E(X)]^2 = np + n(n-1)p^2 - n^2p^2 = np(1-p)

泊松分布

分布律P(X=k)=λkk!eλP(X = k) = \frac{\lambda^k}{k!} e^{-\lambda}k=0,1,2,k = 0, 1, 2, \dots

方差D(X)=λD(X) = \lambda

证明

  • E(X)=λE(X) = \lambda
  • E(X2)=k=0k2λkk!eλ=λ+λ2E(X^2) = \sum_{k=0}^{\infty} k^2 \frac{\lambda^k}{k!} e^{-\lambda} = \lambda + \lambda^2
  • D(X)=E(X2)[E(X)]2=λ+λ2λ2=λD(X) = E(X^2) - [E(X)]^2 = \lambda + \lambda^2 - \lambda^2 = \lambda

均匀分布

密度函数f(x)={1ba,axb0,其他f(x) = \begin{cases} \frac{1}{b-a}, & a \leq x \leq b \\ 0, & \text{其他} \end{cases}

方差D(X)=(ba)212D(X) = \frac{(b-a)^2}{12}

证明

  • E(X)=a+b2E(X) = \frac{a+b}{2}
  • E(X2)=abx21badx=b3a33(ba)=a2+ab+b23E(X^2) = \int_a^b x^2 \cdot \frac{1}{b-a} dx = \frac{b^3-a^3}{3(b-a)} = \frac{a^2+ab+b^2}{3}
  • D(X)=E(X2)[E(X)]2=a2+ab+b23(a+b2)2=(ba)212D(X) = E(X^2) - [E(X)]^2 = \frac{a^2+ab+b^2}{3} - (\frac{a+b}{2})^2 = \frac{(b-a)^2}{12}

指数分布

密度函数f(x)={λeλx,x00,x<0f(x) = \begin{cases} \lambda e^{-\lambda x}, & x \geq 0 \\ 0, & x < 0 \end{cases}

方差D(X)=1λ2D(X) = \frac{1}{\lambda^2}

证明

  • E(X)=1λE(X) = \frac{1}{\lambda}
  • E(X2)=0x2λeλxdx=2λ2E(X^2) = \int_0^{\infty} x^2 \cdot \lambda e^{-\lambda x} dx = \frac{2}{\lambda^2}
  • D(X)=E(X2)[E(X)]2=2λ2(1λ)2=1λ2D(X) = E(X^2) - [E(X)]^2 = \frac{2}{\lambda^2} - (\frac{1}{\lambda})^2 = \frac{1}{\lambda^2}

正态分布

密度函数f(x)=12πσe(xμ)22σ2f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}}

方差D(X)=σ2D(X) = \sigma^2

证明

  • E(X)=μE(X) = \mu
  • 通过积分计算可得 E(X2)=μ2+σ2E(X^2) = \mu^2 + \sigma^2
  • D(X)=E(X2)[E(X)]2=μ2+σ2μ2=σ2D(X) = E(X^2) - [E(X)]^2 = \mu^2 + \sigma^2 - \mu^2 = \sigma^2

切比雪夫不等式

切比雪夫不等式的表述

定理:设随机变量 XX 的期望为 μ\mu,方差为 σ2\sigma^2,则对任意正数 ε\varepsilon,有: P(Xμε)σ2ε2P(|X - \mu| \geq \varepsilon) \leq \frac{\sigma^2}{\varepsilon^2}

切比雪夫不等式的证明

证明P(Xμε)=xμεf(x)dxxμε(xμ)2ε2f(x)dx1ε2+(xμ)2f(x)dx=σ2ε2P(|X - \mu| \geq \varepsilon) = \int_{|x-\mu| \geq \varepsilon} f(x) dx \leq \int_{|x-\mu| \geq \varepsilon} \frac{(x-\mu)^2}{\varepsilon^2} f(x) dx \leq \frac{1}{\varepsilon^2} \int_{-\infty}^{+\infty} (x-\mu)^2 f(x) dx = \frac{\sigma^2}{\varepsilon^2}

切比雪夫不等式的应用

应用 1:估计随机变量偏离期望的概率 应用 2:证明大数定律 应用 3:在统计推断中的应用

方差的应用

在统计中的应用

应用 1:样本方差 样本方差是总体方差的无偏估计。

应用 2:参数估计 方差是衡量估计量好坏的重要指标。

在金融中的应用

应用 3:风险评估 方差是衡量投资风险的重要指标。

应用 4:投资组合理论 通过方差来优化投资组合。

练习题

练习 1

已知 E(X)=2,D(X)=3E(X)=2, D(X)=3,求 D(3X1)D(3X-1)

参考答案

解题思路: 使用方差的性质。

详细步骤

  1. D(3X1)=32D(X)D(3X-1) = 3^2 D(X)
  2. =9×3=27= 9 \times 3 = 27

答案2727

练习 2

已知随机变量 XX 服从参数为 λ\lambda 的指数分布,求 D(X)D(X)

参考答案

解题思路: 使用指数分布的方差公式。

详细步骤

  1. 指数分布的方差:D(X)=1λ2D(X) = \frac{1}{\lambda^2}
  2. 或者通过计算:
    • E(X)=1λE(X) = \frac{1}{\lambda}
    • E(X2)=0x2λeλxdx=2λ2E(X^2) = \int_0^{\infty} x^2 \cdot \lambda e^{-\lambda x} dx = \frac{2}{\lambda^2}
    • D(X)=E(X2)[E(X)]2=2λ2(1λ)2=1λ2D(X) = E(X^2) - [E(X)]^2 = \frac{2}{\lambda^2} - (\frac{1}{\lambda})^2 = \frac{1}{\lambda^2}

答案1λ2\frac{1}{\lambda^2}

练习 3

已知随机变量 XX 服从参数为 n,pn, p 的二项分布,求 D(X)D(X)

参考答案

解题思路: 使用二项分布的方差公式。

详细步骤

  1. 二项分布的方差:D(X)=np(1p)D(X) = np(1-p)
  2. 或者通过计算:
    • E(X)=npE(X) = np
    • E(X2)=np+n(n1)p2E(X^2) = np + n(n-1)p^2
    • D(X)=E(X2)[E(X)]2=np(1p)D(X) = E(X^2) - [E(X)]^2 = np(1-p)

答案np(1p)np(1-p)

练习 4

已知 XX 的分布律为 P(X=1)=0.2,P(X=2)=0.5,P(X=3)=0.3P(X=1)=0.2, P(X=2)=0.5, P(X=3)=0.3,求 D(X)D(X)

参考答案

解题思路: 使用方差的简化计算公式。

详细步骤

  1. E(X)=1×0.2+2×0.5+3×0.3=2.1E(X) = 1 \times 0.2 + 2 \times 0.5 + 3 \times 0.3 = 2.1
  2. E(X2)=12×0.2+22×0.5+32×0.3=0.2+2.0+2.7=4.9E(X^2) = 1^2 \times 0.2 + 2^2 \times 0.5 + 3^2 \times 0.3 = 0.2 + 2.0 + 2.7 = 4.9
  3. D(X)=E(X2)[E(X)]2=4.9(2.1)2=4.94.41=0.49D(X) = E(X^2) - [E(X)]^2 = 4.9 - (2.1)^2 = 4.9 - 4.41 = 0.49

答案0.490.49

练习 5

已知随机变量 XX 服从参数为 λ\lambda 的泊松分布,求 D(X)D(X)

参考答案

解题思路: 使用泊松分布的方差公式。

详细步骤

  1. 泊松分布的方差:D(X)=λD(X) = \lambda
  2. 或者通过计算:
    • E(X)=λE(X) = \lambda
    • E(X2)=λ+λ2E(X^2) = \lambda + \lambda^2
    • D(X)=E(X2)[E(X)]2=λ+λ2λ2=λD(X) = E(X^2) - [E(X)]^2 = \lambda + \lambda^2 - \lambda^2 = \lambda

答案λ\lambda