logo
导航

中心极限定理

中心极限定理的概述

中心极限定理的直观理解

理解:中心极限定理描述了当独立随机变量的个数趋于无穷时,它们的和的分布趋于正态分布。这是概率论中最重要的定理之一,它解释了为什么正态分布在统计学中如此重要。

中心极限定理的重要性

重要性

  1. 为统计学提供了理论基础
  2. 解释了正态分布的普遍性
  3. 为参数估计和假设检验提供了理论支撑

棣莫弗-拉普拉斯定理

棣莫弗-拉普拉斯定理的表述

定理:设 XnB(n,p)X_n \sim B(n,p),则当 nn 很大,pp 不很接近 0011 时,有: Xnnpnp(1p)dN(0,1)\frac{X_n - np}{\sqrt{np(1-p)}} \xrightarrow{d} N(0,1)

棣莫弗-拉普拉斯定理的证明

证明

  1. Xn=i=1nYiX_n = \sum_{i=1}^n Y_i,其中 YiB(1,p)Y_i \sim B(1,p)
  2. E(Yi)=pE(Y_i) = pD(Yi)=p(1p)D(Y_i) = p(1-p)
  3. 由列维-林德伯格定理,Xnnpnp(1p)dN(0,1)\frac{X_n - np}{\sqrt{np(1-p)}} \xrightarrow{d} N(0,1)

棣莫弗-拉普拉斯定理的意义

意义:二项分布可以用正态分布来近似,即: B(n,p)N(np,np(1p))B(n,p) \approx N(np, np(1-p))

棣莫弗-拉普拉斯定理的应用

应用 1:二项概率的近似计算 当 nn 很大时,可以用正态分布来近似计算二项概率。

应用 2:置信区间的构造 用于构造二项分布参数的置信区间。

应用 3:假设检验 用于二项分布的假设检验。

列维-林德伯格定理

列维-林德伯格定理的表述

定理:设 X1,X2,,Xn,X_1, X_2, \dots, X_n, \dots 是独立同分布的随机变量序列,E(Xi)=μE(X_i) = \muD(Xi)=σ2D(X_i) = \sigma^2,则: i=1nXinμσndN(0,1)\frac{\sum_{i=1}^n X_i - n\mu}{\sigma\sqrt{n}} \xrightarrow{d} N(0,1)

列维-林德伯格定理的证明

证明

  1. Sn=i=1nXiS_n = \sum_{i=1}^n X_i
  2. E(Sn)=nμE(S_n) = n\muD(Sn)=nσ2D(S_n) = n\sigma^2
  3. 标准化:Snnμσn\frac{S_n - n\mu}{\sigma\sqrt{n}}
  4. 利用特征函数或矩母函数证明极限分布为正态分布

列维-林德伯格定理的意义

意义:独立同分布随机变量的和,在标准化后趋于标准正态分布。

列维-林德伯格定理的应用

应用 1:样本均值的分布 样本均值的标准化形式趋于正态分布。

应用 2:和的近似计算 当项数很多时,可以用正态分布来近似计算和的概率。

应用 3:统计推断 为统计推断提供了理论基础。

样本均值的中心极限定理

样本均值中心极限定理的表述

定理:设 X1,X2,,XnX_1, X_2, \dots, X_n 是独立同分布的随机变量,E(Xi)=μE(X_i) = \muD(Xi)=σ2D(X_i) = \sigma^2,则: Xnμσ/ndN(0,1)\frac{\overline{X}_n - \mu}{\sigma/\sqrt{n}} \xrightarrow{d} N(0,1)

样本均值中心极限定理的证明

证明

  1. Xn=1ni=1nXi\overline{X}_n = \frac{1}{n}\sum_{i=1}^n X_i
  2. E(Xn)=μE(\overline{X}_n) = \muD(Xn)=σ2nD(\overline{X}_n) = \frac{\sigma^2}{n}
  3. 标准化:Xnμσ/n\frac{\overline{X}_n - \mu}{\sigma/\sqrt{n}}
  4. 由列维-林德伯格定理,趋于 N(0,1)N(0,1)

样本均值中心极限定理的意义

意义:样本均值的标准化形式趋于标准正态分布,即: XndN(μ,σ2n)\overline{X}_n \xrightarrow{d} N(\mu, \frac{\sigma^2}{n})

样本均值中心极限定理的应用

应用 1:置信区间 用于构造总体均值的置信区间。

应用 2:假设检验 用于总体均值的假设检验。

应用 3:样本量确定 用于确定所需的样本量。

中心极限定理的推广

独立不同分布的中心极限定理

定理:设 X1,X2,,XnX_1, X_2, \dots, X_n 是独立的随机变量,E(Xi)=μiE(X_i) = \mu_iD(Xi)=σi2D(X_i) = \sigma_i^2,如果满足林德伯格条件,则: i=1nXii=1nμii=1nσi2dN(0,1)\frac{\sum_{i=1}^n X_i - \sum_{i=1}^n \mu_i}{\sqrt{\sum_{i=1}^n \sigma_i^2}} \xrightarrow{d} N(0,1)

多维中心极限定理

定理:设 X1,X2,,XnX_1, X_2, \dots, X_n 是独立同分布的 kk 维随机向量,E(Xi)=μE(X_i) = \mu,协方差矩阵为 Σ\Sigma,则: i=1nXinμndN(0,Σ)\frac{\sum_{i=1}^n X_i - n\mu}{\sqrt{n}} \xrightarrow{d} N(0, \Sigma)

中心极限定理的应用

在统计学中的应用

应用 1:参数估计 中心极限定理为参数估计提供了理论基础。

应用 2:假设检验 中心极限定理为假设检验提供了理论支撑。

应用 3:置信区间 中心极限定理为置信区间的构造提供了理论指导。

在金融学中的应用

应用 4:风险评估 中心极限定理用于风险评估和投资组合分析。

应用 5:期权定价 中心极限定理用于期权定价模型。

在工程学中的应用

应用 6:质量控制 中心极限定理用于质量控制中的抽样检验。

应用 7:可靠性分析 中心极限定理用于系统可靠性分析。

中心极限定理的局限性

收敛速度

局限性 1:中心极限定理只说明了收敛性,但没有说明收敛的速度。

分布要求

局限性 2:中心极限定理对随机变量的分布有一定的要求。

实际应用

局限性 3:在实际应用中,样本量总是有限的。

中心极限定理与大数定律的关系

联系

联系 1:中心极限定理是大数定律的深化和发展。

联系 2:大数定律说明了收敛性,中心极限定理说明了分布的形状。

联系 3:中心极限定理提供了更精确的信息。

区别

区别 1:大数定律关注收敛性,中心极限定理关注分布形状。

区别 2:大数定律适用于任意分布,中心极限定理对分布有要求。

区别 3:中心极限定理提供了更精确的近似。

练习题

练习 1

二项分布 B(n,p)B(n,p)nn 很大,pp 不很接近 0 或 1,写出其近似正态分布。

参考答案

解题思路: 使用棣莫弗-拉普拉斯定理。

详细步骤

  1. 二项分布 B(n,p)B(n,p) 的期望:E(X)=npE(X) = np
  2. 二项分布 B(n,p)B(n,p) 的方差:D(X)=np(1p)D(X) = np(1-p)
  3. 由棣莫弗-拉普拉斯定理,B(n,p)N(np,np(1p))B(n,p) \approx N(np, np(1-p))

答案B(n,p)N(np,np(1p))B(n,p) \approx N(np, np(1-p))

练习 2

X1,X2,,XnX_1, X_2, \dots, X_n 是独立同分布的随机变量,E(Xi)=μE(X_i) = \muD(Xi)=σ2D(X_i) = \sigma^2,求 Xn\overline{X}_n 的渐近分布。

参考答案

解题思路: 使用样本均值的中心极限定理。

详细步骤

  1. 样本均值:Xn=1ni=1nXi\overline{X}_n = \frac{1}{n}\sum_{i=1}^n X_i
  2. 由中心极限定理,XndN(μ,σ2n)\overline{X}_n \xrightarrow{d} N(\mu, \frac{\sigma^2}{n})
  3. Xn\overline{X}_n 的渐近分布为 N(μ,σ2n)N(\mu, \frac{\sigma^2}{n})

答案N(μ,σ2n)N(\mu, \frac{\sigma^2}{n})

练习 3

XB(100,0.3)X \sim B(100, 0.3),用正态分布近似计算 P(25X35)P(25 \leq X \leq 35)

参考答案

解题思路: 使用棣莫弗-拉普拉斯定理进行近似。

详细步骤

  1. E(X)=100×0.3=30E(X) = 100 \times 0.3 = 30
  2. D(X)=100×0.3×0.7=21D(X) = 100 \times 0.3 \times 0.7 = 21
  3. σ=214.58\sigma = \sqrt{21} \approx 4.58
  4. P(25X35)P(25304.58Z35304.58)P(25 \leq X \leq 35) \approx P(\frac{25-30}{4.58} \leq Z \leq \frac{35-30}{4.58})
  5. =P(1.09Z1.09)=2Φ(1.09)10.724= P(-1.09 \leq Z \leq 1.09) = 2\Phi(1.09) - 1 \approx 0.724

答案:约 0.7240.724

练习 4

X1,X2,,XnX_1, X_2, \dots, X_n 是独立同分布的随机变量,E(Xi)=μE(X_i) = \muD(Xi)=σ2D(X_i) = \sigma^2,证明: i=1nXinμσndN(0,1)\frac{\sum_{i=1}^n X_i - n\mu}{\sigma\sqrt{n}} \xrightarrow{d} N(0,1)

参考答案

解题思路: 使用列维-林德伯格定理。

详细步骤

  1. Sn=i=1nXiS_n = \sum_{i=1}^n X_i
  2. E(Sn)=nμE(S_n) = n\muD(Sn)=nσ2D(S_n) = n\sigma^2
  3. 标准化:Snnμσn\frac{S_n - n\mu}{\sigma\sqrt{n}}
  4. 由列维-林德伯格定理,趋于 N(0,1)N(0,1)

答案:证明完成

练习 5

说明大数定律和中心极限定理的区别。

参考答案

解题思路: 比较大数定律和中心极限定理的不同点。

详细步骤

  1. 大数定律:关注样本均值收敛于期望,只说明收敛性
  2. 中心极限定理:关注样本均值的分布趋于正态分布,说明了分布的形状
  3. 大数定律:是中心极限定理的基础
  4. 中心极限定理:比大数定律提供了更精确的信息

答案:大数定律关注样本均值收敛于期望,中心极限定理关注和的分布趋于正态