logo
导航

区间估计与置信区间

区间估计的基本概念

区间估计的定义

定义:设总体 XX 的分布函数为 F(x;θ)F(x;\theta),其中 θ\theta 是未知参数。从总体中抽取样本 X1,X2,,XnX_1, X_2, \dots, X_n,构造两个统计量 θ^1=θ^1(X1,X2,,Xn)\hat{\theta}_1 = \hat{\theta}_1(X_1, X_2, \dots, X_n)θ^2=θ^2(X1,X2,,Xn)\hat{\theta}_2 = \hat{\theta}_2(X_1, X_2, \dots, X_n),使得: P(θ^1θθ^2)=1αP(\hat{\theta}_1 \leq \theta \leq \hat{\theta}_2) = 1 - \alpha 则称区间 [θ^1,θ^2][\hat{\theta}_1, \hat{\theta}_2] 为参数 θ\theta置信区间1α1 - \alpha 称为置信水平

置信区间的直观理解

理解:置信区间给出了参数可能取值的范围。置信水平 1α1 - \alpha 表示在大量重复抽样中,有 100(1α)%100(1-\alpha)\% 的置信区间包含真值。

置信区间的性质

性质 1:置信区间是随机的,真值是固定的 性质 2:置信水平越高,置信区间越宽 性质 3:样本量越大,置信区间越窄

置信区间的构造方法

枢轴量法

思想:构造一个包含参数和样本的统计量,其分布已知且不依赖于参数。

步骤

  1. 构造枢轴量 G(X1,X2,,Xn;θ)G(X_1, X_2, \dots, X_n; \theta)
  2. 确定枢轴量的分布
  3. 找到常数 a,ba, b,使得 P(aGb)=1αP(a \leq G \leq b) = 1 - \alpha
  4. 解不等式 aGba \leq G \leq b 得到置信区间

正态总体均值的置信区间

方差已知的情况

总体XN(μ,σ2)X \sim N(\mu, \sigma^2)σ2\sigma^2 已知

枢轴量Z=Xμσ/nN(0,1)Z = \frac{\overline{X} - \mu}{\sigma/\sqrt{n}} \sim N(0,1)

置信区间P(zα/2Xμσ/nzα/2)=1αP(-z_{\alpha/2} \leq \frac{\overline{X} - \mu}{\sigma/\sqrt{n}} \leq z_{\alpha/2}) = 1 - \alpha

解得: μ[Xzα/2σn,X+zα/2σn]\mu \in [\overline{X} - z_{\alpha/2}\frac{\sigma}{\sqrt{n}}, \overline{X} + z_{\alpha/2}\frac{\sigma}{\sqrt{n}}]

方差未知的情况

总体XN(μ,σ2)X \sim N(\mu, \sigma^2)σ2\sigma^2 未知

枢轴量T=XμS/nt(n1)T = \frac{\overline{X} - \mu}{S/\sqrt{n}} \sim t(n-1)

置信区间P(tα/2(n1)XμS/ntα/2(n1))=1αP(-t_{\alpha/2}(n-1) \leq \frac{\overline{X} - \mu}{S/\sqrt{n}} \leq t_{\alpha/2}(n-1)) = 1 - \alpha

解得: μ[Xtα/2(n1)Sn,X+tα/2(n1)Sn]\mu \in [\overline{X} - t_{\alpha/2}(n-1)\frac{S}{\sqrt{n}}, \overline{X} + t_{\alpha/2}(n-1)\frac{S}{\sqrt{n}}]

正态总体方差的置信区间

总体XN(μ,σ2)X \sim N(\mu, \sigma^2)

枢轴量χ2=(n1)S2σ2χ2(n1)\chi^2 = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)

置信区间P(χ1α/22(n1)(n1)S2σ2χα/22(n1))=1αP(\chi^2_{1-\alpha/2}(n-1) \leq \frac{(n-1)S^2}{\sigma^2} \leq \chi^2_{\alpha/2}(n-1)) = 1 - \alpha

解得: σ2[(n1)S2χα/22(n1),(n1)S2χ1α/22(n1)]\sigma^2 \in [\frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)}, \frac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)}]

两个正态总体均值差的置信区间

方差已知的情况

总体XN(μ1,σ12)X \sim N(\mu_1, \sigma_1^2)YN(μ2,σ22)Y \sim N(\mu_2, \sigma_2^2)σ12,σ22\sigma_1^2, \sigma_2^2 已知

枢轴量Z=(XY)(μ1μ2)σ12n1+σ22n2N(0,1)Z = \frac{(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0,1)

置信区间(μ1μ2)[(XY)zα/2σ12n1+σ22n2,(XY)+zα/2σ12n1+σ22n2](\mu_1 - \mu_2) \in [(\overline{X} - \overline{Y}) - z_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}, (\overline{X} - \overline{Y}) + z_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}]

方差未知但相等的情况

总体XN(μ1,σ2)X \sim N(\mu_1, \sigma^2)YN(μ2,σ2)Y \sim N(\mu_2, \sigma^2)

枢轴量T=(XY)(μ1μ2)Sp1n1+1n2t(n1+n22)T = \frac{(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)}{S_p\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2)

其中 Sp2=(n11)S12+(n21)S22n1+n22S_p^2 = \frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 - 2}

置信区间(μ1μ2)[(XY)tα/2(n1+n22)Sp1n1+1n2,(XY)+tα/2(n1+n22)Sp1n1+1n2](\mu_1 - \mu_2) \in [(\overline{X} - \overline{Y}) - t_{\alpha/2}(n_1 + n_2 - 2)S_p\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}, (\overline{X} - \overline{Y}) + t_{\alpha/2}(n_1 + n_2 - 2)S_p\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}]

两个正态总体方差比的置信区间

总体XN(μ1,σ12)X \sim N(\mu_1, \sigma_1^2)YN(μ2,σ22)Y \sim N(\mu_2, \sigma_2^2)

枢轴量F=S12/σ12S22/σ22F(n11,n21)F = \frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \sim F(n_1-1, n_2-1)

置信区间P(F1α/2(n11,n21)S12/σ12S22/σ22Fα/2(n11,n21))=1αP(F_{1-\alpha/2}(n_1-1, n_2-1) \leq \frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \leq F_{\alpha/2}(n_1-1, n_2-1)) = 1 - \alpha

解得: σ12σ22[S12S221Fα/2(n11,n21),S12S221F1α/2(n11,n21)]\frac{\sigma_1^2}{\sigma_2^2} \in [\frac{S_1^2}{S_2^2}\frac{1}{F_{\alpha/2}(n_1-1, n_2-1)}, \frac{S_1^2}{S_2^2}\frac{1}{F_{1-\alpha/2}(n_1-1, n_2-1)}]

置信区间的应用

样本量的确定

问题:给定置信水平和精度要求,确定所需的样本量。

例 1:对于正态总体均值估计,给定置信水平 1α1-\alpha 和精度 δ\delta,求样本量 nn

  1. 置信区间长度:2zα/2σn2δ2z_{\alpha/2}\frac{\sigma}{\sqrt{n}} \leq 2\delta
  2. 解得:n(zα/2σδ)2n \geq (\frac{z_{\alpha/2}\sigma}{\delta})^2

置信区间的解释

正确解释:在大量重复抽样中,有 100(1α)%100(1-\alpha)\% 的置信区间包含真值。

错误解释:真值有 100(1α)%100(1-\alpha)\% 的概率落在置信区间内。

置信区间的选择

双侧置信区间:适用于一般情况 单侧置信区间:适用于有方向性的问题

例 2:估计产品寿命的下限

  • 单侧置信区间:[θ^L,+)[\hat{\theta}_L, +\infty)
  • P(θθ^L)=1αP(\theta \geq \hat{\theta}_L) = 1 - \alpha

置信区间的性质

置信水平与区间长度的关系

关系:置信水平越高,置信区间越长。

原因:置信水平越高,需要覆盖真值的概率越大,因此区间必须更宽。

样本量与区间长度的关系

关系:样本量越大,置信区间越短。

原因:样本量越大,估计越精确,因此区间越窄。

置信区间的对称性

正态分布:置信区间通常是对称的 其他分布:置信区间可能不对称

常见分布的置信区间

二项分布参数的置信区间

总体XB(1,p)X \sim B(1,p)

大样本近似p[p^zα/2p^(1p^)n,p^+zα/2p^(1p^)n]p \in [\hat{p} - z_{\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}, \hat{p} + z_{\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}]

其中 p^=1ni=1nXi\hat{p} = \frac{1}{n}\sum_{i=1}^n X_i

泊松分布参数的置信区间

总体XPoisson(λ)X \sim Poisson(\lambda)

大样本近似λ[λ^zα/2λ^n,λ^+zα/2λ^n]\lambda \in [\hat{\lambda} - z_{\alpha/2}\sqrt{\frac{\hat{\lambda}}{n}}, \hat{\lambda} + z_{\alpha/2}\sqrt{\frac{\hat{\lambda}}{n}}]

其中 λ^=X\hat{\lambda} = \overline{X}

练习题

练习 1

写出正态总体均值 μ\mu1α1-\alpha 置信区间(方差已知)。

参考答案

解题思路: 使用枢轴量法构造置信区间。

详细步骤

  1. 枢轴量:Z=Xμσ/nN(0,1)Z = \frac{\overline{X} - \mu}{\sigma/\sqrt{n}} \sim N(0,1)
  2. P(zα/2Xμσ/nzα/2)=1αP(-z_{\alpha/2} \leq \frac{\overline{X} - \mu}{\sigma/\sqrt{n}} \leq z_{\alpha/2}) = 1 - \alpha
  3. 解得:μ[Xzα/2σn,X+zα/2σn]\mu \in [\overline{X} - z_{\alpha/2}\frac{\sigma}{\sqrt{n}}, \overline{X} + z_{\alpha/2}\frac{\sigma}{\sqrt{n}}]

答案[Xzα/2σn,X+zα/2σn][\overline{X} - z_{\alpha/2}\frac{\sigma}{\sqrt{n}}, \overline{X} + z_{\alpha/2}\frac{\sigma}{\sqrt{n}}]

练习 2

X1,X2,,XnX_1, X_2, \dots, X_n 是来自总体 XN(μ,σ2)X \sim N(\mu, \sigma^2) 的样本,σ2\sigma^2 未知,求 μ\mu95%95\% 置信区间。

参考答案

解题思路: 使用 t 分布构造置信区间。

详细步骤

  1. 枢轴量:T=XμS/nt(n1)T = \frac{\overline{X} - \mu}{S/\sqrt{n}} \sim t(n-1)
  2. P(t0.025(n1)XμS/nt0.025(n1))=0.95P(-t_{0.025}(n-1) \leq \frac{\overline{X} - \mu}{S/\sqrt{n}} \leq t_{0.025}(n-1)) = 0.95
  3. 解得:μ[Xt0.025(n1)Sn,X+t0.025(n1)Sn]\mu \in [\overline{X} - t_{0.025}(n-1)\frac{S}{\sqrt{n}}, \overline{X} + t_{0.025}(n-1)\frac{S}{\sqrt{n}}]

答案[Xt0.025(n1)Sn,X+t0.025(n1)Sn][\overline{X} - t_{0.025}(n-1)\frac{S}{\sqrt{n}}, \overline{X} + t_{0.025}(n-1)\frac{S}{\sqrt{n}}]

练习 3

X1,X2,,XnX_1, X_2, \dots, X_n 是来自总体 XN(μ,σ2)X \sim N(\mu, \sigma^2) 的样本,求 σ2\sigma^21α1-\alpha 置信区间。

参考答案

解题思路: 使用卡方分布构造置信区间。

详细步骤

  1. 枢轴量:χ2=(n1)S2σ2χ2(n1)\chi^2 = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)
  2. P(χ1α/22(n1)(n1)S2σ2χα/22(n1))=1αP(\chi^2_{1-\alpha/2}(n-1) \leq \frac{(n-1)S^2}{\sigma^2} \leq \chi^2_{\alpha/2}(n-1)) = 1 - \alpha
  3. 解得:σ2[(n1)S2χα/22(n1),(n1)S2χ1α/22(n1)]\sigma^2 \in [\frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)}, \frac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)}]

答案[(n1)S2χα/22(n1),(n1)S2χ1α/22(n1)][\frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)}, \frac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)}]

练习 4

设两总体方差分别为 σ12,σ22\sigma_1^2, \sigma_2^2,检验 H0:σ12=σ22H_0: \sigma_1^2=\sigma_2^2,应选用哪种检验?

参考答案

解题思路: 根据检验对象选择合适的检验方法。

详细步骤

  1. 检验两个正态总体方差比
  2. 使用 F 检验
  3. 检验统计量:F=S12S22F(n11,n21)F = \frac{S_1^2}{S_2^2} \sim F(n_1-1, n_2-1)

答案:F 检验

练习 5

X1,X2,,XnX_1, X_2, \dots, X_n 是来自总体 XN(μ,σ2)X \sim N(\mu, \sigma^2) 的样本,σ2\sigma^2 已知,求 μ\mu90%90\% 置信区间。

参考答案

解题思路: 使用正态分布构造置信区间。

详细步骤

  1. 枢轴量:Z=Xμσ/nN(0,1)Z = \frac{\overline{X} - \mu}{\sigma/\sqrt{n}} \sim N(0,1)
  2. P(z0.05Xμσ/nz0.05)=0.90P(-z_{0.05} \leq \frac{\overline{X} - \mu}{\sigma/\sqrt{n}} \leq z_{0.05}) = 0.90
  3. 解得:μ[Xz0.05σn,X+z0.05σn]\mu \in [\overline{X} - z_{0.05}\frac{\sigma}{\sqrt{n}}, \overline{X} + z_{0.05}\frac{\sigma}{\sqrt{n}}]

答案[Xz0.05σn,X+z0.05σn][\overline{X} - z_{0.05}\frac{\sigma}{\sqrt{n}}, \overline{X} + z_{0.05}\frac{\sigma}{\sqrt{n}}]