区间估计与置信区间
区间估计的基本概念
区间估计的定义
定义:设总体 X 的分布函数为 F(x;θ),其中 θ 是未知参数。从总体中抽取样本 X1,X2,…,Xn,构造两个统计量 θ^1=θ^1(X1,X2,…,Xn) 和 θ^2=θ^2(X1,X2,…,Xn),使得:
P(θ^1≤θ≤θ^2)=1−α
则称区间 [θ^1,θ^2] 为参数 θ 的置信区间,1−α 称为置信水平。
置信区间的直观理解
理解:置信区间给出了参数可能取值的范围。置信水平 1−α 表示在大量重复抽样中,有 100(1−α)% 的置信区间包含真值。
置信区间的性质
性质 1:置信区间是随机的,真值是固定的
性质 2:置信水平越高,置信区间越宽
性质 3:样本量越大,置信区间越窄
置信区间的构造方法
枢轴量法
思想:构造一个包含参数和样本的统计量,其分布已知且不依赖于参数。
步骤:
- 构造枢轴量 G(X1,X2,…,Xn;θ)
- 确定枢轴量的分布
- 找到常数 a,b,使得 P(a≤G≤b)=1−α
- 解不等式 a≤G≤b 得到置信区间
正态总体均值的置信区间
方差已知的情况
总体:X∼N(μ,σ2),σ2 已知
枢轴量:Z=σ/nX−μ∼N(0,1)
置信区间:
P(−zα/2≤σ/nX−μ≤zα/2)=1−α
解得:
μ∈[X−zα/2nσ,X+zα/2nσ]
方差未知的情况
总体:X∼N(μ,σ2),σ2 未知
枢轴量:T=S/nX−μ∼t(n−1)
置信区间:
P(−tα/2(n−1)≤S/nX−μ≤tα/2(n−1))=1−α
解得:
μ∈[X−tα/2(n−1)nS,X+tα/2(n−1)nS]
正态总体方差的置信区间
总体:X∼N(μ,σ2)
枢轴量:χ2=σ2(n−1)S2∼χ2(n−1)
置信区间:
P(χ1−α/22(n−1)≤σ2(n−1)S2≤χα/22(n−1))=1−α
解得:
σ2∈[χα/22(n−1)(n−1)S2,χ1−α/22(n−1)(n−1)S2]
两个正态总体均值差的置信区间
方差已知的情况
总体:X∼N(μ1,σ12),Y∼N(μ2,σ22),σ12,σ22 已知
枢轴量:Z=n1σ12+n2σ22(X−Y)−(μ1−μ2)∼N(0,1)
置信区间:
(μ1−μ2)∈[(X−Y)−zα/2n1σ12+n2σ22,(X−Y)+zα/2n1σ12+n2σ22]
方差未知但相等的情况
总体:X∼N(μ1,σ2),Y∼N(μ2,σ2)
枢轴量:T=Spn11+n21(X−Y)−(μ1−μ2)∼t(n1+n2−2)
其中 Sp2=n1+n2−2(n1−1)S12+(n2−1)S22
置信区间:
(μ1−μ2)∈[(X−Y)−tα/2(n1+n2−2)Spn11+n21,(X−Y)+tα/2(n1+n2−2)Spn11+n21]
两个正态总体方差比的置信区间
总体:X∼N(μ1,σ12),Y∼N(μ2,σ22)
枢轴量:F=S22/σ22S12/σ12∼F(n1−1,n2−1)
置信区间:
P(F1−α/2(n1−1,n2−1)≤S22/σ22S12/σ12≤Fα/2(n1−1,n2−1))=1−α
解得:
σ22σ12∈[S22S12Fα/2(n1−1,n2−1)1,S22S12F1−α/2(n1−1,n2−1)1]
置信区间的应用
样本量的确定
问题:给定置信水平和精度要求,确定所需的样本量。
例 1:对于正态总体均值估计,给定置信水平 1−α 和精度 δ,求样本量 n。
解:
- 置信区间长度:2zα/2nσ≤2δ
- 解得:n≥(δzα/2σ)2
置信区间的解释
正确解释:在大量重复抽样中,有 100(1−α)% 的置信区间包含真值。
错误解释:真值有 100(1−α)% 的概率落在置信区间内。
置信区间的选择
双侧置信区间:适用于一般情况
单侧置信区间:适用于有方向性的问题
例 2:估计产品寿命的下限
- 单侧置信区间:[θ^L,+∞)
- P(θ≥θ^L)=1−α
置信区间的性质
置信水平与区间长度的关系
关系:置信水平越高,置信区间越长。
原因:置信水平越高,需要覆盖真值的概率越大,因此区间必须更宽。
样本量与区间长度的关系
关系:样本量越大,置信区间越短。
原因:样本量越大,估计越精确,因此区间越窄。
置信区间的对称性
正态分布:置信区间通常是对称的
其他分布:置信区间可能不对称
常见分布的置信区间
二项分布参数的置信区间
总体:X∼B(1,p)
大样本近似:
p∈[p^−zα/2np^(1−p^),p^+zα/2np^(1−p^)]
其中 p^=n1∑i=1nXi
泊松分布参数的置信区间
总体:X∼Poisson(λ)
大样本近似:
λ∈[λ^−zα/2nλ^,λ^+zα/2nλ^]
其中 λ^=X
练习题
练习 1
写出正态总体均值 μ 的 1−α 置信区间(方差已知)。
参考答案
解题思路:
使用枢轴量法构造置信区间。
详细步骤:
- 枢轴量:Z=σ/nX−μ∼N(0,1)
- P(−zα/2≤σ/nX−μ≤zα/2)=1−α
- 解得:μ∈[X−zα/2nσ,X+zα/2nσ]
答案:[X−zα/2nσ,X+zα/2nσ]
练习 2
设 X1,X2,…,Xn 是来自总体 X∼N(μ,σ2) 的样本,σ2 未知,求 μ 的 95% 置信区间。
参考答案
解题思路:
使用 t 分布构造置信区间。
详细步骤:
- 枢轴量:T=S/nX−μ∼t(n−1)
- P(−t0.025(n−1)≤S/nX−μ≤t0.025(n−1))=0.95
- 解得:μ∈[X−t0.025(n−1)nS,X+t0.025(n−1)nS]
答案:[X−t0.025(n−1)nS,X+t0.025(n−1)nS]
练习 3
设 X1,X2,…,Xn 是来自总体 X∼N(μ,σ2) 的样本,求 σ2 的 1−α 置信区间。
参考答案
解题思路:
使用卡方分布构造置信区间。
详细步骤:
- 枢轴量:χ2=σ2(n−1)S2∼χ2(n−1)
- P(χ1−α/22(n−1)≤σ2(n−1)S2≤χα/22(n−1))=1−α
- 解得:σ2∈[χα/22(n−1)(n−1)S2,χ1−α/22(n−1)(n−1)S2]
答案:[χα/22(n−1)(n−1)S2,χ1−α/22(n−1)(n−1)S2]
练习 4
设两总体方差分别为 σ12,σ22,检验 H0:σ12=σ22,应选用哪种检验?
参考答案
解题思路:
根据检验对象选择合适的检验方法。
详细步骤:
- 检验两个正态总体方差比
- 使用 F 检验
- 检验统计量:F=S22S12∼F(n1−1,n2−1)
答案:F 检验
练习 5
设 X1,X2,…,Xn 是来自总体 X∼N(μ,σ2) 的样本,σ2 已知,求 μ 的 90% 置信区间。
参考答案
解题思路:
使用正态分布构造置信区间。
详细步骤:
- 枢轴量:Z=σ/nX−μ∼N(0,1)
- P(−z0.05≤σ/nX−μ≤z0.05)=0.90
- 解得:μ∈[X−z0.05nσ,X+z0.05nσ]
答案:[X−z0.05nσ,X+z0.05nσ]