单个正态总体的假设检验
单个正态总体均值检验
方差已知的情况(Z 检验)
总体:X∼N(μ,σ2),σ2 已知
假设:
- H0:μ=μ0
- H1:μ=μ0(双侧检验)
- H1:μ>μ0(右单侧检验)
- H1:μ<μ0(左单侧检验)
检验统计量:
Z=σ/nX−μ0∼N(0,1)
拒绝域:
- 双侧检验:∣Z∣>zα/2
- 右单侧检验:Z>zα
- 左单侧检验:Z<−zα
例 1:某工厂生产的零件长度服从正态分布 N(μ,0.04),从产品中随机抽取 16 个零件,测得平均长度为 10.2cm。在显著性水平 α=0.05 下,检验零件长度是否等于 10cm。
解:
- 提出假设:H0:μ=10,H1:μ=10
- 检验统计量:Z=0.04/16X−10=0.2/410.2−10=4
- 拒绝域:∣Z∣>1.96
- 判断:∣Z∣=4>1.96,拒绝原假设
- 结论:零件长度不等于 10cm
方差未知的情况(T 检验)
总体:X∼N(μ,σ2),σ2 未知
假设:
- H0:μ=μ0
- H1:μ=μ0(双侧检验)
- H1:μ>μ0(右单侧检验)
- H1:μ<μ0(左单侧检验)
检验统计量:
T=S/nX−μ0∼t(n−1)
拒绝域:
- 双侧检验:∣T∣>tα/2(n−1)
- 右单侧检验:T>tα(n−1)
- 左单侧检验:T<−tα(n−1)
例 2:某品牌电池的使用寿命服从正态分布,从该品牌电池中随机抽取 10 个,测得平均使用寿命为 120 小时,样本标准差为 8 小时。在显著性水平 α=0.05 下,检验电池平均使用寿命是否大于 115 小时。
解:
- 提出假设:H0:μ≤115,H1:μ>115
- 检验统计量:T=8/10120−115=2.535=1.98
- 拒绝域:T>t0.05(9)=1.833
- 判断:T=1.98>1.833,拒绝原假设
- 结论:电池平均使用寿命大于 115 小时
单个正态总体方差检验(卡方检验)
均值已知的情况
总体:X∼N(μ,σ2),μ 已知
假设:
- H0:σ2=σ02
- H1:σ2=σ02(双侧检验)
- H1:σ2>σ02(右单侧检验)
- H1:σ2<σ02(左单侧检验)
检验统计量:
χ2=σ02∑i=1n(Xi−μ)2∼χ2(n)
拒绝域:
- 双侧检验:χ2<χ1−α/22(n) 或 χ2>χα/22(n)
- 右单侧检验:χ2>χα2(n)
- 左单侧检验:χ2<χ1−α2(n)
均值未知的情况
总体:X∼N(μ,σ2),μ 未知
假设:
- H0:σ2=σ02
- H1:σ2=σ02(双侧检验)
- H1:σ2>σ02(右单侧检验)
- H1:σ2<σ02(左单侧检验)
检验统计量:
χ2=σ02(n−1)S2∼χ2(n−1)
拒绝域:
- 双侧检验:χ2<χ1−α/22(n−1) 或 χ2>χα/22(n−1)
- 右单侧检验:χ2>χα2(n−1)
- 左单侧检验:χ2<χ1−α2(n−1)
例 3:某工厂生产的零件长度服从正态分布,从产品中随机抽取 10 个零件,测得样本方差为 0.04。在显著性水平 α=0.05 下,检验零件长度的方差是否等于 0.03。
解:
- 提出假设:H0:σ2=0.03,H1:σ2=0.03
- 检验统计量:χ2=0.03(10−1)×0.04=0.039×0.04=12
- 拒绝域:χ2<χ0.9752(9)=2.7 或 χ2>χ0.0252(9)=19.0
- 判断:2.7<χ2=12<19.0,不拒绝原假设
- 结论:零件长度的方差等于 0.03
检验方法的比较
Z 检验与 T 检验的比较
Z 检验:
- 适用条件:方差已知
- 检验统计量:Z∼N(0,1)
- 优点:计算简单,不需要查 t 分布表
- 缺点:需要知道总体方差
T 检验:
- 适用条件:方差未知
- 检验统计量:T∼t(n−1)
- 优点:不需要知道总体方差
- 缺点:需要查 t 分布表
均值检验与方差检验的比较
均值检验:
- 检验对象:总体均值
- 应用场景:检验产品质量、治疗效果等
- 检验统计量:Z 统计量或 T 统计量
方差检验:
- 检验对象:总体方差
- 应用场景:检验生产稳定性、测量精度等
- 检验统计量:卡方统计量
检验的功效分析
功效函数
定义:功效函数 1−β 表示在原假设为假时拒绝原假设的概率。
影响因素:
- 样本量:样本量越大,功效越高
- 显著性水平:显著性水平越高,功效越高
- 效应量:效应量越大,功效越高
样本量的确定
问题:给定显著性水平、功效和效应量,确定所需的样本量。
例 4:对于正态总体均值检验,给定显著性水平 α=0.05,功效 1−β=0.8,效应量 d=0.5,求样本量 n。
解:
- 使用功效分析公式
- 查表或使用软件计算
- 得到 n≈26
检验的假设条件
正态性假设
重要性:正态性假设是进行 Z 检验和 T 检验的基础。
检验方法:
- 图形法:Q-Q 图、直方图
- 统计检验:Shapiro-Wilk 检验、Kolmogorov-Smirnov 检验
处理非正态数据:
- 数据变换:对数变换、平方根变换等
- 非参数检验:Wilcoxon 符号秩检验等
独立性假设
重要性:样本观测值之间应该相互独立。
检验方法:
- 时间序列分析:自相关函数
- 空间数据分析:空间自相关
检验的注意事项
多重比较问题
问题:进行多个假设检验时,犯第一类错误的概率会增加。
解决方法:
- Bonferroni 校正:将显著性水平除以检验次数
- Holm 校正:逐步调整显著性水平
- FDR 控制:控制错误发现率
效应量
定义:效应量是衡量实际差异大小的指标。
常用效应量:
- Cohen’s d:d=σμ1−μ2
- 相关系数:r=t2+dft
意义:即使统计上显著,如果效应量很小,实际意义可能不大。
练习题
练习 1
设 X∼N(μ,σ2),σ 已知,检验 H0:μ=μ0,写出检验统计量。
参考答案
解题思路:
使用正态分布的检验统计量。
详细步骤:
- 检验统计量:Z=σ/nX−μ0
- 在原假设成立的条件下,Z∼N(0,1)
答案:Z=σ/nX−μ0
练习 2
设 X∼N(μ,σ2),σ 未知,检验 H0:μ=μ0,写出检验统计量。
参考答案
解题思路:
使用 t 分布的检验统计量。
详细步骤:
- 检验统计量:T=S/nX−μ0
- 在原假设成立的条件下,T∼t(n−1)
答案:T=S/nX−μ0
练习 3
设 X∼N(μ,σ2),μ 未知,检验 H0:σ2=σ02,写出检验统计量。
参考答案
解题思路:
使用卡方分布的检验统计量。
详细步骤:
- 检验统计量:χ2=σ02(n−1)S2
- 在原假设成立的条件下,χ2∼χ2(n−1)
答案:χ2=σ02(n−1)S2
练习 4
设样本均值 x=52,总体标准差 σ=10,样本量 n=25,检验 H0:μ=50,H1:μ=50,显著性水平 α=0.05。
参考答案
解题思路:
使用 Z 检验进行双侧检验。
详细步骤:
- 检验统计量:Z=10/2552−50=1
- 拒绝域:∣Z∣>1.96
- 判断:∣Z∣=1<1.96,不拒绝原假设
- 结论:总体均值等于 50
答案:不拒绝原假设
练习 5
设样本均值 x=120,样本标准差 s=8,样本量 n=10,检验 H0:μ≤115,H1:μ>115,显著性水平 α=0.05。
参考答案
解题思路:
使用 T 检验进行右单侧检验。
详细步骤:
- 检验统计量:T=8/10120−115=1.98
- 拒绝域:T>t0.05(9)=1.833
- 判断:T=1.98>1.833,拒绝原假设
- 结论:总体均值大于 115
答案:拒绝原假设