假设检验的基本思想与步骤
假设检验的基本概念
假设检验的定义
定义:假设检验是统计推断的一个重要分支,它通过样本信息来判断关于总体参数的某种假设是否成立。其基本思想是:在某种假设成立的条件下,样本观测值出现的概率很小,如果实际观测到的样本值确实很小,则怀疑原假设的正确性。
假设检验的直观理解
理解:假设检验类似于法庭审判,原假设相当于”无罪推定”,备择假设相当于”有罪指控”。我们通过证据(样本数据)来判断是否拒绝原假设。
假设检验的基本要素
原假设 :通常是我们想要拒绝的假设,表示”无差异”、“无效果”等 备择假设 :通常是我们想要接受的假设,表示”有差异”、“有效果”等 显著性水平 :犯第一类错误的概率,通常取 0.05 或 0.01 检验统计量:用于判断是否拒绝原假设的统计量 拒绝域:检验统计量的取值区域,当统计量落在此区域时拒绝原假设
假设检验的基本步骤
第一步:提出假设
原假设 : 或 或 备择假设 : 或 或
例 1:检验总体均值是否等于某个值
第二步:选定检验统计量
选择原则:
- 在原假设成立的条件下,检验统计量的分布已知
- 检验统计量能够区分原假设和备择假设
- 检验统计量的计算相对简单
例 2:对于正态总体均值检验(方差已知)
- 检验统计量:
第三步:确定拒绝域
双侧检验: 单侧检验: 或
例 3:对于显著性水平 的双侧检验
- 拒绝域:
第四步:计算样本值
计算:将样本数据代入检验统计量,得到具体的数值。
例 4:样本均值 ,总体标准差 ,样本量 ,检验
第五步:作出结论
判断:如果检验统计量的值落在拒绝域内,则拒绝原假设;否则接受原假设。
例 5:对于例 4,,不拒绝原假设。
两类错误
第一类错误(拒真错误)
定义:当原假设 为真时,却拒绝了 的错误。
概率:
意义:第一类错误是”冤枉好人”的错误,其概率就是显著性水平 。
例 6:在例 4 中,如果 (原假设为真),但 ,则犯了第一类错误。
第二类错误(受伪错误)
定义:当原假设 为假时,却接受了 的错误。
概率:
意义:第二类错误是”放过坏人”的错误。
例 7:在例 4 中,如果 (原假设为假),但 ,则犯了第二类错误。
两类错误的关系
关系:在样本量固定的情况下,减小 会增加 ,减小 会增加 。
权衡:通常优先控制第一类错误的概率,因为第一类错误的后果通常更严重。
功效函数
定义:功效函数 表示在原假设为假时拒绝原假设的概率。
意义:功效函数越大,检验的效果越好。
显著性水平与 P 值
显著性水平
定义:显著性水平 是犯第一类错误的最大概率。
常用值:(5%),(1%),(10%)
选择:根据问题的严重性和后果来选择显著性水平。
P 值
定义:P 值是在原假设为真的条件下,检验统计量取到比观测值更极端的值的概率。
计算:
- 双侧检验:
- 单侧检验: 或
判断:如果 ,则拒绝原假设;否则接受原假设。
例 8:对于例 4,,,不拒绝原假设。
假设检验的类型
双侧检验
形式:,
拒绝域:
应用:当我们关心参数是否等于某个值时使用。
单侧检验
左单侧检验:, 右单侧检验:,
拒绝域: 或
应用:当我们关心参数是否大于或小于某个值时使用。
假设检验的决策规则
临界值法
步骤:
- 根据显著性水平确定临界值
- 计算检验统计量的值
- 比较检验统计量与临界值
- 作出决策
优点:直观明确 缺点:需要查表
P 值法
步骤:
- 计算 P 值
- 比较 P 值与显著性水平
- 作出决策
优点:不需要查表,可以精确判断 缺点:计算相对复杂
假设检验的注意事项
样本量的影响
影响:样本量越大,检验的功效越高,犯第二类错误的概率越小。
原因:样本量越大,估计越精确,更容易检测到真实的差异。
效应量
定义:效应量是衡量实际差异大小的指标。
意义:即使统计上显著,如果效应量很小,实际意义可能不大。
多重比较
问题:进行多个假设检验时,犯第一类错误的概率会增加。
解决方法:使用多重比较校正方法,如 Bonferroni 校正。
假设检验的应用
在质量控制中的应用
应用 1:检验产品质量是否达到标准 应用 2:检验生产过程是否稳定
在医学研究中的应用
应用 3:检验新药是否有效 应用 4:检验治疗方法是否有差异
在社会科学中的应用
应用 5:检验调查结果是否有差异 应用 6:检验政策效果是否显著
练习题
练习 1
简述假设检验的一般步骤。
参考答案
解题思路: 列出假设检验的五个基本步骤。
详细步骤:
- 提出假设:确定原假设 和备择假设
- 选定统计量:选择合适的检验统计量
- 确定拒绝域:根据显著性水平确定拒绝域
- 计算样本值:将样本数据代入检验统计量
- 作出结论:根据检验统计量的值作出决策
答案:提出假设 → 选定统计量 → 确定拒绝域 → 计算样本值 → 作出结论
练习 2
设 , 已知,检验 ,写出检验统计量。
参考答案
解题思路: 使用正态分布的检验统计量。
详细步骤:
- 检验统计量:
- 在原假设成立的条件下,
答案:
练习 3
说明第一类错误和第二类错误的含义。
参考答案
解题思路: 解释两类错误的定义和含义。
详细步骤:
- 第一类错误:当原假设 为真时,却拒绝了 的错误
- 第二类错误:当原假设 为假时,却接受了 的错误
- 第一类错误概率:,即显著性水平
- 第二类错误概率:
答案:第一类错误是拒真,第二类错误是受伪
练习 4
设显著性水平 ,P 值 ,应该拒绝还是接受原假设?
参考答案
解题思路: 比较 P 值与显著性水平。
详细步骤:
- 根据 P 值法,当 时拒绝原假设
- 因此应该拒绝原假设
答案:拒绝原假设
练习 5
设检验统计量 ,显著性水平 ,进行双侧检验,应该拒绝还是接受原假设?
参考答案
解题思路: 比较检验统计量与临界值。
详细步骤:
- 双侧检验的临界值:
- 检验统计量落在拒绝域内
- 因此应该拒绝原假设
答案:拒绝原假设