logo
导航

假设检验的基本思想与步骤

假设检验的基本概念

假设检验的定义

定义:假设检验是统计推断的一个重要分支,它通过样本信息来判断关于总体参数的某种假设是否成立。其基本思想是:在某种假设成立的条件下,样本观测值出现的概率很小,如果实际观测到的样本值确实很小,则怀疑原假设的正确性。

假设检验的直观理解

理解:假设检验类似于法庭审判,原假设相当于”无罪推定”,备择假设相当于”有罪指控”。我们通过证据(样本数据)来判断是否拒绝原假设。

假设检验的基本要素

原假设 H0H_0:通常是我们想要拒绝的假设,表示”无差异”、“无效果”等 备择假设 H1H_1:通常是我们想要接受的假设,表示”有差异”、“有效果”等 显著性水平 α\alpha:犯第一类错误的概率,通常取 0.05 或 0.01 检验统计量:用于判断是否拒绝原假设的统计量 拒绝域:检验统计量的取值区域,当统计量落在此区域时拒绝原假设

假设检验的基本步骤

第一步:提出假设

原假设 H0H_0θ=θ0\theta = \theta_0θθ0\theta \leq \theta_0θθ0\theta \geq \theta_0 备择假设 H1H_1θθ0\theta \neq \theta_0θ>θ0\theta > \theta_0θ<θ0\theta < \theta_0

例 1:检验总体均值是否等于某个值

  • H0:μ=μ0H_0: \mu = \mu_0
  • H1:μμ0H_1: \mu \neq \mu_0

第二步:选定检验统计量

选择原则

  1. 在原假设成立的条件下,检验统计量的分布已知
  2. 检验统计量能够区分原假设和备择假设
  3. 检验统计量的计算相对简单

例 2:对于正态总体均值检验(方差已知)

  • 检验统计量:Z=Xμ0σ/nN(0,1)Z = \frac{\overline{X} - \mu_0}{\sigma/\sqrt{n}} \sim N(0,1)

第三步:确定拒绝域

双侧检验Z>zα/2|Z| > z_{\alpha/2} 单侧检验Z>zαZ > z_{\alpha}Z<zαZ < -z_{\alpha}

例 3:对于显著性水平 α=0.05\alpha = 0.05 的双侧检验

  • 拒绝域:Z>1.96|Z| > 1.96

第四步:计算样本值

计算:将样本数据代入检验统计量,得到具体的数值。

例 4:样本均值 x=52\overline{x} = 52,总体标准差 σ=10\sigma = 10,样本量 n=25n = 25,检验 μ0=50\mu_0 = 50

  • z=525010/25=1z = \frac{52 - 50}{10/\sqrt{25}} = 1

第五步:作出结论

判断:如果检验统计量的值落在拒绝域内,则拒绝原假设;否则接受原假设。

例 5:对于例 4,z=1<1.96z = 1 < 1.96,不拒绝原假设。

两类错误

第一类错误(拒真错误)

定义:当原假设 H0H_0 为真时,却拒绝了 H0H_0 的错误。

概率P(拒绝H0H0为真)=αP(\text{拒绝}H_0|H_0\text{为真}) = \alpha

意义:第一类错误是”冤枉好人”的错误,其概率就是显著性水平 α\alpha

例 6:在例 4 中,如果 μ=50\mu = 50(原假设为真),但 Z>1.96|Z| > 1.96,则犯了第一类错误。

第二类错误(受伪错误)

定义:当原假设 H0H_0 为假时,却接受了 H0H_0 的错误。

概率P(接受H0H1为真)=βP(\text{接受}H_0|H_1\text{为真}) = \beta

意义:第二类错误是”放过坏人”的错误。

例 7:在例 4 中,如果 μ=55\mu = 55(原假设为假),但 Z1.96|Z| \leq 1.96,则犯了第二类错误。

两类错误的关系

关系:在样本量固定的情况下,减小 α\alpha 会增加 β\beta,减小 β\beta 会增加 α\alpha

权衡:通常优先控制第一类错误的概率,因为第一类错误的后果通常更严重。

功效函数

定义:功效函数 1β1 - \beta 表示在原假设为假时拒绝原假设的概率。

意义:功效函数越大,检验的效果越好。

显著性水平与 P 值

显著性水平

定义:显著性水平 α\alpha 是犯第一类错误的最大概率。

常用值α=0.05\alpha = 0.05(5%),α=0.01\alpha = 0.01(1%),α=0.10\alpha = 0.10(10%)

选择:根据问题的严重性和后果来选择显著性水平。

P 值

定义:P 值是在原假设为真的条件下,检验统计量取到比观测值更极端的值的概率。

计算

  • 双侧检验:P=2P(Z>z)P = 2P(Z > |z|)
  • 单侧检验:P=P(Z>z)P = P(Z > z)P=P(Z<z)P = P(Z < z)

判断:如果 P<αP < \alpha,则拒绝原假设;否则接受原假设。

例 8:对于例 4,z=1z = 1P=2P(Z>1)=2×0.1587=0.3174>0.05P = 2P(Z > 1) = 2 \times 0.1587 = 0.3174 > 0.05,不拒绝原假设。

假设检验的类型

双侧检验

形式H0:θ=θ0H_0: \theta = \theta_0H1:θθ0H_1: \theta \neq \theta_0

拒绝域T>tα/2|T| > t_{\alpha/2}

应用:当我们关心参数是否等于某个值时使用。

单侧检验

左单侧检验H0:θθ0H_0: \theta \geq \theta_0H1:θ<θ0H_1: \theta < \theta_0 右单侧检验H0:θθ0H_0: \theta \leq \theta_0H1:θ>θ0H_1: \theta > \theta_0

拒绝域T<tαT < -t_{\alpha}T>tαT > t_{\alpha}

应用:当我们关心参数是否大于或小于某个值时使用。

假设检验的决策规则

临界值法

步骤

  1. 根据显著性水平确定临界值
  2. 计算检验统计量的值
  3. 比较检验统计量与临界值
  4. 作出决策

优点:直观明确 缺点:需要查表

P 值法

步骤

  1. 计算 P 值
  2. 比较 P 值与显著性水平
  3. 作出决策

优点:不需要查表,可以精确判断 缺点:计算相对复杂

假设检验的注意事项

样本量的影响

影响:样本量越大,检验的功效越高,犯第二类错误的概率越小。

原因:样本量越大,估计越精确,更容易检测到真实的差异。

效应量

定义:效应量是衡量实际差异大小的指标。

意义:即使统计上显著,如果效应量很小,实际意义可能不大。

多重比较

问题:进行多个假设检验时,犯第一类错误的概率会增加。

解决方法:使用多重比较校正方法,如 Bonferroni 校正。

假设检验的应用

在质量控制中的应用

应用 1:检验产品质量是否达到标准 应用 2:检验生产过程是否稳定

在医学研究中的应用

应用 3:检验新药是否有效 应用 4:检验治疗方法是否有差异

在社会科学中的应用

应用 5:检验调查结果是否有差异 应用 6:检验政策效果是否显著

练习题

练习 1

简述假设检验的一般步骤。

参考答案

解题思路: 列出假设检验的五个基本步骤。

详细步骤

  1. 提出假设:确定原假设 H0H_0 和备择假设 H1H_1
  2. 选定统计量:选择合适的检验统计量
  3. 确定拒绝域:根据显著性水平确定拒绝域
  4. 计算样本值:将样本数据代入检验统计量
  5. 作出结论:根据检验统计量的值作出决策

答案:提出假设 → 选定统计量 → 确定拒绝域 → 计算样本值 → 作出结论

练习 2

XN(μ,σ2)X \sim N(\mu, \sigma^2)σ\sigma 已知,检验 H0:μ=μ0H_0: \mu=\mu_0,写出检验统计量。

参考答案

解题思路: 使用正态分布的检验统计量。

详细步骤

  1. 检验统计量:Z=Xμ0σ/nZ = \frac{\overline{X} - \mu_0}{\sigma/\sqrt{n}}
  2. 在原假设成立的条件下,ZN(0,1)Z \sim N(0,1)

答案Z=Xμ0σ/nZ = \frac{\overline{X} - \mu_0}{\sigma/\sqrt{n}}

练习 3

说明第一类错误和第二类错误的含义。

参考答案

解题思路: 解释两类错误的定义和含义。

详细步骤

  1. 第一类错误:当原假设 H0H_0 为真时,却拒绝了 H0H_0 的错误
  2. 第二类错误:当原假设 H0H_0 为假时,却接受了 H0H_0 的错误
  3. 第一类错误概率α\alpha,即显著性水平
  4. 第二类错误概率β\beta

答案:第一类错误是拒真,第二类错误是受伪

练习 4

设显著性水平 α=0.05\alpha = 0.05,P 值 P=0.03P = 0.03,应该拒绝还是接受原假设?

参考答案

解题思路: 比较 P 值与显著性水平。

详细步骤

  1. P=0.03<α=0.05P = 0.03 < \alpha = 0.05
  2. 根据 P 值法,当 P<αP < \alpha 时拒绝原假设
  3. 因此应该拒绝原假设

答案:拒绝原假设

练习 5

设检验统计量 Z=2.5Z = 2.5,显著性水平 α=0.05\alpha = 0.05,进行双侧检验,应该拒绝还是接受原假设?

参考答案

解题思路: 比较检验统计量与临界值。

详细步骤

  1. 双侧检验的临界值:z0.025=1.96z_{0.025} = 1.96
  2. Z=2.5>1.96|Z| = 2.5 > 1.96
  3. 检验统计量落在拒绝域内
  4. 因此应该拒绝原假设

答案:拒绝原假设