logo
导航

两个正态总体的假设检验

两个正态总体均值差检验

方差已知的情况(Z 检验)

总体XN(μ1,σ12)X \sim N(\mu_1, \sigma_1^2)YN(μ2,σ22)Y \sim N(\mu_2, \sigma_2^2)σ12,σ22\sigma_1^2, \sigma_2^2 已知

假设

  • H0:μ1=μ2H_0: \mu_1 = \mu_2
  • H1:μ1μ2H_1: \mu_1 \neq \mu_2(双侧检验)
  • H1:μ1>μ2H_1: \mu_1 > \mu_2(右单侧检验)
  • H1:μ1<μ2H_1: \mu_1 < \mu_2(左单侧检验)

检验统计量Z=(XY)(μ1μ2)σ12n1+σ22n2N(0,1)Z = \frac{(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0,1)

拒绝域

  • 双侧检验:Z>zα/2|Z| > z_{\alpha/2}
  • 右单侧检验:Z>zαZ > z_{\alpha}
  • 左单侧检验:Z<zαZ < -z_{\alpha}

例 1:某工厂使用两种不同的工艺生产零件,工艺 A 生产的零件长度服从 N(μ1,0.04)N(\mu_1, 0.04),工艺 B 生产的零件长度服从 N(μ2,0.06)N(\mu_2, 0.06)。从工艺 A 中抽取 16 个零件,平均长度为 10.2cm;从工艺 B 中抽取 20 个零件,平均长度为 10.0cm。在显著性水平 α=0.05\alpha = 0.05 下,检验两种工艺生产的零件长度是否有差异。

  1. 提出假设:H0:μ1=μ2H_0: \mu_1 = \mu_2H1:μ1μ2H_1: \mu_1 \neq \mu_2
  2. 检验统计量:Z=(10.210.0)00.0416+0.0620=0.20.0025+0.003=0.20.074=2.70Z = \frac{(10.2 - 10.0) - 0}{\sqrt{\frac{0.04}{16} + \frac{0.06}{20}}} = \frac{0.2}{\sqrt{0.0025 + 0.003}} = \frac{0.2}{0.074} = 2.70
  3. 拒绝域:Z>1.96|Z| > 1.96
  4. 判断:Z=2.70>1.96|Z| = 2.70 > 1.96,拒绝原假设
  5. 结论:两种工艺生产的零件长度有显著差异

方差未知但相等的情况(双样本 T 检验)

总体XN(μ1,σ2)X \sim N(\mu_1, \sigma^2)YN(μ2,σ2)Y \sim N(\mu_2, \sigma^2)σ2\sigma^2 未知但相等

假设

  • H0:μ1=μ2H_0: \mu_1 = \mu_2
  • H1:μ1μ2H_1: \mu_1 \neq \mu_2(双侧检验)
  • H1:μ1>μ2H_1: \mu_1 > \mu_2(右单侧检验)
  • H1:μ1<μ2H_1: \mu_1 < \mu_2(左单侧检验)

检验统计量T=(XY)(μ1μ2)Sp1n1+1n2t(n1+n22)T = \frac{(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)}{S_p\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2)

其中 Sp2=(n11)S12+(n21)S22n1+n22S_p^2 = \frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 - 2} 是合并方差。

拒绝域

  • 双侧检验:T>tα/2(n1+n22)|T| > t_{\alpha/2}(n_1 + n_2 - 2)
  • 右单侧检验:T>tα(n1+n22)T > t_{\alpha}(n_1 + n_2 - 2)
  • 左单侧检验:T<tα(n1+n22)T < -t_{\alpha}(n_1 + n_2 - 2)

例 2:某医院比较两种药物治疗高血压的效果。使用药物 A 治疗 15 名患者,平均血压降低值为 8.5mmHg,样本标准差为 2.1mmHg;使用药物 B 治疗 12 名患者,平均血压降低值为 6.8mmHg,样本标准差为 2.3mmHg。在显著性水平 α=0.05\alpha = 0.05 下,检验两种药物的效果是否有差异。

  1. 提出假设:H0:μ1=μ2H_0: \mu_1 = \mu_2H1:μ1μ2H_1: \mu_1 \neq \mu_2
  2. 合并方差:Sp2=(151)×2.12+(121)×2.3215+122=14×4.41+11×5.2925=4.82S_p^2 = \frac{(15-1) \times 2.1^2 + (12-1) \times 2.3^2}{15 + 12 - 2} = \frac{14 \times 4.41 + 11 \times 5.29}{25} = 4.82
  3. 检验统计量:T=(8.56.8)04.82×(115+112)=1.74.82×0.15=1.70.85=2.00T = \frac{(8.5 - 6.8) - 0}{\sqrt{4.82 \times (\frac{1}{15} + \frac{1}{12})}} = \frac{1.7}{\sqrt{4.82 \times 0.15}} = \frac{1.7}{0.85} = 2.00
  4. 拒绝域:T>t0.025(25)=2.060|T| > t_{0.025}(25) = 2.060
  5. 判断:T=2.00<2.060|T| = 2.00 < 2.060,不拒绝原假设
  6. 结论:两种药物的效果无显著差异

方差未知且不相等的情况(Welch’s T 检验)

总体XN(μ1,σ12)X \sim N(\mu_1, \sigma_1^2)YN(μ2,σ22)Y \sim N(\mu_2, \sigma_2^2)σ12,σ22\sigma_1^2, \sigma_2^2 未知且不相等

假设

  • H0:μ1=μ2H_0: \mu_1 = \mu_2
  • H1:μ1μ2H_1: \mu_1 \neq \mu_2(双侧检验)
  • H1:μ1>μ2H_1: \mu_1 > \mu_2(右单侧检验)
  • H1:μ1<μ2H_1: \mu_1 < \mu_2(左单侧检验)

检验统计量T=(XY)(μ1μ2)S12n1+S22n2t(df)T = \frac{(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}}} \sim t(df)

其中自由度 df=(S12n1+S22n2)2(S12/n1)2n11+(S22/n2)2n21df = \frac{(\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2})^2}{\frac{(S_1^2/n_1)^2}{n_1-1} + \frac{(S_2^2/n_2)^2}{n_2-1}}(Welch-Satterthwaite 公式)。

拒绝域

  • 双侧检验:T>tα/2(df)|T| > t_{\alpha/2}(df)
  • 右单侧检验:T>tα(df)T > t_{\alpha}(df)
  • 左单侧检验:T<tα(df)T < -t_{\alpha}(df)

两个正态总体方差比检验(F 检验)

均值未知的情况

总体XN(μ1,σ12)X \sim N(\mu_1, \sigma_1^2)YN(μ2,σ22)Y \sim N(\mu_2, \sigma_2^2)μ1,μ2\mu_1, \mu_2 未知

假设

  • H0:σ12=σ22H_0: \sigma_1^2 = \sigma_2^2
  • H1:σ12σ22H_1: \sigma_1^2 \neq \sigma_2^2(双侧检验)
  • H1:σ12>σ22H_1: \sigma_1^2 > \sigma_2^2(右单侧检验)
  • H1:σ12<σ22H_1: \sigma_1^2 < \sigma_2^2(左单侧检验)

检验统计量F=S12/σ12S22/σ22=S12S22F(n11,n21)F = \frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} = \frac{S_1^2}{S_2^2} \sim F(n_1-1, n_2-1)

拒绝域

  • 双侧检验:F<F1α/2(n11,n21)F < F_{1-\alpha/2}(n_1-1, n_2-1)F>Fα/2(n11,n21)F > F_{\alpha/2}(n_1-1, n_2-1)
  • 右单侧检验:F>Fα(n11,n21)F > F_{\alpha}(n_1-1, n_2-1)
  • 左单侧检验:F<F1α(n11,n21)F < F_{1-\alpha}(n_1-1, n_2-1)

例 3:某工厂比较两种生产工艺的稳定性。使用工艺 A 生产 10 个产品,样本方差为 0.04;使用工艺 B 生产 12 个产品,样本方差为 0.06。在显著性水平 α=0.05\alpha = 0.05 下,检验两种工艺的稳定性是否有差异。

  1. 提出假设:H0:σ12=σ22H_0: \sigma_1^2 = \sigma_2^2H1:σ12σ22H_1: \sigma_1^2 \neq \sigma_2^2
  2. 检验统计量:F=0.040.06=0.67F = \frac{0.04}{0.06} = 0.67
  3. 拒绝域:F<F0.975(9,11)=0.25F < F_{0.975}(9, 11) = 0.25F>F0.025(9,11)=3.59F > F_{0.025}(9, 11) = 3.59
  4. 判断:0.25<F=0.67<3.590.25 < F = 0.67 < 3.59,不拒绝原假设
  5. 结论:两种工艺的稳定性无显著差异

检验方法的比较

均值差检验方法的比较

Z 检验

  • 适用条件:方差已知
  • 优点:计算简单,不需要查 t 分布表
  • 缺点:需要知道总体方差

双样本 T 检验

  • 适用条件:方差未知但相等
  • 优点:不需要知道总体方差
  • 缺点:需要假设方差相等

Welch’s T 检验

  • 适用条件:方差未知且不相等
  • 优点:不需要假设方差相等
  • 缺点:计算相对复杂

方差比检验的特点

F 检验

  • 检验对象:两个正态总体的方差比
  • 应用场景:比较两种方法的精度、稳定性等
  • 注意事项:对正态性假设敏感

检验的假设条件

正态性假设

重要性:所有检验方法都基于正态性假设。

检验方法

  1. 图形法:Q-Q 图、直方图
  2. 统计检验:Shapiro-Wilk 检验、Kolmogorov-Smirnov 检验

处理非正态数据

  1. 数据变换:对数变换、平方根变换等
  2. 非参数检验:Mann-Whitney U 检验、Kruskal-Wallis 检验等

独立性假设

重要性:样本观测值之间应该相互独立。

检验方法

  1. 时间序列分析:自相关函数
  2. 空间数据分析:空间自相关

方差齐性假设

重要性:双样本 T 检验需要方差相等的假设。

检验方法

  1. F 检验:检验方差比
  2. Levene 检验:对正态性不敏感的方差齐性检验
  3. Brown-Forsythe 检验:基于中位数的方差齐性检验

检验的功效分析

功效函数

定义:功效函数 1β1 - \beta 表示在原假设为假时拒绝原假设的概率。

影响因素

  1. 样本量:样本量越大,功效越高
  2. 显著性水平:显著性水平越高,功效越高
  3. 效应量:效应量越大,功效越高

样本量的确定

问题:给定显著性水平、功效和效应量,确定所需的样本量。

例 4:对于两个正态总体均值差检验,给定显著性水平 α=0.05\alpha = 0.05,功效 1β=0.81 - \beta = 0.8,效应量 d=0.5d = 0.5,求每组样本量 nn

  1. 使用功效分析公式
  2. 查表或使用软件计算
  3. 得到每组 n32n \approx 32

检验的注意事项

多重比较问题

问题:进行多个假设检验时,犯第一类错误的概率会增加。

解决方法

  1. Bonferroni 校正:将显著性水平除以检验次数
  2. Holm 校正:逐步调整显著性水平
  3. FDR 控制:控制错误发现率

效应量

定义:效应量是衡量实际差异大小的指标。

常用效应量

  1. Cohen’s dd=μ1μ2σd = \frac{\mu_1 - \mu_2}{\sigma}
  2. 相关系数r=tt2+dfr = \frac{t}{\sqrt{t^2 + df}}

意义:即使统计上显著,如果效应量很小,实际意义可能不大。

样本量的影响

影响:样本量越大,检验的功效越高,犯第二类错误的概率越小。

原因:样本量越大,估计越精确,更容易检测到真实的差异。

练习题

练习 1

两正态总体方差未知但相等,检验均值差应选用哪种检验?

参考答案

解题思路: 根据检验条件选择合适的检验方法。

详细步骤

  1. 检验两个正态总体均值差
  2. 方差未知但相等
  3. 使用双样本 T 检验
  4. 检验统计量:T=(XY)(μ1μ2)Sp1n1+1n2T = \frac{(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)}{S_p\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}

答案:双样本 T 检验

练习 2

设两总体方差分别为 σ12,σ22\sigma_1^2, \sigma_2^2,检验 H0:σ12=σ22H_0: \sigma_1^2=\sigma_2^2,应选用哪种检验?

参考答案

解题思路: 根据检验对象选择合适的检验方法。

详细步骤

  1. 检验两个正态总体方差比
  2. 使用 F 检验
  3. 检验统计量:F=S12S22F(n11,n21)F = \frac{S_1^2}{S_2^2} \sim F(n_1-1, n_2-1)

答案:F 检验

练习 3

XN(μ1,σ12)X \sim N(\mu_1, \sigma_1^2)YN(μ2,σ22)Y \sim N(\mu_2, \sigma_2^2)σ12,σ22\sigma_1^2, \sigma_2^2 已知,检验 H0:μ1=μ2H_0: \mu_1 = \mu_2,写出检验统计量。

参考答案

解题思路: 使用正态分布的检验统计量。

详细步骤

  1. 检验统计量:Z=(XY)(μ1μ2)σ12n1+σ22n2Z = \frac{(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}}
  2. 在原假设成立的条件下,ZN(0,1)Z \sim N(0,1)

答案Z=(XY)(μ1μ2)σ12n1+σ22n2Z = \frac{(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}}

练习 4

XN(μ1,σ2)X \sim N(\mu_1, \sigma^2)YN(μ2,σ2)Y \sim N(\mu_2, \sigma^2)σ2\sigma^2 未知但相等,检验 H0:μ1=μ2H_0: \mu_1 = \mu_2,写出检验统计量。

参考答案

解题思路: 使用 t 分布的检验统计量。

详细步骤

  1. 检验统计量:T=(XY)(μ1μ2)Sp1n1+1n2T = \frac{(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)}{S_p\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}
  2. 在原假设成立的条件下,Tt(n1+n22)T \sim t(n_1 + n_2 - 2)
  3. 其中 Sp2=(n11)S12+(n21)S22n1+n22S_p^2 = \frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 - 2}

答案T=(XY)(μ1μ2)Sp1n1+1n2T = \frac{(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)}{S_p\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}

练习 5

XN(μ1,σ12)X \sim N(\mu_1, \sigma_1^2)YN(μ2,σ22)Y \sim N(\mu_2, \sigma_2^2)μ1,μ2\mu_1, \mu_2 未知,检验 H0:σ12=σ22H_0: \sigma_1^2 = \sigma_2^2,写出检验统计量。

参考答案

解题思路: 使用 F 分布的检验统计量。

详细步骤

  1. 检验统计量:F=S12S22F = \frac{S_1^2}{S_2^2}
  2. 在原假设成立的条件下,FF(n11,n21)F \sim F(n_1-1, n_2-1)

答案F=S12S22F = \frac{S_1^2}{S_2^2}