logo
导航

点估计与估计量

点估计的基本概念

点估计的定义

定义:设总体 XX 的分布函数为 F(x;θ)F(x;\theta),其中 θ\theta 是未知参数,θΘ\theta \in \Theta。从总体中抽取样本 X1,X2,,XnX_1, X_2, \dots, X_n,构造统计量 θ^=θ^(X1,X2,,Xn)\hat{\theta} = \hat{\theta}(X_1, X_2, \dots, X_n) 来估计参数 θ\theta,则称 θ^\hat{\theta} 为参数 θ\theta点估计量,简称估计量

估计量与估计值的区别

估计量θ^=θ^(X1,X2,,Xn)\hat{\theta} = \hat{\theta}(X_1, X_2, \dots, X_n) 是随机变量

估计值θ^=θ^(x1,x2,,xn)\hat{\theta} = \hat{\theta}(x_1, x_2, \dots, x_n) 是具体的数值

点估计的直观理解

理解:点估计就是用样本信息来估计总体参数的具体数值。由于样本是随机的,估计量也是随机的,因此我们需要评价估计量的好坏。

估计量的评价标准

无偏性

定义:如果估计量 θ^\hat{\theta} 的期望等于被估计的参数 θ\theta,即: E(θ^)=θE(\hat{\theta}) = \theta 则称 θ^\hat{\theta} 为参数 θ\theta无偏估计量

意义:无偏性意味着估计量的期望值等于真值,从长期来看,估计值不会系统性地偏离真值。

例 1:样本均值 X=1ni=1nXi\overline{X} = \frac{1}{n}\sum_{i=1}^n X_i 是总体均值 μ\mu 的无偏估计量。

证明E(X)=E(1ni=1nXi)=1ni=1nE(Xi)=1nnμ=μE(\overline{X}) = E(\frac{1}{n}\sum_{i=1}^n X_i) = \frac{1}{n}\sum_{i=1}^n E(X_i) = \frac{1}{n} \cdot n\mu = \mu

有效性

定义:设 θ^1\hat{\theta}_1θ^2\hat{\theta}_2 都是参数 θ\theta 的无偏估计量,如果: Var(θ^1)<Var(θ^2)Var(\hat{\theta}_1) < Var(\hat{\theta}_2) 则称 θ^1\hat{\theta}_1θ^2\hat{\theta}_2有效

意义:有效性反映了估计量的精度,方差越小,估计量越精确。

例 2:对于正态总体 N(μ,σ2)N(\mu, \sigma^2),样本均值 X\overline{X} 比单个观测值 X1X_1 更有效。

证明Var(X)=σ2n<σ2=Var(X1)Var(\overline{X}) = \frac{\sigma^2}{n} < \sigma^2 = Var(X_1)

一致性

定义:如果估计量 θ^n\hat{\theta}_n 依概率收敛于参数 θ\theta,即: θ^nPθ\hat{\theta}_n \xrightarrow{P} \theta 则称 θ^n\hat{\theta}_n 为参数 θ\theta一致估计量

意义:一致性意味着当样本量增大时,估计量会越来越接近真值。

例 3:样本均值 Xn\overline{X}_n 是总体均值 μ\mu 的一致估计量。

证明:由大数定律,XnPμ\overline{X}_n \xrightarrow{P} \mu

渐近正态性

定义:如果估计量 θ^n\hat{\theta}_n 的标准化形式趋于正态分布,即: θ^nθVar(θ^n)dN(0,1)\frac{\hat{\theta}_n - \theta}{\sqrt{Var(\hat{\theta}_n)}} \xrightarrow{d} N(0,1) 则称 θ^n\hat{\theta}_n 具有渐近正态性

意义:渐近正态性为构造置信区间和进行假设检验提供了理论基础。

常见分布参数的估计量

正态分布参数估计

总体XN(μ,σ2)X \sim N(\mu, \sigma^2)

均值估计

  • 无偏估计量:μ^=X=1ni=1nXi\hat{\mu} = \overline{X} = \frac{1}{n}\sum_{i=1}^n X_i
  • 性质:无偏、有效、一致

方差估计

  • 无偏估计量:S2=1n1i=1n(XiX)2S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \overline{X})^2
  • 极大似然估计量:σ^2=1ni=1n(XiX)2\hat{\sigma}^2 = \frac{1}{n}\sum_{i=1}^n (X_i - \overline{X})^2

泊松分布参数估计

总体XPoisson(λ)X \sim Poisson(\lambda)

参数估计

  • 无偏估计量:λ^=X=1ni=1nXi\hat{\lambda} = \overline{X} = \frac{1}{n}\sum_{i=1}^n X_i
  • 性质:无偏、有效、一致

指数分布参数估计

总体XExp(λ)X \sim Exp(\lambda)

参数估计

  • 无偏估计量:λ^=1X\hat{\lambda} = \frac{1}{\overline{X}}
  • 极大似然估计量:λ^=1X\hat{\lambda} = \frac{1}{\overline{X}}

均匀分布参数估计

总体XU(a,b)X \sim U(a,b)

参数估计

  • aa 的估计量:a^=min(X1,X2,,Xn)\hat{a} = \min(X_1, X_2, \dots, X_n)
  • bb 的估计量:b^=max(X1,X2,,Xn)\hat{b} = \max(X_1, X_2, \dots, X_n)

估计量的构造方法

矩估计法

思想:令样本矩等于总体矩,解方程得到参数估计量。

步骤

  1. 计算总体矩(用参数表示)
  2. 计算样本矩
  3. 令样本矩等于总体矩
  4. 解方程得到参数估计量

例 4:设 XPoisson(λ)X \sim Poisson(\lambda),用矩估计法估计 λ\lambda

  1. 总体一阶矩:E(X)=λE(X) = \lambda
  2. 样本一阶矩:1ni=1nXi=X\frac{1}{n}\sum_{i=1}^n X_i = \overline{X}
  3. X=λ\overline{X} = \lambda
  4. 得到 λ^=X\hat{\lambda} = \overline{X}

最大似然估计法

思想:选择使样本观测值出现概率最大的参数值作为估计量。

步骤

  1. 构造似然函数 L(θ)=i=1nf(xi;θ)L(\theta) = \prod_{i=1}^n f(x_i;\theta)
  2. 取对数得到对数似然函数 lnL(θ)\ln L(\theta)
  3. 对参数求导并令导数为零
  4. 解方程得到最大似然估计量

例 5:设 XN(μ,σ2)X \sim N(\mu, \sigma^2),用最大似然估计法估计 μ\muσ2\sigma^2

  1. 似然函数:L(μ,σ2)=i=1n12πσe(xiμ)22σ2L(\mu, \sigma^2) = \prod_{i=1}^n \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x_i-\mu)^2}{2\sigma^2}}
  2. 对数似然函数:lnL(μ,σ2)=n2ln(2π)n2ln(σ2)12σ2i=1n(xiμ)2\ln L(\mu, \sigma^2) = -\frac{n}{2}\ln(2\pi) - \frac{n}{2}\ln(\sigma^2) - \frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu)^2
  3. μ\mu 求导:lnLμ=1σ2i=1n(xiμ)=0\frac{\partial \ln L}{\partial \mu} = \frac{1}{\sigma^2}\sum_{i=1}^n (x_i-\mu) = 0
  4. 解得:μ^=X\hat{\mu} = \overline{X}
  5. σ2\sigma^2 求导:lnLσ2=n2σ2+12σ4i=1n(xiμ)2=0\frac{\partial \ln L}{\partial \sigma^2} = -\frac{n}{2\sigma^2} + \frac{1}{2\sigma^4}\sum_{i=1}^n (x_i-\mu)^2 = 0
  6. 解得:σ^2=1ni=1n(xiX)2\hat{\sigma}^2 = \frac{1}{n}\sum_{i=1}^n (x_i-\overline{X})^2

估计量的性质比较

无偏性与有效性

关系:无偏性和有效性是两个不同的评价标准,一个估计量可能无偏但不有效,也可能有效但有偏。

例 6:对于正态总体 N(μ,σ2)N(\mu, \sigma^2)

  • X\overline{X}μ\mu 的无偏估计量
  • 1ni=1nXi2\frac{1}{n}\sum_{i=1}^n X_i^2σ2+μ2\sigma^2 + \mu^2 的无偏估计量,但不是 σ2\sigma^2 的无偏估计量

一致性与有效性

关系:一致性是渐近性质,有效性是有限样本性质。一个估计量可能一致但不有效,也可能有效但不一致。

渐近有效估计量

定义:如果估计量 θ^n\hat{\theta}_n 满足:

  1. 一致性:θ^nPθ\hat{\theta}_n \xrightarrow{P} \theta
  2. 渐近正态性:n(θ^nθ)dN(0,σ2(θ))\sqrt{n}(\hat{\theta}_n - \theta) \xrightarrow{d} N(0, \sigma^2(\theta))
  3. 方差达到克拉美-拉奥下界

则称 θ^n\hat{\theta}_n渐近有效估计量

练习题

练习 1

设总体 XN(μ,σ2)X \sim N(\mu, \sigma^2),样本均值为 X\overline{X},方差为 S2S^2,写出 μ\muσ2\sigma^2 的无偏估计量。

参考答案

解题思路: 使用样本均值和样本方差作为无偏估计量。

详细步骤

  1. μ\mu 的无偏估计量:μ^=X=1ni=1nXi\hat{\mu} = \overline{X} = \frac{1}{n}\sum_{i=1}^n X_i
  2. σ2\sigma^2 的无偏估计量:σ^2=S2=1n1i=1n(XiX)2\hat{\sigma}^2 = S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \overline{X})^2

答案μ^=X\hat{\mu} = \overline{X}σ^2=S2\hat{\sigma}^2 = S^2

练习 2

X1,X2,,XnX_1, X_2, \dots, X_n 是来自总体 XPoisson(λ)X \sim Poisson(\lambda) 的样本,证明样本均值 X\overline{X}λ\lambda 的无偏估计量。

参考答案

解题思路: 使用期望的线性性质。

详细步骤

  1. E(X)=E(1ni=1nXi)=1ni=1nE(Xi)E(\overline{X}) = E(\frac{1}{n}\sum_{i=1}^n X_i) = \frac{1}{n}\sum_{i=1}^n E(X_i)
  2. 由于 XiPoisson(λ)X_i \sim Poisson(\lambda),所以 E(Xi)=λE(X_i) = \lambda
  3. E(X)=1nnλ=λE(\overline{X}) = \frac{1}{n} \cdot n\lambda = \lambda
  4. 因此 X\overline{X}λ\lambda 的无偏估计量

答案:证明完成

练习 3

X1,X2,,XnX_1, X_2, \dots, X_n 是来自总体 XN(μ,σ2)X \sim N(\mu, \sigma^2) 的样本,比较 1ni=1n(XiX)2\frac{1}{n}\sum_{i=1}^n (X_i - \overline{X})^21n1i=1n(XiX)2\frac{1}{n-1}\sum_{i=1}^n (X_i - \overline{X})^2 哪个是 σ2\sigma^2 的无偏估计量。

参考答案

解题思路: 计算两个估计量的期望。

详细步骤

  1. S2=1n1i=1n(XiX)2S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \overline{X})^2
  2. 已知 E(S2)=σ2E(S^2) = \sigma^2,即 1n1i=1n(XiX)2\frac{1}{n-1}\sum_{i=1}^n (X_i - \overline{X})^2 是无偏的
  3. σ^2=1ni=1n(XiX)2\hat{\sigma}^2 = \frac{1}{n}\sum_{i=1}^n (X_i - \overline{X})^2
  4. E(σ^2)=E(n1nS2)=n1nσ2σ2E(\hat{\sigma}^2) = E(\frac{n-1}{n}S^2) = \frac{n-1}{n}\sigma^2 \neq \sigma^2
  5. 因此 1ni=1n(XiX)2\frac{1}{n}\sum_{i=1}^n (X_i - \overline{X})^2 不是无偏估计量

答案1n1i=1n(XiX)2\frac{1}{n-1}\sum_{i=1}^n (X_i - \overline{X})^2 是无偏估计量

练习 4

X1,X2,,XnX_1, X_2, \dots, X_n 是来自总体 XU(0,θ)X \sim U(0, \theta) 的样本,用矩估计法估计参数 θ\theta

参考答案

解题思路: 使用矩估计法,令样本矩等于总体矩。

详细步骤

  1. 总体一阶矩:E(X)=θ2E(X) = \frac{\theta}{2}
  2. 样本一阶矩:X=1ni=1nXi\overline{X} = \frac{1}{n}\sum_{i=1}^n X_i
  3. X=θ2\overline{X} = \frac{\theta}{2}
  4. 解得:θ^=2X\hat{\theta} = 2\overline{X}

答案θ^=2X\hat{\theta} = 2\overline{X}

练习 5

判断估计量 θ^1,θ^2\hat{\theta}_1, \hat{\theta}_2,若 Var(θ^1)<Var(θ^2)Var(\hat{\theta}_1)<Var(\hat{\theta}_2),哪个更有效?

参考答案

解题思路: 比较两个估计量的方差。

详细步骤

  1. 如果 Var(θ^1)<Var(θ^2)Var(\hat{\theta}_1) < Var(\hat{\theta}_2)
  2. 且两个估计量都是无偏的
  3. θ^1\hat{\theta}_1θ^2\hat{\theta}_2 更有效

答案θ^1\hat{\theta}_1 更有效