矩估计法与最大似然估计法
矩估计法
矩估计法的基本思想
思想:矩估计法是基于样本矩与总体矩相等的原理来估计参数的方法。其核心思想是用样本矩来估计总体矩,然后通过总体矩与参数的关系来估计参数。
矩估计法的理论基础
理论基础:由大数定律,当样本量足够大时,样本矩会依概率收敛于总体矩,即:
n1∑i=1nXikPE(Xk)
矩估计法的步骤
步骤:
- 确定参数个数:设总体分布有 k 个未知参数 θ1,θ2,…,θk
- 计算总体矩:计算总体的一阶矩到 k 阶矩,用参数表示
- 计算样本矩:计算样本的一阶矩到 k 阶矩
- 建立方程:令样本矩等于总体矩,建立 k 个方程
- 解方程:解这 k 个方程,得到参数估计量
矩估计法的优缺点
优点:
- 计算简单,易于理解
- 不需要知道总体分布的具体形式
- 适用于各种分布
缺点:
- 可能不是最优估计量
- 对于某些分布,矩估计量可能不存在
- 高阶矩的计算可能不稳定
矩估计法的实例
例 1:正态分布参数估计
总体:X∼N(μ,σ2)
步骤:
- 总体一阶矩:E(X)=μ
- 总体二阶矩:E(X2)=μ2+σ2
- 样本一阶矩:n1∑i=1nXi=X
- 样本二阶矩:n1∑i=1nXi2
- 建立方程:
- X=μ
- n1∑i=1nXi2=μ2+σ2
- 解得:
- μ^=X
- σ^2=n1∑i=1nXi2−X2=n1∑i=1n(Xi−X)2
例 2:泊松分布参数估计
总体:X∼Poisson(λ)
步骤:
- 总体一阶矩:E(X)=λ
- 样本一阶矩:n1∑i=1nXi=X
- 建立方程:X=λ
- 解得:λ^=X
例 3:指数分布参数估计
总体:X∼Exp(λ)
步骤:
- 总体一阶矩:E(X)=λ1
- 样本一阶矩:n1∑i=1nXi=X
- 建立方程:X=λ1
- 解得:λ^=X1
例 4:均匀分布参数估计
总体:X∼U(a,b)
步骤:
- 总体一阶矩:E(X)=2a+b
- 总体二阶矩:E(X2)=3a2+ab+b2
- 样本一阶矩:n1∑i=1nXi=X
- 样本二阶矩:n1∑i=1nXi2
- 建立方程:
- X=2a+b
- n1∑i=1nXi2=3a2+ab+b2
- 解得:
- a^=X−3(n1∑i=1nXi2−X2)
- b^=X+3(n1∑i=1nXi2−X2)
最大似然估计法
最大似然估计法的基本思想
思想:最大似然估计法是基于”最可能产生观测样本的参数值就是真值”的思想。它选择使样本观测值出现概率最大的参数值作为估计量。
似然函数
定义:设总体 X 的概率密度函数为 f(x;θ),样本为 X1,X2,…,Xn,则似然函数定义为:
L(θ)=∏i=1nf(Xi;θ)
离散情况:如果 X 是离散随机变量,概率函数为 P(X=x;θ),则:
L(θ)=∏i=1nP(X=Xi;θ)
最大似然估计法的步骤
步骤:
- 构造似然函数:L(θ)=∏i=1nf(Xi;θ)
- 取对数:lnL(θ)=∑i=1nlnf(Xi;θ)
- 求导:∂θ∂lnL(θ)=0
- 解方程:解上述方程得到最大似然估计量
最大似然估计法的性质
性质 1:不变性
如果 θ^ 是 θ 的最大似然估计量,g(θ) 是 θ 的函数,则 g(θ^) 是 g(θ) 的最大似然估计量。
性质 2:渐近性质
在正则条件下,最大似然估计量具有:
- 一致性:θ^nPθ
- 渐近正态性:n(θ^n−θ)dN(0,I−1(θ))
- 渐近有效性:方差达到克拉美-拉奥下界
最大似然估计法的实例
例 1:正态分布参数估计
总体:X∼N(μ,σ2)
步骤:
- 似然函数:
L(μ,σ2)=∏i=1n2πσ1e−2σ2(Xi−μ)2
- 对数似然函数:
lnL(μ,σ2)=−2nln(2π)−2nln(σ2)−2σ21∑i=1n(Xi−μ)2
- 对 μ 求导:
∂μ∂lnL=σ21∑i=1n(Xi−μ)=0
- 解得:μ^=X
- 对 σ2 求导:
∂σ2∂lnL=−2σ2n+2σ41∑i=1n(Xi−μ)2=0
- 解得:σ^2=n1∑i=1n(Xi−X)2
例 2:泊松分布参数估计
总体:X∼Poisson(λ)
步骤:
- 似然函数:
L(λ)=∏i=1nXi!λXie−λ
- 对数似然函数:
lnL(λ)=∑i=1n(Xilnλ−λ−lnXi!)=lnλ∑i=1nXi−nλ−∑i=1nlnXi!
- 求导:
∂λ∂lnL=λ1∑i=1nXi−n=0
- 解得:λ^=X
例 3:指数分布参数估计
总体:X∼Exp(λ)
步骤:
- 似然函数:
L(λ)=∏i=1nλe−λXi=λne−λ∑i=1nXi
- 对数似然函数:
lnL(λ)=nlnλ−λ∑i=1nXi
- 求导:
∂λ∂lnL=λn−∑i=1nXi=0
- 解得:λ^=∑i=1nXin=X1
例 4:伯努利分布参数估计
总体:X∼B(1,p)
步骤:
- 似然函数:
L(p)=∏i=1npXi(1−p)1−Xi=p∑i=1nXi(1−p)n−∑i=1nXi
- 对数似然函数:
lnL(p)=∑i=1nXilnp+(n−∑i=1nXi)ln(1−p)
- 求导:
∂p∂lnL=p∑i=1nXi−1−pn−∑i=1nXi=0
- 解得:p^=n1∑i=1nXi=X
两种方法的比较
计算复杂度
矩估计法:计算简单,只需要计算样本矩
最大似然估计法:计算相对复杂,需要求导和解方程
估计效果
矩估计法:可能不是最优估计量
最大似然估计法:在正则条件下是最优估计量
适用性
矩估计法:适用于各种分布,不需要知道具体形式
最大似然估计法:需要知道分布的具体形式
渐近性质
矩估计法:具有一致性,但不一定具有渐近有效性
最大似然估计法:具有一致性、渐近正态性和渐近有效性
练习题
练习 1
用矩估计法估计参数:已知样本 x1,x2,…,xn 来自 X∼Poisson(λ)。
参考答案
解题思路:
使用矩估计法,令样本矩等于总体矩。
详细步骤:
- 总体一阶矩:E(X)=λ
- 样本一阶矩:n1∑i=1nxi=x
- 令 x=λ
- 解得:λ^=x
答案:λ^=x
练习 2
用最大似然估计法估计参数:已知样本 x1,x2,…,xn 来自 X∼N(μ,σ2)。
参考答案
解题思路:
使用最大似然估计法,构造似然函数并求导。
详细步骤:
- 似然函数:L(μ,σ2)=∏i=1n2πσ1e−2σ2(xi−μ)2
- 对数似然函数:lnL(μ,σ2)=−2nln(2π)−2nln(σ2)−2σ21∑i=1n(xi−μ)2
- 对 μ 求导:∂μ∂lnL=σ21∑i=1n(xi−μ)=0
- 解得:μ^=x
- 对 σ2 求导:∂σ2∂lnL=−2σ2n+2σ41∑i=1n(xi−μ)2=0
- 解得:σ^2=n1∑i=1n(xi−x)2
答案:μ^=x,σ^2=n1∑i=1n(xi−x)2
练习 3
设 X1,X2,…,Xn 是来自总体 X∼U(0,θ) 的样本,用矩估计法估计参数 θ。
参考答案
解题思路:
使用矩估计法,令样本矩等于总体矩。
详细步骤:
- 总体一阶矩:E(X)=2θ
- 样本一阶矩:X=n1∑i=1nXi
- 令 X=2θ
- 解得:θ^=2X
答案:θ^=2X
练习 4
设 X1,X2,…,Xn 是来自总体 X∼Exp(λ) 的样本,用最大似然估计法估计参数 λ。
参考答案
解题思路:
使用最大似然估计法,构造似然函数并求导。
详细步骤:
- 似然函数:L(λ)=∏i=1nλe−λXi=λne−λ∑i=1nXi
- 对数似然函数:lnL(λ)=nlnλ−λ∑i=1nXi
- 求导:∂λ∂lnL=λn−∑i=1nXi=0
- 解得:λ^=∑i=1nXin=X1
答案:λ^=X1
练习 5
比较矩估计法和最大似然估计法的优缺点。
参考答案
解题思路:
从计算复杂度、估计效果、适用性等方面比较。
详细步骤:
-
计算复杂度:
- 矩估计法:计算简单,只需要计算样本矩
- 最大似然估计法:计算相对复杂,需要求导和解方程
-
估计效果:
- 矩估计法:可能不是最优估计量
- 最大似然估计法:在正则条件下是最优估计量
-
适用性:
- 矩估计法:适用于各种分布,不需要知道具体形式
- 最大似然估计法:需要知道分布的具体形式
-
渐近性质:
- 矩估计法:具有一致性,但不一定具有渐近有效性
- 最大似然估计法:具有一致性、渐近正态性和渐近有效性
答案:矩估计法计算简单但效果可能不如最大似然估计法,最大似然估计法计算复杂但效果更好