一、估计量的评价标准
1.1 无偏性准则
若参数 θ 的估计量 θ^=θ^(X1,⋯,Xn),满足
E(θ^)=θ 则称 θ^ 是 θ 的一个无偏估计量。
- 若 E(θ^)=θ,那么 ∣E(θ^)−θ∣ 称为估计量 θ^ 的偏差;
- 若 n→∞limE(θ^)=θ,则称 θ^ 是 θ 的渐近无偏估计量。
统计意义
无偏性的统计意义是指在大量重复试验下,由 θ^(X1,⋯,Xn) 给出的估计的平均恰好是 θ,从而无偏性保证了 θ^ 没有系统误差。
纠偏方法
如果 E(θ^)=aθ+b,θ∈Θ,其中 a,b 是常数,且 a=0,则 a1(θ^−b) 是 θ 的无偏估计。
1.2 有效性准则
设 θ1^,θ2^ 是 θ 的两个无偏估计,如果 D(θ1^)≤D(θ2^),对于一切 θ∈Θ 成立,且不等号至少对某一 θ∈Θ 成立,则称 θ1^ 比 θ2^ 有效。
即:方差较小的无偏估计量是一个更有效的估计量。
1.3 均方误差准则
设 θ^ 是参数 θ 的点估计,方差存在,则称 E(θ^−θ)2 是估计量 θ^ 的均方误差,记为 Mse(θ^)。若 θ^ 是 θ 的无偏估计,则有 Mse(θ^)=D(θ^)。
设 θ1^,θ2^ 是 θ 的点估计,如果 Mse(θ1^)≤Mse(θ2^),对于一切 θ∈Θ 成立,且不等号至少对某一 θ∈Θ 成立,则称在均方误差准则下 θ1^ 优于 θ2^。
在实际应用中,均方误差准则比无偏性准则更重要。
1.4 相合性准则
设 θ^(X1,⋯,Xn) 为参数 θ 的估计量,若对于任意 θ∈Θ,当 n→+∞ 时,
θn^Pθ 即 ∀ε>0,有 n→∞limP{∣θn^−θ∣≥ε}=0 成立,则称 θn^ 为 θ 的相合估计量或一致估计量。
二、点估计
设总体 X 的分布函数的形式已知,但它的一个或多个参数未知。
借助于总体 X 的一个样本来估计总体未知参数的值的问题称为参数的点估计问题。
2.1 矩估计
统计思想
以样本矩估计总体矩,以样本矩的函数估计总体矩的函数。
理论基础
辛钦大数定律和依概率收敛的性质。
假设 μj=E(Xj),j=1,⋯,k 存在,则
μj^=Aj=n1i=1∑nXij,j=1,⋯,kPμj, j=1,⋯,k h^(μ1,⋯,μk)=h(A1,⋯,Ak)Ph(μ1,⋯,μk) 计算步骤
设总体有 k 个未知参数 θ1,⋯,θk, X1,⋯,Xk 是来自总体 X 的样本,假设总体的前 k 阶矩存在,则矩估计的步骤为:
- 建立 (θ1,⋯,θk) 与 (μ1,⋯,μk) 的联系:求总体前 k 阶矩关于 k 个参数的函数。
μi=E(Xi)=hi(θ1,⋯,θk), i=1,⋯,k - 求各参数关于 k 阶矩的反函数。
θi=gi(μ1,⋯,μk), i=1,⋯,k - 以样本各阶矩 A1,⋯,Ak 代替总体 X 各阶矩 μ1,⋯,μk,得各参数得矩估计。
θi^=gi(A1,⋯,Ak), i=1,⋯,k 在实际应用中,为求解方便,也可用总体中心矩 vi 替换总体原点矩 μi,相应的,以样本中心矩 Bi 估计总体中心矩 vi。
注:采用的矩不同,得出的矩估计也可能不同。
2.2 极大似然估计
离散型
设离散型总体 X∼p(x;θ),θ∈Θ,θ 未知,X1,⋯,Xn 为样本,其观察值为 x1,⋯,xn,则事件 {X=x1,⋯,Xn=xn} 发生的概率为
似然函数:L(θ)=i=1∏np(xi;θ) 极大似然原理:L(θ^(x1,⋯,xn))=θ∈ΘmaxL(θ) θ^(x1,⋯,xn) 称为 θ 的极大似然估计值,相应统计量 θ^(X1,⋯,Xn) 称为 θ 的极大似然估计量(MLE)。
连续型
设连续型总体 X 的概率密度为 f(x;θ),θ∈Θ,θ 未知,X1,⋯,Xn 为样本,则样本在观察值 (x1,x2,⋯,xn) 邻域发生的概率 i=1∏nP(xi<Xi<xi+Δxi)≈i=1∏nf(xi;θ)Δxi,其中 Δxi 与参数 θ 无关,因此
似然函数:L(θ)=i=1∏nf(xi;θ) 极大似然原理:L(θ^(x1,⋯,xn))=θ∈ΘmaxL(θ) 说明
- 未知参数可能不是一个,设为 θ=(θ1,θ2,⋯,θk)。
- 求 L(θ) 的最大值时,可转换为求 lnL(θ) 的最大值,lnL(θ) 称为对数似然函数。
- 若 L(θ) 关于某个 θi 是单调增(减)函数,则 θi 的极大似然估计值为 θi 的最大(小)值(与样本有关)。
- 若 θ^ 是 θ 的极大似然估计,则 g(θ) 的极大似然估计为 g(θ^)。
三、区间估计
根据具体样本观测值,点估计提供了一个明确的数值。
但这种判断的把握有多大,点估计本身并没有告诉人们,为了弥补这种不足,提出了区间估计的概念。
3.1 置信区间与置信限
设总体 X 的分布函数 F(x;θ),θ 未知,对给定值 α(0<α<1),有两个统计量 θ^L=θ^L(X1,⋯,Xn),θ^U=θ^U(X1,⋯,Xn),使得
P{θ^L(X1,⋯,Xn)<θ<θ^U(X1,⋯,Xn)}≥1−α (θ^L,θ^U) 称为 θ 的置信水平为 1−α 的双侧置信区间;θ^L 和 θ^U 分别称为双侧置信下限和双侧置信下限。
- 如果 P{θ^L(X1,⋯,Xn)<θ}≥1−α,则 θ^L 称为参数 θ 的置信水平为 1−α 的单侧置信下限。
- 如果 P{θ<θ^U(X1,⋯,Xn)}≥1−α,则 θ^U 称为参数 θ 的置信水平为 1−α 的单侧置信上限。
说明
参数 θ 虽然未知,但是是确定的值。
θ^L,θ^U 是统计量,随机的,依赖于样本,因此样本不同,算出的置信区间 (θ^L,θ^U) 也不同。
一般地,P{θ^L(X1,⋯,Xn)<θ<θ^U(X1,⋯,Xn)}=1−α,则置信区间 (θ^L,θ^U) 的含义为:
反复抽样多次(各次样本容量都为 n),每个样本值确定一个区间 (θ^L,θ^U) ,每个这样的区间或包含 θ 的真值,或不包含 θ 的真值。按伯努利大数定律,在这些区间中,包含 θ 真值的比例约为 1−α。
3.2 精确度与误差限
我们称置信区间 (θ^L,θ^U) 的平均长度 E(θ^U−θ^L) 为区间的精确度,精确度的一半为误差限。
在给定的样本容量下,置信水平和精确度是相互制约的。即:
Neyman 原则
在置信水平达到 1−α 的置信区间中,选精确度尽可能高(区间长度较短)的置信区间。
3.3 枢轴量
设总体 X 有概率密度(或分布律)f(x;θ),其中 θ 是待估的未知参数,设 X1,⋯,Xn 是一样本,记
G=G(X1,⋯,Xn;θ) 为样本和待估参数 θ 的函数,如果 G 的分布已知,不依赖于任何未知参数,则称 G 为枢轴量。
枢轴量和统计量的区别
- 枢轴量是样本和待估参数的函数,其分布不依赖于任何未知参数。
- 统计量只是样本的函数,其分布常依赖于未知参数。
四、正态总体的区间估计
设总体 X∼N(μ,σ2),X1,X2,⋯,Xn 为样本,X 和 S2 分别为样本均值和样本方差,置信水平为 1−α。
4.1 期望的置信区间
σ2 已知
σ2 已知时,取枢轴量 G=σ/nX−μ∼N(0,1),设常数 a<b 满足:
P{a<G<b}≥1−α 等价于
P{X−nσb<μ<X−nσ}≥1−α 此时区间长度为 (b−a)nσ,由正态分布的对称性可知,a=−b=−zα/2 时,区间长度达到最短 L=2zα/2nσ。
n 固定,置信水平提高,即 (1−α) 增大,则 zα/2 增大,所以 L 变大,精确度降低;反之亦然。
故此时 μ 的双侧置信区间为:
(X−nσzα/2,X+nσzα/2) 单侧置信下限为 X−nσzα,单侧置信上限为 X+nσzα。
σ2 未知
以 S2 估计 σ2,得枢轴量 G=S/nX−μ∼t(n−1),由 −tα/2(n−1)<G<tα/2(n−1) 解得
X−nStα/2(n−1)<μ<X+nStα/2(n−1) 故此时 μ 的双侧置信区间为:
(X−nStα/2(n−1),X+nStα/2(n−1)) 单侧置信下限为 X−nStα(n−1),单侧置信上限为 X+nStα(n−1)。
4.2 方差的置信区间
μ 已知
μ 已知时,取枢轴量 G=σ21∑i=1n(Xi−μ)2∼χ2(n),由 χ1−α/22(n−1)<G<χα/22(n−1) 解得
χα/22(n)∑i=1n(Xi−μ)2<σ2<χ1−α/22(n)∑i=1n(Xi−μ)2 故此时 σ2 的双侧置信区间为:
(χα/22(n)∑i=1n(Xi−μ)2,χ1−α/22(n)∑i=1n(Xi−μ)2) 单侧置信下限为 χα/22(n)∑i=1n(Xi−μ)2,单侧置信上限为 χ1−α/22(n)∑i=1n(Xi−μ)2。
μ 未知
以 σ2 估计 S2,得枢轴量 G=σ2(n−1)S2∼χ2(n−1),由 χ1−α/22(n−1)<G<χα/22(n−1) 解得
χα/22(n−1)(n−1)S2<σ2<χ1−α/22(n−1)(n−1)S2 故此时 σ2 的双侧置信区间为:
(χα/22(n−1)(n−1)S2,χ1−α/22(n−1)(n−1)S2) 单侧置信下限为 χα/22(n−1)(n−1)S2,单侧置信上限为 χ1−α/22(n−1)(n−1)S2。
4.3 置信区间的总结
待估参数μμσ2σ2其它参数情况σ2已知σ2未知μ已知μ未知估计函数及其分布σ/nX−μ∼N(0,1)S/nX−μ∼t(n−1)σ21i=1∑n(Xi−μ)2∼χ2(n)σ2(n−1)S2∼χ2(n−1)置信区间(X±nσzα/2)(X±nStα/2(n−1))⎝⎜⎜⎜⎜⎜⎛χα/22(n)i=1∑n(Xi−μ)2,χ1−α/22(n)i=1∑n(Xi−μ)2⎠⎟⎟⎟⎟⎟⎞(χα/22(n−1)(n−1)S2,χ1−α/22(n−1)(n−1)S2)