一、总体
总体是指研究对象的全体,个体是指总体中的成员。总体中包含的个体数记为总体的容量。
根据容量的大小可分为有限总体和无限总体,通常将容量非常大的有限总体也按无限总体处理。
二、样本
我们在推断总体分布的未知参数时,采取的方法是从总体中抽取一部分个体,根据这部分个体的数据,利用概率论的知识等作出分析推断。
被抽取的部分个体叫做总体的一个样本。
2.1 简单随机样本
满足以下两个条件的随机样本 (X1,X2,⋯,Xn) 称为容量是 n 的简单随机样本。
- 代表性:每个 Xi 与 X 同分布;
- 独立性:X1,X2,⋯,Xn 是相互独立的随机变量。
说明:后面提到的样本均指简单随机样本。
2.2 简单随机抽样
获得简单随机样本的抽样称为简单随机抽样。
- 对于有限总体,采用放回抽样。
- 当总体容量很大时,放回抽样有时很不方便,因此通常将不放回抽样所得到的样本近似当作简单随机样本来处理。
- 对于无限总体,一般采用不放回抽样。
三、统计量与常用统计量
3.1 统计量
样本的不含任何未知参数的函数,称为统计量。
从样本中提取有用的信息来研究总体的分布及各种特征数的过程,就是构造统计量。
3.2 常用统计量
- 样本均值:X=n1i=1∑nXi;
- 样本方差:S2=n−11i=1∑n(Xi−X)2;
- 样本标准差:S=S2;
- 样本 k 阶矩:Ak=n1i=1∑nXik;
- 样本 k 阶中心矩:Bk=n1i=1∑n(Xi−X)k。
注:方差公式中分母 n−1 保证计算结果是无偏估计。
四、抽样分布
统计量的分布被称为抽样分布,下面将介绍数理统计中三个重要的抽样分布。
4.1 卡方分布
设随机变量 X1,X2,⋯,Xn 相互独立,都服从 N(0,1),则称
χ2=i=1∑nXi2 服从自由度为 n 的 χ2 分布,记为 χ2∼χ2(n)。
概率密度
χ2 分布的概率密度为:
fn(x)={2Γ(n/2)1(2x)2n−1e−2x,0,x>0;x≤0. 其中 Γ(α)=∫0+∞xα−1e−xdx。
上 α 分位数
给定 α,0<α<1,称满足条件 P(χ2>χα2(n))=α 的点 χα2(n) 为 χ2(n) 分布的上 α 分位数。
性质
- 设 χ2∼χ2(n),则 E(χ2)=n,D(χ2)=2n。
- 设 Y1,⋯,Ym 相互独立,Yi∼χ2(ni),则 i=1∑mYi∼χ2(i=1∑mni)。
4.2 t 分布
设 X∼N(0,1),Y∼χ2(n),且 X 和 Y 相互独立,则称随机变量
T=Y/nX 服从自由度为 n 的 t 分布(也称为学生氏分布),记为 T∼t(n)。
概率密度
t(n) 分布的概率密度为:
f(x;n)=nπΓ(2n)Γ(2n+1)(1+nx2)−2n+1,−∞<x<+∞ 特别地,n=1 的 t 分布就是柯西分布。
上 α 分位数
给定 α,0<α<1,称满足条件
∫tα(n)∞f(x;n)dx=α 的点 tα(n) 为 t(n) 分布的上 α 分位数,且 t1−α(n)=−tα(n)。
4.3 F 分布
设 X∼χ2(n1),Y∼χ2(n2),且 X,Y 独立,则称随机变量
F=Y/n2X/n1 服从自由度为 (n1,n2) 的 F 分布,记为 F∼F(n1,n2),其中 n1 为第一自由度,n2 为第二自由度。
概率密度
F(n1,n2) 分布的概率密度为:
f(x;n1,n2)={B(2n1,2n2)1n12n1n22n2x2n1−1(n2+n1x)−2n1+n2,0,x>0;x≤0. 其中 B(a,b)=∫01xa−1(1−x)b−1dx=Γ(a+b)Γ(a)Γ(b)。
上 α 分位数
给定 α,0<α<1,称满足条件
∫Fα(n1,n2)∞f(x;n1,n2)dx=α 的点 Fα(n1,n2) 为 F(n1,n2) 分布的上 α 分位数,且 F1−α(n1,n2)=Fα(n2,n1)1。
性质
若 F∼F(n1,n2),则 F1∼F(n2,n1)。
4.4 正态总体的抽样分布
定理一
设总体 X∼N(μ,σ2),X1,X2,⋯,Xn 是样本,样本均值 X=n1i=1∑nXi,样本方差 S2=n−11i=1∑n(Xi−X)2,则
- X∼N(μ,nσ2);
- σ2(n−1)S2∼χ2(n−1) 且 X 与 S2 相互独立。
定理二
设总体 X∼N(μ,σ2),X1,X2,⋯,Xn 是样本,样本均值 X=n1i=1∑nXi,样本方差 S2=n−11i=1∑n(Xi−X)2,则
S/nX−μ∼t(n−1) 定理三
设样本 (X1,⋯,Xn1) 和 (Y1,⋯,Yn2) 分别来自总体 N(μ1,σ12) 和 N(μ2,σ22),并且它们相互独立,样本均值分别为 X,Y,样本方差分别为 S12,S22,则可以得到下面三个抽样分布:
抽样分布一
F=S22/σ22S12/σ12=S22S12/σ22σ12∼F(n1−1,n2−1) 抽样分布二
n1σ12+n2σ22(X−Y)−(μ1−μ2)∼N(0,1) 抽样分布三
当 σ12=σ22=σ2 时,
Swn11+n21(X−Y)−(μ1−μ2)∼t(n1+n2−2) 其中 Sw2=n1+n2−2(n1−1)S12+(n2−1)S22,Sw=Sw2。
4.5 小结
对于单个正态总体 N(μ,σ2),得到 X,S2 的分布,用于对 μ,σ2 进行推断(区间估计,假设检验)。
对于两个独立正态总体 N(μ1,σ12),N(μ2,σ22),得到 X−Y,S22S12 的分布,用于对 μ1−μ2,σ22σ12 进行推断。