一、随机变量
1.1 随机变量的定义
设随机试验的样本空间为 S,若 X=X(e) 为定义在 S 上的实值单值函数,则称 X(e) 为随机变量,简写为 X。
1.2 随机变量的分类
- 离散型随机变量:随机变量 X 的取值为有限个或可数个。
- 连续型随机变量:随机变量 X 的取值为不可数个。
二、分布函数
2.1 分布函数的定义
随机变量 X,对任意实数 x,称函数
F(x)=P(X≤x) 为 X 的概率分布函数,简称分布函数。
2.2 分布函数的性质
- 0≤F(x)≤1;
- F(x) 单调不减;
- F(−∞)=0,F(+∞)=1;
- F(x) 是右连续函数,即 F(x+0)=F(x)。
三、概率密度函数
3.1 概率密度函数的定义
对于随机变量 X 的分布函数 F(x),若存在非负的函数 f(x),使对于任意实数 x 有:
F(x)=∫−∞xf(t)dt 则称 X 为连续型随机变量,其中 f(x) 称为 X 的概率密度函数,简称概率密度。
3.2 概率密度函数的性质
- f(x)≥0;
- ∫−∞+∞f(x)dx=1;
- 对于连续型的随机变量 X,有 P(X∈D)=∫Df(x)dx,∀D⊂R;
- 在 f(x) 的连续点 x,F′(x)=f(x)。
说明
- f(x) 值的含义:当 Δx 充分小时,P(x<X≤x+Δx)≈f(x)⋅Δx;
- f(x) 的值是可以大于 1 的。
四、离散型随机变量
4.1 两点分布
若 X 的概率分布律满足:
P(X=k)=pk(1−p)1−k,k=0,1 其中 0<p<1,就称 X 服从参数为 p 的 0−1 分布(或两点分布),记为 X∼0−1(p) 或 X∼B(1,p)。
应用
一个随机试验,设 A 是一随机事件,且 P(A)=p,(0<p<1)。若仅考虑事件 A 发生与否,就可以定义一个服从参数为 p 的 0−1 分布的随机变量来描述这个随机试验的结果。
只有两个可能结果的试验,称为贝努利试验,故两点分布有时也称贝努利分布。
4.2 二项分布
若 X 的概率分布律满足:
P(X=k)=Cnkpk(1−p)n−k,k=0,1,…,n 其中 n>1,0<p<1,就称 X 服从参数为 n,p 的二项分布,记为 X∼B(n,p)。
4.3 泊松分布
若 X 的概率分布律满足:
P(X=k)=k!λke−λ,k=0,1,2,… 其中 λ>0,就称 X 服从参数为 λ 的泊松分布,记为 X∼π(λ) 或 X∼P(λ)。
应用
如果某事件以固定强度 λ,随机且独立地出现,该事件在单位时间内出现的次数(个数),可以看成是服从泊松分布。
注:当 n>10,p<0.1 时,二项分布 B(n,p) 可以用泊松分布 π(np) 来近似。
4.4 几何分布
若 X 的概率分布律满足:
P(X=k)=p(1−p)1−k,k=1,2,3,… 其中 0<p<1,就称 X 服从参数为 p 的几何分布,记作 X∼G(p)。
应用
在重复多次的贝努利试验中,试验进行到某种结果第一次出现为止,此时的试验总次数服从几何分布。
4.5 超几何分布
若 X 的概率分布律满足:
P(X=k)=CNnCMkCN−Mn−k,k∈{0,1,2,⋯,m} 其中参数是 M,N,n,称 X 服从超几何分布,记作 X∼H(N,n,M)。
应用
它描述了由有限个物件中抽出 n 个物件,成功抽出指定种类的物件的次数(不归还)。
在产品质量的不放回抽检中,若 N 件产品中有 M 件次品,抽检 n 件时所得次品数 X=k,即可由上述概率公式表示。
五、连续型随机变量
5.1 均匀分布
若 X 的概率密度函数为:
f(x)={b−a1,0,x∈(a,b);其他, 其中 a<b,就称 X 服从 (a,b) 上的均匀分布,记为 X∼U(a,b) 或 X∼Unif(a,b)。
性质
均匀分布具有等可能性。即:对于任意的 a<k<k+l<b,均有
P(k<X<k+l)=∫kk+lb−a1dx=b−al 与 k 无关,仅与 l 有关。即:X 落入 (a,b) 中的等长度的任意子区间是等可能的。
计算公式
若 X∼U(a,b),则对于 ∀I⊂R,有
P(X∈I)=∫If(x)dx=(a,b)的长度I∩(a,b)的长度 5.2 指数分布
若 X 的概率密度函数为:
f(x)={λe−λx,0,x>0;x≤0, 其中 λ>0,就称 X 服从参数为 λ 的指数分布,记为 X∼E(λ) 或 X∼Exp(λ)。
其分布函数为
F(x)={1−e−λx,0,x>0;x≤0. 性质
指数分布具有无记忆性。
证明
P(X>t0+t∣X>t0)=P(X>t0)P(X>t0+t,X>t0)=P(X>t0)P(X>t0+t)=1−F(t0)1−F(t0+t)=e−λ(t0)e−λ(t0+t)=e−λt=P(X>t) 应用
- 指数分布可以用来表示独立随机事件发生的时间间隔。
- 在排队论中,一个顾客接受服务的时间长短也可用指数分布来近似。
5.3 正态分布
若 X 的概率密度函数为
f(x)=2πσ1e−2σ2(x−μ)2,−∞<x<+∞ 其中 −∞<μ<+∞,σ>0,就称 X 服从参数为 μ,σ 的正态分布(或高斯分布),记为 X∼N(μ,σ2)。
特征
- f(x) 关于 x=μ 对称;
- 当 x≤μ 时,f(x) 是严格单调递增函数;
- fmax=f(μ)=2πσ1;
- ∣x−μ∣→∞limf(x)=0.
两个参数的含义
- μ 称为位置参数(决定对称轴位置)
- σ 称为尺度参数(决定曲线分散程度)
标准正态分布
若 Z∼N(0,1),称 Z 服从标准正态分布。
- Z 的概率密度函数:φ(z)=2π1e−2z2;
- Z 的分布函数:Φ(z)=∫−∞z2π1e−2t2dt。
注:在标准正态分布中,使用 φ 表示概率密度函数,使用 Φ 表示分布函数。
性质
当 X∼N(μ,σ2) 时,σX−μ∼N(0,1)。
证明
对于任意实数 z,
P(σX−μ≤z)=P(X≤σz+μ)=∫−∞σz+μ2πσ1e−2σ2(t−μ)2dt=∫−∞z2π1e−2s2ds,(s=σt−μ)=Φ(z) 由此可知,当 X∼N(μ,σ2) 时,对于任意实数 a,有
F(a)=P(X≤a)=P(σX−μ≤σa−μ)=Φ(σa−μ) 因此,在计算正态分布的概率时,可将其转化为标准正态,然后利用标准正态分布表来求解。
六、随机变量函数的分布
6.1 求解过程
一般,若已知 X 的概率分布,Y=g(x),求 Y 的概率分布的过程为:先给出 Y 的可能取值,再利用等价事件来给出概率分布。
若 X 为离散型随机变量
- 先写出 Y 的可能取值:y1,y2,…,yi,...;
- 再找出 {Y=yi} 的等价事件 {X∈D};
- 得 P(Y=yi)=P(X∈D)。
若 X 为连续型随机变量
- 先根据 X 的取值范围,给出 Y 的取值范围;
- 然后写出 Y 的概率分布函数
- FY(y)=P(Y≤y);
- 找出 {Y≤y} 的等价事件 {X∈D};
- 得 FY(y)=P(X∈D);
- 再求出 Y 的概率密度函数 fY(y)。
6.2 定理
设随机变量 X∼fX(x),−∞<x<+∞,Y=g(X),g′(x)>0(或 g′(x)<0),则 Y 具有概率密度为:
fY(y)={fX(h(y))⋅∣h′(y)∣,0,α<y<β;其他. 注意
- 这里 (α,β) 是 Y 的取值范围,其中:{α=min{g(−∞),g(+∞)}β=max{g(−∞),g(+∞)}
- h 是 g 的反函数,即 h(y)=x⇔y=g(x)。
一般地,若随机变量 X∼N(μ,σ2),则有:
Y=aX+b⇒Y∼N(aμ+b,a2σ2)