多元随机变量及其分布

2021-07-17 数学基础 概率论

# 一、二元离散型随机变量

# 1.1 联合分布律

(X,Y)(X,Y) 所有可能取值为 (xi,yj)(x_i,y_j),则称

P(X=xi,Y=yj)=piji,j=1,2,P(X=x_i,Y=y_j)=p_{ij}(i,j=1,2,\dots)

为二元离散型随机变量 (X,Y)(X,Y) 的联合概率分布律,也可简称为 (X,Y)(X,Y) 的分布律。

性质

  • pij>0p_{ij}\gt{0}
  • i=1j=1pij=1\sum\limits_{i=1}^{\infty}\sum\limits_{j=1}^{\infty}p_{ij}=1
  • P((X,Y)D)=(xi,yj)DpijP((X,Y)\in{D})=\sum\limits_{(x_i,y_j)\in{D}}p_{ij}

# 1.2 边际分布律

对于离散型随机变量 (X,Y)(X,Y),分布律为 P(X=xi,Y=yj)=pijP(X=x_i,Y=y_j)=p_{ij}i,j=1,2,i,j=1,2,\dots,则 XX 的边际分布律为:

P(X=xi)=P(X=xi,j=1(Y=yj))=j=1pij=记为piP(X=x_i)=P(X=x_i,\bigcup_{j=1}^{\infty}(Y=y_j))=\sum_{j=1}^{\infty}p_{ij}\overset{记为}{=}p_{i\cdot}

注:记号 pip_{i\cdot} 表示是由 pijp_{ij} 关于 jj 求和后得到的。

# 1.3 条件分布律

(X,Y)(X,Y) 是二元离散型随机变量,对于固定的 yjy_j,若 P(Y=yj)>0P(Y=y_j)>0,则称:

P(X=xiY=yj)=P(X=xi,Y=yj)P(Y=yj)P(X=x_i|Y=y_j)=\frac{P(X=x_i,Y=y_j)}{P(Y=y_j)}

为在 Y=yjY=y_j 条件下,随机变量 XX 的条件分布律。

# 二、二元连续型随机变量

# 2.1 联合概率密度

对于二元随机变量 (X,Y)(X,Y) 的分布函数 F(x,y)F(x,y),如果存在非负函数 f(x,y)f(x,y),使对于任意 x,yx,y,有

F(x,y)=xyf(u,v)dudvF(x,y)=\int_{-\infty}^{x}\int_{-\infty}^{y}f(u,v)\mathrm{d}u\mathrm{d}v

(X,Y)(X,Y) 为二元连续型随机变量,并称 f(x,y)f(x,y) 为二元随机变量 (X,Y)(X,Y) 的(联合)概率密度(函数)。

性质

  • f(x,y)0f(x,y)\ge{0}
  • ++f(x,y)dxdy=1\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}x\mathrm{d}y=1
  • DDxoyxoy 平面上的区域,P((X,Y)D)=Df(x,y)dxdyP((X,Y)\in{D})=\iint\limits_{D}f(x,y)\mathrm{d}x\mathrm{d}y
  • f(x,y)f(x,y) 的连续点 (x,y)(x,y),有 2F(x,y)xy=f(x,y)\frac{\partial^2F(x,y)}{\partial{x}\partial{y}}=f(x,y)

# 2.2 边际概率密度

对于连续型随机变量 (X,Y)(X,Y),概率密度为 f(x,y)f(x,y),则 X,YX,Y 的边际概率密度为:

fX(x)=+f(x,y)dyf_X(x)=\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}y
fY(y)=+f(x,y)dxf_Y(y)=\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}x

# 2.3 条件概率密度

设二元随机变量 (X,Y)(X,Y) 的概率密度为 f(x,y)f(x,y)X,YX,Y 关于 YY 的边际概率密度为 fY(y)f_Y(y),若对于固定的 yyfY(y)>0f_Y(y)>0,且 fY(y)f_Y(y) 连续,则在 Y=yY=y 的条件下,XX 的条件概率密度为:

fXY(xy)=f(x,y)fY(y)f_{X|Y}(x|y)=\frac{f(x,y)}{f_Y(y)}

同理,若对于固定的 xxfX(x)>0f_X(x)>0,且 fX(x)f_X(x) 连续,则在 X=xX=x 的条件下,YY 的条件概率密度为:

fYX(yx)=f(x,y)fX(x)f_{Y|X}(y|x)=\frac{f(x,y)}{f_X(x)}

# 三、二元随机变量分布函数

# 3.1 联合分布函数

(X,Y)(X,Y) 是二元随机变量,对于任意实数 x,yx,y,二元函数

F(x,y)=P{(Xx)(Yy)}=记为P(Xx,Yy)F(x,y)=P\{(X\le{x})\cap{(Y\le{y})}\}\overset{记为}{=}P(X\le{x},Y\le{y})

称为二元随机变量 (X,Y)(X,Y) 的联合分布函数。

性质

F(x,y)F(x,y) 关于 x,yx,y 单调不减,即:

x1<x2F(x1,y)F(x2,y)y1<y2F(x,y1)F(x,y2)x_1<x_2\Rightarrow{F(x_1,y)\le{F(x_2,y)}},y_1<y_2\Rightarrow{F(x,y_1)\le{F(x,y_2)}}

0F(x,y)10\le{F(x,y)}\le{1}F(+,+)=1F(+\infty,+\infty)=1,对任意 x,yx,y 有:

F(,y)=F(x,)=F(,)=0F(-\infty,y)=F(x,-\infty)=F(-\infty,-\infty)=0

F(x,y)F(x,y) 关于 x,yx,y 右连续,即:

limε0+F(x+ε,y)=limε0+F(x,y+ε)=F(x,y)\lim\limits_{\varepsilon\rightarrow{0^{+}}}F(x+\varepsilon,y)=\lim\limits_{\varepsilon\rightarrow{0^{+}}}F(x,y+\varepsilon)=F(x,y)

x1<x2,y1<y2x_1<x_2,y_1<y_2,则有:

P(x1<Xx2,y1<Yy2)=F(x2,y2)F(x1,y2)F(x2,y1)+F(x1,y1)0P(x_1<X\le{x_2},y_1<Y\le{y_2})=F(x_2,y_2)-F(x_1,y_2)-F(x_2,y_1)+F(x_1,y_1)\ge{0}

# 3.2 边际分布函数

二元随机变量 (X,Y)(X,Y) 作为整体,有其联合分布函数 F(x,y)F(x,y)XXYY 也有它们自己的分布函数,分别记为:FX(x)F_X(x)FY(y)F_Y(y),并称它们为边际分布函数。

FX(x)=F(x,+)=limyF(x,y)F_X(x)=F(x,+\infty)=\lim_{y\rightarrow{\infty}}F(x,y)
FY(y)=F(+,y)=limxF(x,y)F_Y(y)=F(+\infty,y)=\lim_{x\rightarrow\infty}F(x,y)

# 3.3 条件分布函数

P(Y=y)>0P(Y=y)>0,则在 Y=yY=y 条件下,XX 的条件分布函数为:

FXY(xy)=P(XxY=y)=P(Xx,Y=y)P(Y=y)F_{X|Y}(x|y)=P(X\le{x}|Y=y)=\frac{P(X\le{x},Y=y)}{P(Y=y)}

P(Y=y)=0P(Y=y)=0,但对任一 ε>0\varepsilon>0P(y<Yy+ε)>0P(y<Y\le{y+\varepsilon})>0,则在 Y=yY=y 条件下,XX 的条件分布函数为:

FXY(xy)=limε0+P(Xxy<Yy+ε)=limε0+P(Xx,y<Yy+ε)P(y<Yy+ε)=记为P(XxY=y)F_{X|Y}(x|y)=\lim_{\varepsilon\rightarrow{0^+}}P(X\le{x}|y<Y\le{y+\varepsilon})=\lim_{\varepsilon\rightarrow{0^+}}\frac{P(X\le{x},y<Y\le{y+\varepsilon})}{P(y<Y\le{y+\varepsilon})}\overset{记为}{=}P(X\le{x}|Y=y)

即:FXY(xy)=P(XxY=y)F_{X|Y}(x|y)=P(X\le{x}|Y=y)

# 四、二元均匀分布

若二元随机变量 (X,Y)(X,Y) 的概率密度在平面上的一个有界区域 DD 内是常数,而在其余地方取值为零,称 (X,Y)(X,Y)DD 上服从均匀分布。则

f(x,y)={1A,(x,y)D;0,其他.f(x,y)=\left\{\begin{array}{c}\frac{1}{A},&(x,y)\in{D};\\0,&其他.\\\end{array}\right.

其中 AA 为区域 DD 的面积。

性质

二元均匀分布的条件分布仍为均匀分布。

# 五、二元正态分布

设二元随机变量 (X,Y)(X,Y) 的概率密度为:

f(x,y)=12πσ1σ21ρ2exp{12(1ρ2)[(xμ1)2σ122ρ(xμ1)(yμ2)σ1σ2+(yμ2)2σ22]}f(x,y)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}\exp\left\{\frac{-1}{2(1-\rho^2)}\left[\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}\right]\right\}

其中 μ1,μ2,σ1>0,σ2>0,1<ρ<1\mu_1,\mu_2,\sigma_1>0,\sigma_2>0,-1<\rho<1 都是常数,称 (X,Y)(X,Y) 为服从参数为 μ1,μ2,σ1,σ2,ρ\mu_1,\mu_2,\sigma_1,\sigma_2,\rho 的二元正态分布。记为:

(X,Y)N(μ1,μ2,σ12,σ22,ρ)(X,Y)\sim{N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)}

性质

二元正态分布的两个边际分布都是一元正态分布,并且都不依赖于参数 ρ\rho

X=xX=x 条件下,YY 的条件分布仍是正态分布,即

YX=yN(μ2+ρσ2σ1(xμ1),(1ρ2)σ22)Y|X=y\sim{N(\mu_2+\rho\frac{\sigma_2}{\sigma_1}(x-\mu_1),(1-\rho^2)\sigma_2^2)}

# 六、随机变量的独立性

# 6.1 独立性定义

F(x,y)F(x,y) 是二元随机变量 (X,Y)(X,Y) 的分布函数,FX(x)F_X(x)XX 的边际分布函数,FY(y)F_Y(y)YY 的边际分布函数,若对所有 x,yx,yP(Xx,Yy)=P(Xx)P(Yy)P(X\le{x},Y\le{y})=P(X\le{x})P(Y\le{y}),即:

F(x,y)=FX(x)FY(y)F(x,y)=F_X(x)F_Y(y)

称随机变量 X,YX,Y 相互独立。

# 6.2 独立性等价判断

离散型

用分布律判断。对一切 i,ji,j 都满足:

P(X=xi,Y=yj)=P(X=xi)P(Y=yj)P(X=x_i,Y=y_j)=P(X=x_i)P(Y=y_j)

连续型

用密度函数判断。对在平面的点 (x,y)(x,y) 几乎处处成立:

f(x,y)=fX(x)fY(y)f(x,y)=f_X(x)f_Y(y)

即在平面上除去“面积”为零的集合后,上述等式处处成立。

# 七、随机变量函数的分布

# 7.1 连续型随机变量 Z=X+Y 的分布

卷积公式

XXYY 相互独立时,Z=X+YZ=X+Y 的密度函数公式称为卷积公式,即:

fZ(z)=+fX(zy)fY(y)dy=+fX(x)fY(zx)dxf_Z(z)=\int_{-\infty}^{+\infty}f_X(z-y)f_Y(y)\mathrm{d}y=\int_{-\infty}^{+\infty}f_X(x)f_Y(z-x)\mathrm{d}x

推广结论

X,YX,Y 相互独立,XN(μ1,σ12)X\sim{N(\mu_1,\sigma_1^2)}YN(μ2,σ22)Y\sim{N(\mu_2,\sigma_2^2)},则

Z=X+YN(μ1+μ2,σ12+σ22)Z=X+Y\sim{N(\mu_1+\mu_2,\sigma_1^2+\sigma_2^2)}

更一般的结论

nn 个独立的正态变量的线性组合仍服从正态分布。

XiN(μi,σi2)X_i\sim{N(\mu_i,\sigma_i^2)}i=1,2,,ni=1,2,\cdots,n,且它们相互独立,则其线性组合:

c0+c1X1+c2X2++cnXnN(μ,σ2)c_0+c_1X_1+c_2X_2+\cdots+c_nX_n\sim{N(\mu,\sigma^2)}

其中 c1,c2,,cnc_1,c_2,\cdots,c_n 是不全为零的常数,两个参数(可由期望及方差得到)为:

μ=c0+c1μ1++cnμn,σ2=c12σ12+c22σ22++cn2σn2\mu=c_0+c_1\mu_1+\cdots+c_n\mu_n,\\\sigma^2=c_1^2\sigma_1^2+c_2^2\sigma_2^2+\cdots+c_n^2\sigma_n^2

# 7.2 离散型随机变量 Z=X+Y 的分布

两点分布

X1,X2,,XnX_1,X_2,\cdots,X_n 独立且均服从 B(1,p)B(1,p),则 X1+X2++XnB(n,p)X_1+X_2+\cdots+X_n\sim{B(n,p)}

二项分布

XB(n1,p),YB(n2,p)X\sim{B(n_1,p)},Y\sim{B(n_2,p)},两者独立,则 X+YB(n1+n2,p)X+Y\sim{B(n_1+n_2,p)}

泊松分布

Xπ(λ1),Yπ(λ2)X\sim{\pi(\lambda_1)},Y\sim{\pi(\lambda_2)},两者独立,则 X+Yπ(λ1+λ2)X+Y\sim{\pi(\lambda_1+\lambda_2)}

# 7.3 max(X,Y) 和 min(X,Y) 的分布

X,YX,Y 是两个相互独立的随机变量,它们的分布函数分别为 FX(x)F_X(x)FY(y)F_Y(y),则

M=max(X,Y)M=\max(X,Y) 的分布函数为:

Fmax(z)=P(Mz)=P(Xz,Yz)=P(Xz)P(Yz)=FX(z)FY(z)\begin{aligned}F_{\max}(z)&=P(M\le{z})\\&=P(X\le{z},Y\le{z})\\&=P(X\le{z})P(Y\le{z})\\&=F_X(z)F_Y(z)\end{aligned}

N=min(X,Y)N=\min(X,Y) 的分布函数为:

Fmin(z)=P(Nz)=1P(N>z)=1P(X>z,Y>z)=1P(X>z)P(Y>z)=1(1FX(z))(1FY(z))\begin{aligned}F_{\min}(z)&=P(N\le{z})\\&=1-P(N>z)\\&=1-P(X>z,Y>z)\\&=1-P(X>z)P(Y>z)\\&=1-(1-F_X(z))(1-F_Y(z))\end{aligned}
Last Updated: 2023-01-28 4:31:25