概率论与数理统计(二)

第 9 讲:随机变量

定义

设随机试验的样本空间为 $S$,若 $X=X(e)$ 为定义在 $S$ 上的实值单值函数,则称 $X(e)$ 为随机变量,简写为 $X$。

分类

  1. 离散型随机变量:随机变量 $X$ 的取值为有限个或可数个。
  2. 连续型随机变量:随机变量 $X$ 的取值为不可数个。

第 10 讲:离散型随机变量

$0-1$ 分布

定义

若 $X$ 的概率分布律满足:

$$P(X=k)=p^k(1-p)^{1-k},k=0,1$$

其中 $0<p<1$,就称 $X$ 服从参数为 $p$ 的 $0-1$ 分布(或两点分布),记为 $X\sim{0-1(p)}$ 或 $X\sim{B(1,p)}$。

应用

一个随机试验,设 $A$ 是一随机事件,且 $P(A)=p,(0<p<1)$。若仅考虑事件 $A$ 发生与否,就可以定义一个服从参数为 $p$ 的 $0-1$ 分布的随机变量来描述这个随机试验的结果。

只有两个可能结果的试验,称为贝努利试验,故两点分布有时也称贝努利分布。

二项分布

定义

若 $X$ 的概率分布律满足:

$$P(X=k)=C_{n}^{k}p^k(1-p)^{n-k},k=0,1,\dots,n$$

其中 $n\gt{1}$,$0<p<1$,就称 $X$ 服从参数为 $n,p$ 的二项分布,记为 $X\sim{B(n,p)}$。

泊松分布

定义

若 $X$ 的概率分布律满足:

$$P(X=k)=\frac{\lambda^{k}e^{-\lambda}}{k!},k=0,1,2,\dots$$

其中 $\lambda>0$,就称 $X$ 服从参数为 $\lambda$ 的泊松分布,记为 $X\sim\pi(\lambda)$ 或 $X\sim{P(\lambda)}$。

应用

如果某事件以固定强度 $\lambda$,随机且独立地出现,该事件在单位时间内出现的次数(个数),可以看成是服从泊松分布。

注:当 $n>10,p<0.1$ 时,二项分布 $B(n,p)$ 可以用泊松分布 $\pi(np)$ 来近似。

几何分布

定义

若 $X$ 的概率分布律满足:

$$P(X=k)=p(1-p)^{1-k},k=1,2,3,\dots$$

其中 $0<p<1$,就称 $X$ 服从参数为 $p$ 的几何分布。

应用

在重复多次的贝努利试验中,试验进行到某种结果第一次出现为止,此时的试验总次数服从几何分布。

第 11 讲:分布函数

定义

随机变量 $X$,对任意实数 $x$,称函数

$$F(x)=P(X\le{x})$$

为 $X$ 的概率分布函数,简称分布函数。

性质

  1. $0\le{F(x)}\le1$;
  2. $F(x)$ 单调不减;
  3. $F(-\infty)=0$,$F(+\infty)=1$;
  4. $F(x)$ 是右连续函数,即 $F(x+0)=F(x)$。

第 12 讲:连续性随机变量及概率密度

定义

对于随机变量 $X$ 的分布函数 $F(x)$,若存在非负的函数 $f(x)$,使对于任意实数 $x$ 有:

$$F(x)=\int_{-\infty}^{x}f(t)\mathrm{d}t$$

则称 $X$ 为连续型随机变量,其中 $f(x)$ 称为 $X$ 的概率密度函数,简称概率密度。

性质

  1. $f(x)\ge{0}$;
  2. $\int_{-\infty}^{+\infty}f(x)\mathrm{d}x=1$;
  3. 对于连续型的随机变量 $X$,有 $P(X\in{D})=\int_{D}f(x)\mathrm{d}x,\forall{D}\subset{R}$;
  4. 在 $f(x)$ 的连续点 $x$,$F^{'}(x)=f(x)$。

说明

  1. $f(x)$ 值的含义:当 $\Delta{x}$ 充分小时,$P(x<X\le{x+\Delta{x}})\approx{f(x)\cdot{\Delta{x}}}$;
  2. $f(x)$ 的值是可以大于 $1$ 的。

第 13 讲:均匀分布与指数分布

均匀分布

定义

若 $X$ 的概率密度函数为:

$$f(x)=\left\{\begin{array}{c}\frac{1}{b-a},&x\in(a,b);\\0,&其他,\\\end{array}\right.$$

其中 $a<b$,就称 $X$ 服从 $(a,b)$ 上的均匀分布,记为 $X\sim{U(a,b)}$ 或 $X\sim{Unif(a,b)}$。

性质

均匀分布具有等可能性。

即,对于任意的 $a<k<k+l<b$,均有

$$P(k<X<k+l)=\int_{k}^{k+l}\frac{1}{b-a}\mathrm{d}x=\frac{l}{b-a}$$

与 $k$ 无关,仅与 $l$ 有关。

即,$X$ 落入 $(a,b)$ 中的等长度的任意子区间是等可能的。

概率计算

若 $X\sim{U(a,b)}$,则对于 $\forall{I\subset{R}}$,有

$$P(X\in{I})=\int_{I}f(x)\mathrm{d}x=\frac{I\cap{(a,b)}的长度}{(a,b)的长度}$$

指数分布

定义

若 $X$ 的概率密度函数为:

$$f(x)=\left\{\begin{array}{c}\lambda{e^{-\lambda{x}}},&x>0;\\0,&x\le{0},\\\end{array}\right.$$

其中 $\lambda>0$,就称 $X$ 服从参数为 $\lambda$ 的指数分布,记为 $X\sim{E(\lambda)}$ 或 $X\sim{Exp(\lambda)}$。

其分布函数为

$$F(x)=\left\{\begin{array}{c}1-e^{-\lambda{x}},&x>0;\\0,&x\le{0}.\\\end{array}\right.$$

性质

指数分布具有无记忆性。

证明:

$$\begin{equation}\begin{split}P(X>t_0+t|X>t_0)&=&\frac{P(X>t_0+t,X>t_0)}{P(X>t_0)}\\&=&\frac{P(X>t_0+t)}{P(X>t_0)}\\&=&\frac{1-F(t_0+t)}{1-F(t_0)}\\&=&\frac{e^{-\lambda(t_0+t)}}{e^{-\lambda(t_0)}}\\&=&e^{-\lambda{t}}\\&=&P(X>t)\end{split}\end{equation}$$

应用

  • 指数分布可以用来表示独立随机事件发生的时间间隔。
  • 在排队论中,一个顾客接受服务的时间长短也可用指数分布来近似。

第 14 讲:正态分布

定义

若 $X$ 的概率密度函数为

$$f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}},-\infty<x<+\infty$$

其中 $-\infty<\mu<+\infty$,$\sigma>0$,就称 $X$ 服从参数为 $\mu,\sigma$ 的正态分布(或高斯分布),记为 $X\sim{N(\mu,\sigma^2)}$。

特征

  1. $f(x)$ 关于 $x=\mu$ 对称;
  2. 当 $x\le\mu$ 时,$f(x)$ 是严格单调递增函数;
  3. $f_{\max}=f(\mu)=\frac{1}{\sqrt{2\pi}\sigma}$;
  4. $\lim\limits_{|x-\mu|\rightarrow\infty}f(x)=0.$

两个参数的含义

  • $\mu$ 称为位置参数(决定对称轴位置)
  • $\sigma$ 称为尺度参数(决定曲线分散程度)

标准正态分布

若 $Z\sim{N(0,1)}$,称 $Z$ 服从标准正态分布。

$Z$ 的概率密度函数:$\varphi(z)=\frac{1}{\sqrt{2\pi}}e^{-\frac{z^2}{2}}$

$Z$ 的分布函数:$\Phi(z)=\int_{-\infty}^{z}\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}\mathrm{d}t$

注:在标准正态分布中,使用 $\varphi$ 表示概率密度函数,使用 $\Phi$ 表示分布函数。

性质

当 $X\sim{N(\mu,\sigma^2)}$ 时,$\frac{X-\mu}{\sigma}\sim{N(0,1)}$。

证明

对于任意实数 $z$,

$$\begin{equation}\begin{split}P(\frac{X-\mu}{\sigma}\le{z})&=&P(X\le{\sigma{z}+\mu})\\&=&\int_{-\infty}^{\sigma{z}+\mu}\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(t-\mu)^2}{2\sigma^2}}\mathrm{d}t\\&=&\int_{-\infty}^{z}\frac{1}{\sqrt{2\pi}}e^{-\frac{s^2}{2}}\mathrm{d}s,(s=\frac{t-\mu}{\sigma})\\&=&\Phi(z)\end{split}\end{equation}$$

由此可知,当 $X\sim{N(\mu,\sigma^2)}$ 时,对于任意实数 $a$,有

$$F(a)=P(X\le{a})=P(\frac{X-\mu}{\sigma}\le\frac{a-\mu}{\sigma})=\Phi(\frac{a-\mu}{\sigma})$$

因此,在计算正态分布的概率时,可将其转化为标准正态,然后利用标准正态分布表来求解。

第 15 讲:随机变量函数的分布

求解过程

一般,若已知 $X$ 的概率分布,$Y=g(x)$,求 $Y$ 的概率分布的过程为:

先给出 $Y$ 的可能取值,再利用等价事件来给出概率分布。

若 $X$ 为离散型随机变量

  1. 先写出 $Y$ 的可能取值:$y_1,y_2,\dots,y_i,...$;
  2. 再找出 $\{Y=y_i\}$ 的等价事件 $\{X\in{D}\}$;
  3. 得 $P(Y=y_i)=P(X\in{D})$。

若 $X$ 为连续型随机变量

  1. 先根据 $X$ 的取值范围,给出 $Y$ 的取值范围;
  2. 然后写出 $Y$ 的概率分布函数;

    • $F_Y(y)=P(Y\le{y})$
    • 找出 $\{Y\le{y}\}$ 的等价事件 $\{X\in{D}\}$
    • 得 $F_Y(y)=P(X\in{D})$
  3. 再求出 $Y$ 的概率密度函数 $f_Y(y)$。

定理

设随机变量 $X\sim{f_X(x)}$,$-\infty<x<+\infty$,$Y=g(X)$,$g^{'}(x)>0$(或 $g^{'}(x)<0$),则 $Y$ 具有概率密度为:

$$f_Y(y)=\left\{\begin{array}{c}f_X(h(y))\cdot|h^{'}(y)|,&\alpha<y<\beta;\\0,&其他.\\\end{array}\right.$$

注意

  • 这里 $(\alpha,\beta)$ 是 $Y$ 的取值范围,其中:$\left\{\begin{aligned}\alpha=\min{\{g(-\infty),g(+\infty)\}}\\\beta=\max{\{g(-\infty),g(+\infty)\}}\\\end{aligned}\right.$
  • $h$ 是 $g$ 的反函数,即 $h(y)=x\Leftrightarrow{y=g(x)}$。

一般地,若随机变量 $X\sim{N(\mu,\sigma^2)}$,则有:

$$Y=aX+b \Rightarrow{Y\sim{N(a\mu+b,a^2\sigma^2)}}$$

Last modification:June 27th, 2020 at 04:03 pm
如果觉得我的文章对你有用,请随意赞赏