0%

概率密度函数、概率质量函数和累积分布函数

一、概率密度函数(Probability Density Function,PDF)/简称为密度函数

(一)理解

倘若有一个物体,求它在某一个点的质量是多少?因为一个点是无限小的,所以点的质量一定为0。然而这个物体是甶无数个点组成的,假如我们又需要求它质量,怎么办呢?

于是引入密度的概念 \[\rho = \lim _{V\rightarrow 0 }{\cfrac{\Delta m}{\Delta V}}\]

最后再把密度积分就可以得到质量m了。

同理,如果在[0, 1]上随机取点,求取在某一点处的概率,点的长度无限小,此概率一定为0。这时情况和上面所述类似,我们需要引入概率密度p。 \[p = \lim _{x\rightarrow 0 }{\cfrac{\Delta p}{\Delta x}}\]

这样我们就可以求所取点落在某一段(a,b)上的概率P了。 \[P = \int ^{b}_{a}p\left( t\right) dt\]

总结:为什么要叫概率密度,因为它和物理上密度的定义本质上是一样的。通常会遇到两种情况:

  1. 已知概率密度函数,求分布函数,积分即可。

  2. 已知分布函数,求概率密度函数,求导即可。

    概率密度函数是针对连续型随机变量定义的。

(二)定义

若概率密度函数为\(f_X(x)\),则可用PDF在某一区间上的积分来刻画随机变量落在这个区间中的概率。 \[P_{r}\left( a\leq X\leq b\right)=\int ^{b}_{a}f_{X}\left( x\right) dx\]

二、概率质量函数(Probability Mass Function, PMF)

  1. 类似于概率密度函数,只不过是离散型随机变量在各特定取值上的概率。
  2. 以掷一枚均匀硬币为例,若正面令\(X=1\),若反面令\(X=0\),则其PMF就是

\[f_{X}\left( x\right) =\begin{cases}\dfrac {1}{2} if \ x\in \left\{ 0,1\right\} \\ 0 \ if \ x\notin \left\{ 0,1\right\} \end{cases}\]

三、累积分布函数(Cumulative Distribution Function,CDF)/简称为分布函数

  1. 是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。
  2. CDF的定义是:\(F_{X}\left( x\right) =P_{r}(X \leq x)\)
    • 连续型随机变量:\(F_{X}\left( x\right) =P_{r}(X \leq x)=\int ^{x}_{-\infty }f_{X}\left( t\right) dt\)

    • 离散型随机变量,CDF是阶梯状的分段函数,以掷硬币为例\[F_{X}\left( x\right) =P_{r}(X \leq x)=\begin{cases}0 \ if \ x<0\\ \dfrac {1}{2}\ if \ 0\leq x<1\\ 1\ if \ x\geq 1\end{cases}\]

  3. 另外CDF的单调递增(不减)性质可以由它的定义和概率的性质推出: \[对任意x_1 < x_2,总有P_{r}(X \leq x_1)\leq P_{r}(X \leq x_2),所以F_{X}\left( x_1\right)\leq F_{X}\left( x_2\right)\]