一、概率密度函数(Probability Density Function,PDF)/简称为密度函数
(一)理解
倘若有一个物体,求它在某一个点的质量是多少?因为一个点是无限小的,所以点的质量一定为0。然而这个物体是甶无数个点组成的,假如我们又需要求它质量,怎么办呢?
于是引入密度的概念 \[\rho = \lim _{V\rightarrow 0 }{\cfrac{\Delta m}{\Delta V}}\]
最后再把密度积分就可以得到质量m了。
同理,如果在[0, 1]上随机取点,求取在某一点处的概率,点的长度无限小,此概率一定为0。这时情况和上面所述类似,我们需要引入概率密度p。 \[p = \lim _{x\rightarrow 0 }{\cfrac{\Delta p}{\Delta x}}\]
这样我们就可以求所取点落在某一段(a,b)上的概率P了。 \[P = \int ^{b}_{a}p\left( t\right) dt\]
总结:为什么要叫概率密度,因为它和物理上密度的定义本质上是一样的。通常会遇到两种情况:
已知概率密度函数,求分布函数,积分即可。
已知分布函数,求概率密度函数,求导即可。
概率密度函数是针对连续型随机变量定义的。
(二)定义
若概率密度函数为\(f_X(x)\),则可用PDF在某一区间上的积分来刻画随机变量落在这个区间中的概率。 \[P_{r}\left( a\leq X\leq b\right)=\int ^{b}_{a}f_{X}\left( x\right) dx\]
二、概率质量函数(Probability Mass Function, PMF)
- 类似于概率密度函数,只不过是离散型随机变量在各特定取值上的概率。
- 以掷一枚均匀硬币为例,若正面令\(X=1\),若反面令\(X=0\),则其PMF就是
\[f_{X}\left( x\right) =\begin{cases}\dfrac {1}{2} if \ x\in \left\{ 0,1\right\} \\ 0 \ if \ x\notin \left\{ 0,1\right\} \end{cases}\]
三、累积分布函数(Cumulative Distribution Function,CDF)/简称为分布函数
- 是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。
- CDF的定义是:\(F_{X}\left( x\right)
=P_{r}(X \leq x)\)
连续型随机变量:\(F_{X}\left( x\right) =P_{r}(X \leq x)=\int ^{x}_{-\infty }f_{X}\left( t\right) dt\)
离散型随机变量,CDF是阶梯状的分段函数,以掷硬币为例\[F_{X}\left( x\right) =P_{r}(X \leq x)=\begin{cases}0 \ if \ x<0\\ \dfrac {1}{2}\ if \ 0\leq x<1\\ 1\ if \ x\geq 1\end{cases}\]
- 另外CDF的单调递增(不减)性质可以由它的定义和概率的性质推出: \[对任意x_1 < x_2,总有P_{r}(X \leq x_1)\leq P_{r}(X \leq x_2),所以F_{X}\left( x_1\right)\leq F_{X}\left( x_2\right)\]