刘纬宇——数学教研室
在弄清了随机变量的含义后,我们思考一个问题:用什么方式去描述它?随机变量有两个要素:取值和取值对应的概率。而分布是描述随机变量的方式。分布包括三种:分布函数,分布律和概率密度。为什么要有三种,这么麻烦,一种多简单?这就像现金可以完成支付,为什么还会有公交卡?因为我们坐公交时刷卡更方便些。分布函数确实可以描述所有随机变量,但对于离散型随机变量,用分布律描述较为方便;对于连续型随机变量,用概率密度描述较为方便。
分布函数是描述随机变量的通用方式。对于随机变量X,我们称F(x)=P{X<=x},(x属于R)为其分布函数。关于分布函数,前文我们讨论过一种理解角度,此外,我们还可以从以下几个角度理解。
1.F(x)=P{X<=x}= P{X属于(负无穷,x]},意味着X的分布函数F(x)是随机变量X落入区间(负无穷,x]的概率。
2.对于上面用掷硬币这个随机试验定义的随机变量X,大家动手写一下它的分布函数,不难得到如下结果:当x<0时,F(x)=0;当0=<x<1时,F(x)=1/2;当x>=1时,F(x)=1。我们看一下F(x)的三个函数值是如何得到的:当x<0时,X在x以左没有取值,所以概率为0,进而F(x)的函数值为0;当0=<x<1时,X的取值0在此范围内,所以分布函数把0对应的概率含进去,F(x)的取值为1/2;类似地,当x>=1时,X的取值0和1在此范围内,所以分布函数把0和1对应的概率含进去,F(x)的函数值为1/2+1/2=1。通过以上分析过程,我们可以得到,离散型随机变量的分布函数可以理解成“概率的累加”,累加的是X落入区间(负无穷,x]的概率。另外,大家动手画一下F(x)的图像,观察其形状,会发现它是一个阶梯形函数。那么是否所有离散型随机变量的分布函数都是阶梯形函数呢?是。大家也可以想想为什么如此?分布函数累加的是(负无穷,x]概率,在随机变量有取值的点,分布函数把该点的概率加进去,函数图像就在该点发生跳跃,跳跃的高度恰为随机变量取该点的概率;在随机变量没有取值的区间,没有概率,分布函数的函数值没有增加,函数图像为一条水平的线段(或射线)。
3.随机变量X不是高数中的函数,那么其分布函数是高数中的函数吗?是。我们观察上面写出的分布函数的表达式和图像,会发现它就是一个普通的分段函数,是高数的中的函数。
在讨论完随机变量后,我们讨论多维随机变量。
先考虑一个问题:什么叫多维随机变量。想一下,咱们在哪个地方提到过“多维”?高数中有二维平面,三维空间。线性代数中向量的维数即向量分量的个数。所谓n维随机变量,就是一个向量,该向量的每个分量是定义在同一个样本空间上的随机变量。或者理解成n个一维随机变量放在一块考虑。
我们学习多维随机变量,要和一维对比起来理解。前面提到,我们是用分布描述一个随机变量的,分布有三种:分布函数,分布律和概率密度。那么,推广一下,就得到了二维随机变量的描述方式。先看分布函数。
一维随机变量的分布函数是个一元函数F(x),它是一维随机变量X落入到一个区间(负无穷,x]的概率;相应地,二维随机变量的分布函数应是一个二元函数F(x,y),它是二维随机变量(X,Y)落入一个平面区域(负无穷,x]乘(负无穷,y]的概率。一维随机变量的分布函数有三条性质:“单调不减”,“0,1之间”,“右连续”。那么推广过来,就得到了二维随机变量分布函数的性质:关于x关于y均为单调不减;函数值在0,1之间;关于x关于y均为右连续。理解起来也不困难:所谓“关于”,就是把一个变量固定让另一个变量变化;分布函数是一个概率,当然在0,1之间,这里与一维有所不同(F(负无穷,y)= F(x,负无穷)=0),只需注意到定义中的逗号是“且”的意思。最后一条性质可以结合图像理解,考得不多。
仍有一个问题:一维随机变量的分布函数的三条性质是充要条件,那么二维随机变量的分布函数的这四条性质是充要条件吗?这个考试不要求。当然,其它类似理解:如F(x)是一维随机变量的通用描述方式,每个随机变量均可对应一个分布函数;相应地,F(x,y)是二维随机变量的通用描述方式,每个二维随机变量均可对应一个分布函数。
理解了二维分布函数的定义和描述方式后,我们看看二维随机变量的类型。回顾一下一维随机变量有哪些类型?离散和连续。推广一下,可以得到二维离散型和连续型随机变量。
什么是一维离散型随机变量?无非是取值为有限或者可列无限个的随机变量。类似的,二维随机变量,若其取值是有限或可列无穷对,则称其为二维离散型随机变量。并且二维离散型随机变量的描述方式与一维一致,也是写出所有可能的取值,写出取值对应的概率即可。差别在于二维的取值是实数对,而一维是实数。
类似地,我们可以得到二维连续型随机变量的定义及性质。
二维随机变量的分布函数、分布律和概率密度统称联合分布。
文章来源:跨考教育