
2.2 随机变量与概率分布
2.2.1 随机变量
随机变量表示随机试验结果的一个数量。常用大写字母X(或Y, Z…)表示,X随试验结果的不同会取得不同的数值,是一个不确定的量,故称为随机变量。
随机变量可分为两大类型:离散型随机变量和连续型随机变量。
离散型随机变量的一切可能取值为有限个或可列个,这些数值可以逐个写出来,相邻二值之间不存在其他值。连续型随机变量的可能取值不能一一列举出来,而是充满某一区间的值,即可以取得某一区间内的任何数值(后面还将给出连续型随机变量的更确切的定义)。例如,打靶射击时命中的环数、某地在一年内降雨的天数等属于离散型随机变量;某测流断面的年最大流量、年最高水位等属连续型随机变量。
2.2.2 分布函数
由随机变量的定义可知,事件(X<x)的概率是x的函数,若记

则称F(x)为随机变量X的分布函数。
若x1和x2是任意二实数,且x2>x1,由于事件(X<x2)是互不相容二事件(X<x1)与(x1≤X<x2)的和,因此有

从而

由此可见,只要已知随机变量X的分布函数,就能知道X取值于任意区间上的概率。所以,从这个意义上说分布函数完整地刻划了随机变量的概率分布。
1.离散型随机变量的概率分布
设随机变量X为离散型随机变量,则X的取值可以一一列举出来。若X的所有可能取值为xi(i=1,2, …), X取xi的概率为pi,即

则式(2-14)称为随机变量X的概率函数。
将X的所有可能取值xi以及与其相应的概率pi列成下表。

则称此表为随机变量X的分布列。分布列全面清晰地反映了离散型随机变量的统计规律。
根据定义,离散型随机变量X的分布函数为

例如,若随机变量X只能取两个值,且
P(X=a)=p, P(x=b)=1-p
则称X服从两点分布,若a=0, b=1,则也称X服从0-1分布。
由式(2-11), X的分布函数为

常见的离散型随机变量分布还有二项分布、泊松分布等,后面将作进一步介绍。
2.连续型随机变量的概率分布
设随机变量X的分布函数为F(x),如果存在非负函数f(x),使对任意实数x,有

则称X为连续型随机变量,f(x)称为概率分布密度函数,简称分布密度、概率密度或密度函数。注意式(2-16)中x的不同含义,该式表示。
连续型随机变量的分布函数完全由其密度函数所确定,从而连续型随机变量的概率特性也完全由其密度函数所确定,因此在讨论连续型随机变量时,往往利用密度函数作工具。图2-2表示连续型随机变量的概率密度函数与分布函数间的关系。F(x)在任一点x0处的值F(x0)就是图中概率密度曲线y=f(x)下x0左边阴影部分的面积;密度曲线y=f(x)与Ox轴间的面积等于1;随机变量X落在区间(x1, x2)内的概率等于图中概率密度曲线下界于x1与x2之间的面积。

图2-2
利用式(2-16),由密度函数可以求得分布函数。反之,由分布函数也可求得密度函数:

例如,设X为取值于有限区间 [a, b]的连续型随机变量,其概率密度

则称X在 [a, b]上服从均匀分布。由式(2-16),可得X的分布函数
