蓝光播放器软件 正版:第二章第五节
来源:百度文库 编辑:九乡新闻网 时间:2024/10/04 03:34:45
第五节 随机变量的函数及其分布
§5 随机变量的函数及其分布
一、离散型随机变量的函数
二、一维连续型随机变量的函数的分布
三、(连续型)随机向量函数的分布律
四、随机向量的变换
本章补充与注记
人们经常碰到随机变量的函数.例如分子运动的动能T=是分子运动速度——随机变量v的函数;数理统计中经常用到(n)分布,相应的随机变量=+…+,其中各相互独立,都服从N (0, 1).是,…,的函数.
一般,若ξ是随机变量, y = g (x)是普通的实函数,则η= g(ξ)是ξ的函数. 接着产生两个问题:1) η是随机变量吗?2) 如果是,η的分布与ξ的分布有什么关系?对于多个随机变量的函数,也存在同样的问题.
对第一个问题比较容易解决. 因为若η= g (ξ)是随机变量,就必需满足§1的(1)式,这就不得不对函数g (x) 有所限制.
定义 设g (x)是一维实函数,B是R上的波雷尔σ-域. 若对任意B∈B,都有
{x: g (x) ∈B}=g-1 (B) ∈B (1)
(即当g (x)的值域是波雷尔集时,其原像也是波雷尔集), 则称g(x)是一元波雷尔函数.
实变函数论中可以证明:一切分段连续, 分段单调的函数都是波雷尔函数,故它是十分广泛的一类函数,日常碰到的大都是这类函数.
现在我们可以来回答第一个问题:若ξ是概率空间 (Ω, F, P)上的随机变量, f(x)是一元波雷尔函数,η= f (ξ) , 则对任意的B∈B,由这里的 (1)及§1的(1)式可得
{ω:η(ω)∈B}={ω: f (ξ(ω))∈B}={ω:ξ(ω)∈f-1(B) }∈F.
故η是随机变量.
类似可以定义n元波雷尔函数. 且若f ()是波雷尔函数,则η= f()就是随机变量. 以后我们讲随机变量的函数都是指这种函数.
下面讨论第二个问题,分几步来解决.
一、离散型随机变量的函数
这种情况比较简单,仅举几个例子来说明.
例1 设ξ的分布列为,η=2ξ-1, ζ=, 求η,ζ各自的分布.
解 η的可能取值为-3, -1, 1, 3, 是有限个, 只须算出对应的概率. 由于{η=-3}= {ξ=-1},故P{η=-3}= P{ξ=-1},类似可得其它概率. 我们得到η的分布:.
ζ可取的值为0,1,4,但注意到{ζ=1}={ξ=1}{ξ=-1},故P{ζ=1} =P{ξ=1}+P{ξ=}=;ζ的分布列为.
一般,设ξ有分布列P(ξ=) = p (), i=1,2,…, 则η=f (ξ)有分布列
P(η=) =, j =1, 2,….
例2 设ξ~B (, p), η~B (, p), ξ,η相互独立,求ζ=ξ+η的分布.
解 ξ,η各可取值0,1,…,和0,1,…,, 则ζ可取值0, 1,…,+, 且由§4的(5)式,得
P(ζ= r) ==
==
=,
这里用到了组合数的性质. 计算的结果表明: ξ+η~B (+, p), 这个事实显示了二项分布一个很重要的性质:两个独立的二项分布,当它们的第二参数相同时,其和也服从二项分布,它的第一参数恰为这两个二项分布第一参数的和. 这性质称为二项分布的再生性(或可加性(additive property)).从ξ,η的概率意义来看,这结果是非常明显的:ξ和η分别是重贝努里试验中成功的次数,两组试验合起来,ζ=ξ+η应该就是重贝努里试验中成功的次数.
本例计算过程中得到的公式
P(ζ= r) == (2)
是计算取非负整数值的独立随机变量和的分布的公式,称为离散卷积公式.
二、一维连续型随机变量的函数的分布
设ξ的密度函数为p (x),我们要求出η=f (ξ)的分布函数G(y). 事实上, G(y) =P(η£y) = P(f (ξ) £y), 而D ={x:f (x) £y}是一维波雷尔集,故
G(y)= P(ξ∈D) =. (3)
至于η是不是连续型随机变量,它的密度函数是什么,在一般场合无法作出决定,但在某些特殊而又常见的场合,我们可以直接导出η的密度函数g(y).
定理1 若f(x)严格单调,其反函数(y)有连续导函数,则η=f (ξ)也是连续型随机变量,其密度函数为
g(y) = (4)
证 不妨设f(x)严格单调增加,且-∞< x <+∞时, A< f (x)显然若y£A则G(y) = 0,此时有g(y)=0;当A (y)}, 故
G(y) = P(η£y) =,
令x =(v), 得
G(y)==,
其中g(v) 如(4)式所示;而当y³B时有G(y)=1, 故g(y) = 0; 这就证得(4)式.
当y = f (x)为严格单调减少时,类似可证(4)式成立.
推论 若y = f (x) 在不相重叠的区间,…上逐段严格单调, 在各段的反函数,…有连续导数,则η= f(ξ)是连续型随机变量,其密度为
g(y) =. (5)
证 注意到{f (ξ) £y}={ξ},其中是中满足f (x) £y的x的集合,再利用(4)式得到
==
由此即得证(5)式.
例3 设ξ~N( a,), 求η=kξ+b的密度函数 (k0).
解 y =f(x) = kx+b满足上述定理1中的条件,(y) = (y -b)/ k, ξ的密度
p(x)=exp, -∞ < x <+∞, 由(4)式,
g(y) =exp{}·|1/ k | =exp,
说明η~N(ka+b,). 特别,若η= (ξ-a)/ b,则η~N(0,1),这个结果早已为我们所熟知.
例4 ξ~N(0, 1), 求η=的密度.
解 y=是分段单调的,反函数:当=(-¥,0)时, x=(y)=; 当=(0,+ ¥)时,x=(y)=; 值域都是y>0. 故y>0时,
(y) =exp+exp
=;
y£0时,(y)=0.
它称为c2(1) 分布. 关于c2分布,后面还要作较详细介绍.
例5 设ξ有连续的分布函数F(x), 求θ= F(ξ)的分布.
解 考虑θ的分布函数,因为0£F(x)£1, 故
x<0时, P(q£x) = 0,(不可能事件); x³1时, P(q£x) =1, (必然事件);
当0£x<1时,{q£x}={F(ξ) £x},考虑F(x)的反函数,由于y = F(x)不一定严格增加,对同一y,可能有很多个x与它对应, 为确定起见,对任意 0£y£1,定义
F-1(y) = sup{x: F(x)作为F(x)的反函数(图2-6中,对应y1的是x1).于是
P(q£x) = P( F(ξ) £x) = P(ξ£ F-1(x)) = F(F-1(x)) = x,
即q= F(ξ)服从[0, 1]上的均匀分布.
例6 (例5的反问题)若q服从 [0, 1] 上的均匀分布, F(x)满足分布函数的三个性质,求ξ= F-1(q)的分布.
解 ξ的分布函数为
P(x£x) = P(F-1(q) £x) = P(q£F(x)),
因为0£F(x) £1,而q~U [0, 1],由均匀分布函数的定义,对任意x,上式等于F(x).
本例说明:不论F(x)是什么函数,只要满足分布函数的三个条件,就存在随机变量使其分布函数为F(x).
三、(连续型)随机向量函数的分布律
设 () 为连续型随机向量,其密度为p (). 又设η=f (),则η的分布函数可由下式决定:
Fh(y) = P (f ()£y) =. (6)
下面看几种特殊情况.
1.η=
Fh(y) ==,
作变量代换x2=z- x2,再交换积分次序,得
Fh(y)==,
这说明η是连续型随机变量,其密度函数为
. (7)
特别, 当x1与x2相互独立,各自有密度p1(x), p2(x)时, x1+x2的密度为
(或) .
式称为卷积公式(convolution),与离散卷积公式 (2) 对照,两者极为相似.
例7 ξ,η独立同分布,都服从N (0,1), 求ζ=ξ+η的分布密度.
解 用卷积公式. 对任意zÎR,
=.
注意到上面积分号中是N(z/2 ,1/2)的密度, 就有=, 这说明ζ=ξ+η~N (0, 2).
以后会用更简单的方法证明:若ξ,η相互独立,ξ~N(), η~N (), 则ξ+η~N (). 本例是其特殊情况. 与本节的例2对照,可知正态分布对两个参数都有再生性.
例8 设ξ,η相互独立,密度函数分别如下两式,求ζ=ξ+η的密度.
(a > 0); (b > 0).
解 当且仅当x >0且z-x >0时, 即z > x >0时,¹0. 因此由(7)¢式,当z£0时;当z >0时,
故1) a = b时,; 2) a¹b时,.
2.η=x1/x2
,
令, 并交换积分次序,得
.
这说明若 (x1, x2) 是连续型随机向量,则η=x1/x2是连续型随机变量,其密度为
. (8)
例9 ξ,η相互独立,都服从U [0, a], 求ξ/η的密度.
解 又ξ,η相互独立,故只有当时,p(zx, x) ==¹0. 上述区域为图中阴影部分.由(8)式,当z < 0时,对任何x, p(z x, x) = 0, 此时; 当0£z<1时,由图中区域I,;
当1£z<+∞时,为图中II,.
3.次序统计量的分布
设独立同分布,分布函数都为F(x). 把每取一组值(wÎW)都按大小次序排列,所得随机变量,,…,称为次序统计量(order statistic), 它们满足££…£. 因此,= min {},=max{}.
现在来求,及(,)的分布,这在数理统计中是有用的.
1)的分布函数
P(£x) = P()
= P(=. (9)
2)的分布函数 先考虑{£x}的逆事件{> x},
P{> x}===,
故
P(£x)=1-. (10)
3) (,)的联合分布函数
F(x, y) = P(£x,£y) = P (£y )-P(> x,£y)
=-P(),
因此当x < y时,
F(x, y) =-;
当x³y时,
F(x, y) =. (11)
如果还是连续型随机向量,有密度p(x) =F¢(x),则上面各随机变量(向量)也是连续型,可将各分布函数求导以得到密度函数.
四、随机向量的变换
设 () 的密度为p(). 现有m个的函数: h1=f1(),…,hm=fm(), 则 (h1,…, hm) 也是随机向量,除了各边际分布外,还要求其联合分布. 类似(6)式, 其联合分布函数为
G()=P()=.(12)
这里D是n维区域:{():,…,}.
定理2 如果m = n, {fj}有唯一的反函数组:xi= xi (), i=1,…,n, 且J=¹0, 则(h1,…, hn)是连续型随机向量. 当()Î(的值域时,其密度为
q() = p[x1 (),…, xn ()J|, (13)
其它情况 q()=0.
证 只须在(12)式中利用重积分的变量代换: u1=,…,=, 就有
G() =,
故q()确为(h1,…,hn)的联合密度.
例10 ξ,η相互独立,都服从参数为1的指数分布,求α=ξ+η与β=x/h的联合密度; 并分别求出ξ+η与x/h的密度.
解 (x,h)的联合密度:当x > 0且y > 0时,p(x, y) =, 其它情况为0.
函数组的反函数组为,当x, y>0时, u, v>0,
==-, 故 |J| =,
由(13)式,(a,b)的联合密度为:
u >0且v >0时, q(u, v ) =; 在其它情况q(u, v) = 0.
a=ξ+η与b=x/h各自的密度为q(u, v) 的边际密度. 不难看出:
u>0时,; u£0时,=0;
v>0时,=1/; v£0时,=0,
并且a,b相互独立.
本例中,自然也可以用第三段中的方法计算ξ+η与x/h各自的分布,但这里的方法显然更方便.
这是一个富有启发性的例子,它告诉我们:要判断随机向量的几个函数h1,…,hn是否独立,可用随机向量变换公式求得它们的联合分布,再用独立性的各种充要条件来判断;要求随机向量的一个函数的分布,有时可适当补充几个函数,先求它们的联合分布,而原来要求的函数的分布可作为其边际分布.
例11 假设X是一个随机变量,令Y=2X,那么我们可以用X的分布函数FX(x)来表示(X,Y)的联合分布函数FXY(x,y).
如果y³2x,那么
P(X£x,Y£y)=P(X£x)=FX(x);
如果y<2x, 那么
P(X£x, Y£y)=P(Y£y)=P(X£y/2)=FX(y/2)
因此
例12 x,h相互独立,并且x服从N(0,s2), h服从(0,p)上的均匀分布.求a=x+acosh的密度函数,其中a为常数.
解 (x,h)的联合密度为:
p(x,y)=
令b=h,那么与变换a=x+acosh,b=h相对应的方程组是
它有唯一解
并且J=1. 这样我们得到q(u,v)=p(u-acosv,v).因此,a的密度函数为
例13 x与h独立同分布,都服从N(0, 1), ξ=,η=. 求证: r=r (x,h)与j=j(x,h)相互独立.
证 先利用(13)式求(r,j)的联合密度. 变换的函数组与反函数组分别为
在{-∞< x <∞,-∞< y <∞, (x, y) ¹(0, 0)} 与 {r>0, 0£q<2p}中变换是一一对应的, J=r, (x,h)的联合密度为
p(x, y) =,
故(r,j)的联合密度为
q(r, q) =
q(r, q)可分离成R(r) ×Q(q),其中
R(r) =, Q(q)=
分别为r,j的密度,故r与j相互独立. 这里r的分布称为瑞利(Rayleigh)分布,j是[0, 2p]上的均匀分布.
反之,设x1, x2相互独立,都服从U[0, 1],
,,
则相互独立,都服从N(0, 1);这是产生N(0, 1)随机数的一种基本方法.
从本章习题我们可以看到, 即使x,h相互独立, x和h的两个函数f1(x,h)与f2(x,h)仍然可以不独立. 但在某些特殊情况,仍保持独立性.
例14 假设随f1机变量X和Y相互独立,并且Z仅是X的函数,W仅是Y的函数:如果导数存在,那么Z和W仍相互独立.
证. 首先假设,有唯一解. 既然
=
并且,我们有
但x1仅是z的函数,y1仅是w的函数;因此,Z和W相互独立. 至于解并不唯一的情况,也可类似证明,请读者自行完成.
更一般地我们有下面的定理.
定理3 令;f1是n1个变量的Borel可测函数,f2是个变量的Borel可测函数,…,fk是个变量的Borel可测函数. 如果X1, X2,… , Xn是独立随机变量,那么
是相互独立的.
特别,当是单变量函数时,我们有相互独立.
注意逆命题不成立,即有这样的例子:x2,h2相互独立,但x与h不独立(见本章习题65).
五、数理统计中几个重要分布
本段介绍数理统计中应用很广的三个重要分布——c2分布, t分布和F分布. 它们都与正态分布有密切关系,都可作为随机变量的函数来导出它们的密度.
先讨论比c2分布更广泛的一类分布——G分布,它的密度函数由§2的(15)式定义. 这里再来介绍G分布的一个重要性质.
引理(G分布的可加性)G分布G (l,r)对第二个参数具有可加性:若x1, x2相互独立,x1~G(l,r1), x2~G(l, r2), 则x1+x2~G(l,r1+ r2).
证 由卷积公式(7)¢式,h= x1+x2的密度:当z<0时,ph(z)=0; 当z>0时,
ph(z)=.
整理后,作变量代换x=z t,并利用第二型欧拉积分
B(r1, r2) ==G(r1)G(r2)/G(r1+ r2),
就有
,
所以η~G(l,r1+ r2).
当r=1时,G(l,1) 即为指数分布. 另一特殊情况是取l=1/ 2, r =n/2(n为自然数),即为下面的
1. c2分布
称G(1/2, n /2)为c2(n)分布,其中称n为它的自由度(degree of freedom). 它的密度为
(14)
定理4 (1)c2分布具有可加性,也就是说,设x1~c2(n1),x2~c2(n2),则x1+x2~c2(n1+ n2);(2) 若x1,¼, xn相互独立,都服从N(0,1),则
~c2(n). (15)
证 (1) 由G分布的可加性即得c2分布的可加性.
(2) 记, i=1,…,n, 由{xi}相互独立,可知{hi}相互独立. 又在本节的例4已经直接算得hi的密度,由于,故hi~c2(1),再由(1), 运用数学归纳法,就得~c2(n).
上述定理显示了c2分布的本质属性,c2分布中的自由度n即是中独立正态变量xi的个数.
2. t分布
定理5 若x~N(0,1), η~c2(n), 且x与η相互独立,则随机变量的密度函数为
p(x) =, -∞< x <+∞. (16)
称具有上述密度的随机变量T服从t(n)分布,n为它的自由度.
为了证明定理5, 可先用定理1求出的密度,再用商的密度公式(8)求出T=x/q的密度,详细证明见本章末的补充与注记6.
3.F分布
定理6 设随机变量x~c2(m), η~c2 (n), x与η相互独立, 则F=的密度函数为
(17)
称具有上述密度的随机变量服从F(m,n)分布,m与n分别为它的第一自由度和第二自由度.
为了证明定理,可先用定理1求得与的密度,然后再利用商的密度公式(8)求得F=的密度,详细计算见本章末的补充与注记6.
F分布有下述性质:
(1)若F~F(m, n), 则1/ F~F(n, m). 这从F的定义立即可以得到.
2) 若T~t(n),则T2~F(1, n).
证,x与η相互独立, x~N(0,1),h~c2(n),而,且x2~c2(1), x2与η相互独立,所以T2~F(1, n).
补充与注记
1. 十九世纪中叶以前,概率论的主要兴趣仍然集中在随机事件的概率计算上. 俄国数学家切贝雪夫(Chebyshev 1821-1894),马尔可夫(Markov 1856-1922)和李雅普洛夫(Lyapunov 1857-1918)等首先明确地引进随机变量这一概念,并加以广泛地应用与研究.
2. 电话的呼叫数, 等车的乘客数, 放射粒子数等等随机变量为什么服从普阿松分布呢?这些随机变量表示的都是在一定的时间或空间内出现的事件数, 它们具有下列共同的特性,即平稳性,独立增量性和普通性. 以电话交换台固定时间t内收到的呼唤数x为例来说明这件事,它具有
平稳性,即在 [t0, t0+t] 时段内来到的呼叫数x= k的概率只与时段的长度t有关,而与区间的起点t0无关,记作Pk (t). 从而对不同时段的呼叫数的考察当长度t相同时可以看成重复试验.
独立增量性(无后效性),即x=k这一事件与t0以前所发生的一切事件独立,所以考察不同时段的呼叫数是独立试验.
普通性,指在充分小的时间间隔内,最多来到一个呼叫,严格地说,当t→0时
1-P0(t)-P1(t)=o(t) (1)
现在我们来计算Pk (t),把区间[t0, t0+1)n等分,则 [t0, t0+ t) 分成nt份,取足够大的n并把nt看成整数,并使近似地在每个小区间 [t0+ (r-1)/n, t0+ r/n) 内至多有一次呼叫, (t=1/n), r=1,2,…, nt. 故在一个小区间内有还是没有一次呼叫是一次贝努里试验,而由于头两条性质,对整个时段[t0, t0+ t) (即对nt个小区间) 的考察可看成是nt重贝努里概型,故事件{x= k}近似服从二项分布:
P(x= k)≈b(k; nt, pn) (2)
这里pn是在一个小区间中有一次呼叫的概率,它与区间长度t成正比,即pn=lDt.
现在我们来计算Pk (t),把区间[t0, t0+1)n等分,则 [t0, t0+ t) 分成nt份,取足够大的n并把nt看成整数,并使近似地在每个小区间 [t0+ (r-1)/n, t0+ r/n) 内至多有一次呼叫, (t=1/n), r=1,2,…, nt. 故在一个小区间内有还是没有一次呼叫是一次贝努里试验,而由于头两条性质,对整个时段[t0, t0+ t) (即对nt个小区间) 的考察可看成是nt重贝努里概型,故事件{x= k}近似服从二项分布:
P(x= k)≈b(k; nt, pn) (2)
这里pn是在一个小区间中有一次呼叫的概率,它与区间长度t成正比,即pn=lDt.
(2)式是近似的,其原因是略去了高阶无穷小,当Dt→0即n→∞时, (2)变为精确值. 由普阿松定理,得到 (注意)
, k=0,1,2,….
这就说明了x服从参数为lt的普阿松分布.
在随机过程理论中,将用更严密的方法讨论这件事,并把上述结果进一步推广.
3. 我们来说明G-分布及指数分布的实际意义. 把参数为的普阿松过程中接待r个顾客所需要的时间记为tr我们来推导它的分布函数F( t ).
当t£0时,F(t) = 0;
当t>0时,以x(t)表示t秒内接待的顾客数,它服从参数为lt的普阿松分布,而事件{tr≤t} = {ξ(t)≥r}, 从而
F(t) =P(tr≤t) = P(ξ(t)≥r) =1-P(ξ(t)< r) = 1-,
故而其密度函数
p(t) =F¢(t) =
, (t >0).
这正是G-分布. 上面推导说明普阿松过程中接待r个顾客所需要的时间tr服从G-分布. 如果我们把某机器更换一个零件看成接待一个顾客,则更换相同的r个零件所需的时间tr服从G-分布. 特别,更换一个另件所需时间t(即该另件的寿命) 服从指数分布. 所以指数分布有时也称为寿命分布.
4. 离散型随机变量的概率密度函数
定义脉冲函数,即所谓广义函数,它是满足下列积分关系的函数:对所有在0点连续的函数f
通过平移变换,不难看出下式成立:
这样,对任意函数F(x),如果x0是其不连续点,令k是F(x)在x0处的跳跃高度,即. 那么在x0的值可看成是在x0处的导数. 假如X是离散型随机变量,具有分布列
,
那么,它的密度函数可写为:即.
同样也可用p(x)的积分来表达事件的概率,如
,
.
例. 如果X服从退化分布,只取一个值c,那么它的密度函数为;如果X服从两点分布,取0,1两个值的概率分别为1-p和p,那么它的密度函数为.
混合型随机向量的联合概率密度函数
假设X是离散型随机变量,分布列如上;Y是连续型随机变量,分布密度为, 这样(X,Y)的联合概率分布完全集中在一族直线上. 落在线段上的概率为
.
这时,联合分布函数对y连续,对x不连续,其中不连续点为如果X和Y相互独立,那么利用前面关于离散型随机变量密度函数,同样可以写出(X,Y)的联合密度函数为
,即
例. 假设Z是一个服从(-p,p)上均匀分布的随机变量,如果,, 那么(X,Y)的联合概率分布完全集中在圆周上. 为了计算其概率密度函数,令,那么r和Z相互独立,
并且联合概率密度函数为
另外,方程组
有唯一解,并且|J|=1. 因此,(X,Y)的联合概率密度函数为
5. 存在性定理
尽管常用的随机变量和分布函数都有其实际背景,与某个具体的随机试验相联系,但为了理论研究的方便,我们通常假设某随机变量服从某分布或具有某密度函数,而不涉及具体的随机试验. 事实上,下面的存在性定理表明,给定任一个分布函数,总可以构造一个适当的试验和相应的随机变量使得其具有分布函数.
定理 假如G(x)是一个分布函数,那么存在一个概率空间和一个随机变量使得在下的分布函数恰好等于G(x).
证. 我们把所有实数看成是想象的某试验的结果,即,并定义其上的域F为R上的Borel域B. 定义概率P如下:对任意x,定义F中的事件(-¥,x]的概率
.
这样,由测度论中的有关理论知道,F上的所有事件的概率都是确定的. 现在定义随机变量X如下:
这是合理的,因为这里的w是一个实数. 进而,对任意x我们有
6.复合分布. 以上我们介绍了一些常用的分布函数,但在实际问题中往往需要考虑其他类型的分布函数或者是上述常用分布函数的复合. 例如,在保险精算业务中,时常需要考虑下列一种风险模型. 记N是给定时期保单的理赔次数,Xi是第i次理赔的理赔量,则该时期的总理赔量S等于. 这个模型的特点在于理赔次数N是随机变量,因此S的分布是Xi的分布与N的分布的复合. 为讨论模型方便,我们作如下假定:
i) 随机变量序列Xi同分布,共同分布为F(x);
ii) 随机变量序列N, X1,X2,¼,相互独立.
这样S的分布可由全概率公式加以计算
当N服从普阿松分布时,我们称S的分布为复合普阿松分布.
例. 假设N服从几何分布,,,其中,;Xi为指数分布,,求S的分布
解. 记. 由上述公式得,;对,
=
=
=.
这表明S是一个混合型分布:取0值的概率为p,以概率q在(0,¥)上服从参数为p的指数分布.
7. 全概率公式的连续形式
假设A是任一事件,并且,令X是一随机变量,其分布函数为F(x),密度函数为p(x). 对,因为,那么
并且进而有
. (1)
对任意集合B,如果,那么没有定义. 然而,如果B与X有关,那么我们可以用某种极限的方式来定义. 现考虑一种重要情形,即. 假设对某个x,,我们可以定义
.
这样由(1)有
,
其中
称为在条件A下的条件密度函数,它具有密度函数的性质. 从上述进一步成立
既然右边等于,那么我们获得全概率公式的连续形式
和相应的贝叶斯公式
例. 假设随机变量P服从(0,1)区间上的均匀分布. 现独立投掷一枚硬币10次,每次出现正面的概率为. 求出现4次正面的概率?
解. 用表示投掷硬币10次所出现的正面次数,当时,x服从二项分布. 因此,由全概率公式得
=
=
8. t分布与F分布的密度函数的推广.
1). t(n)分布
若ξ~N(0, 1),h~,且ξ与η相互独立,我们来计算t =ξ/的密度.
先求θ=的密度. y =是x的严格增加函数,其反函数x = ny2有连续导数. 对 y>0
=;
显然当y£0时,.
再求t =ξ/θ的密度. 因为ξ与η相互独立,故ξ与θ也独立. 由商的密度公式,t的密度为
= (令u=) =
=, (-∞< z <∞).
2). F(m, n )分布
设ξ~,η~,ξ与η相互独立. 我们来计算F=的密度.
先计算的密度. 令y = x / m, 则x = my.的密度为
=, (y >0).
同理,的密度为, (x >0). 因此的密度是
= (令u=)
=
=, (z >0);
§5 随机变量的函数及其分布
一、离散型随机变量的函数
二、一维连续型随机变量的函数的分布
三、(连续型)随机向量函数的分布律
四、随机向量的变换
本章补充与注记
人们经常碰到随机变量的函数.例如分子运动的动能T=是分子运动速度——随机变量v的函数;数理统计中经常用到(n)分布,相应的随机变量=+…+,其中各相互独立,都服从N (0, 1).是,…,的函数.
一般,若ξ是随机变量, y = g (x)是普通的实函数,则η= g(ξ)是ξ的函数. 接着产生两个问题:1) η是随机变量吗?2) 如果是,η的分布与ξ的分布有什么关系?对于多个随机变量的函数,也存在同样的问题.
对第一个问题比较容易解决. 因为若η= g (ξ)是随机变量,就必需满足§1的(1)式,这就不得不对函数g (x) 有所限制.
定义 设g (x)是一维实函数,B是R上的波雷尔σ-域. 若对任意B∈B,都有
{x: g (x) ∈B}=g-1 (B) ∈B (1)
(即当g (x)的值域是波雷尔集时,其原像也是波雷尔集), 则称g(x)是一元波雷尔函数.
实变函数论中可以证明:一切分段连续, 分段单调的函数都是波雷尔函数,故它是十分广泛的一类函数,日常碰到的大都是这类函数.
现在我们可以来回答第一个问题:若ξ是概率空间 (Ω, F, P)上的随机变量, f(x)是一元波雷尔函数,η= f (ξ) , 则对任意的B∈B,由这里的 (1)及§1的(1)式可得
{ω:η(ω)∈B}={ω: f (ξ(ω))∈B}={ω:ξ(ω)∈f-1(B) }∈F.
故η是随机变量.
类似可以定义n元波雷尔函数. 且若f ()是波雷尔函数,则η= f()就是随机变量. 以后我们讲随机变量的函数都是指这种函数.
下面讨论第二个问题,分几步来解决.
一、离散型随机变量的函数
这种情况比较简单,仅举几个例子来说明.
例1 设ξ的分布列为,η=2ξ-1, ζ=, 求η,ζ各自的分布.
解 η的可能取值为-3, -1, 1, 3, 是有限个, 只须算出对应的概率. 由于{η=-3}= {ξ=-1},故P{η=-3}= P{ξ=-1},类似可得其它概率. 我们得到η的分布:.
ζ可取的值为0,1,4,但注意到{ζ=1}={ξ=1}{ξ=-1},故P{ζ=1} =P{ξ=1}+P{ξ=}=;ζ的分布列为.
一般,设ξ有分布列P(ξ=) = p (), i=1,2,…, 则η=f (ξ)有分布列
P(η=) =, j =1, 2,….
例2 设ξ~B (, p), η~B (, p), ξ,η相互独立,求ζ=ξ+η的分布.
解 ξ,η各可取值0,1,…,和0,1,…,, 则ζ可取值0, 1,…,+, 且由§4的(5)式,得
P(ζ= r) ==
==
=,
这里用到了组合数的性质. 计算的结果表明: ξ+η~B (+, p), 这个事实显示了二项分布一个很重要的性质:两个独立的二项分布,当它们的第二参数相同时,其和也服从二项分布,它的第一参数恰为这两个二项分布第一参数的和. 这性质称为二项分布的再生性(或可加性(additive property)).从ξ,η的概率意义来看,这结果是非常明显的:ξ和η分别是重贝努里试验中成功的次数,两组试验合起来,ζ=ξ+η应该就是重贝努里试验中成功的次数.
本例计算过程中得到的公式
P(ζ= r) == (2)
是计算取非负整数值的独立随机变量和的分布的公式,称为离散卷积公式.
二、一维连续型随机变量的函数的分布
设ξ的密度函数为p (x),我们要求出η=f (ξ)的分布函数G(y). 事实上, G(y) =P(η£y) = P(f (ξ) £y), 而D ={x:f (x) £y}是一维波雷尔集,故
G(y)= P(ξ∈D) =. (3)
至于η是不是连续型随机变量,它的密度函数是什么,在一般场合无法作出决定,但在某些特殊而又常见的场合,我们可以直接导出η的密度函数g(y).
定理1 若f(x)严格单调,其反函数(y)有连续导函数,则η=f (ξ)也是连续型随机变量,其密度函数为
g(y) = (4)
证 不妨设f(x)严格单调增加,且-∞< x <+∞时, A< f (x)
G(y) = P(η£y) =,
令x =(v), 得
G(y)==,
其中g(v) 如(4)式所示;而当y³B时有G(y)=1, 故g(y) = 0; 这就证得(4)式.
当y = f (x)为严格单调减少时,类似可证(4)式成立.
推论 若y = f (x) 在不相重叠的区间,…上逐段严格单调, 在各段的反函数,…有连续导数,则η= f(ξ)是连续型随机变量,其密度为
g(y) =. (5)
证 注意到{f (ξ) £y}={ξ},其中是中满足f (x) £y的x的集合,再利用(4)式得到
==
由此即得证(5)式.
例3 设ξ~N( a,), 求η=kξ+b的密度函数 (k0).
解 y =f(x) = kx+b满足上述定理1中的条件,(y) = (y -b)/ k, ξ的密度
p(x)=exp, -∞ < x <+∞, 由(4)式,
g(y) =exp{}·|1/ k | =exp,
说明η~N(ka+b,). 特别,若η= (ξ-a)/ b,则η~N(0,1),这个结果早已为我们所熟知.
例4 ξ~N(0, 1), 求η=的密度.
解 y=是分段单调的,反函数:当=(-¥,0)时, x=(y)=; 当=(0,+ ¥)时,x=(y)=; 值域都是y>0. 故y>0时,
(y) =exp+exp
=;
y£0时,(y)=0.
它称为c2(1) 分布. 关于c2分布,后面还要作较详细介绍.
例5 设ξ有连续的分布函数F(x), 求θ= F(ξ)的分布.
解 考虑θ的分布函数,因为0£F(x)£1, 故
x<0时, P(q£x) = 0,(不可能事件); x³1时, P(q£x) =1, (必然事件);
当0£x<1时,{q£x}={F(ξ) £x},考虑F(x)的反函数,由于y = F(x)不一定严格增加,对同一y,可能有很多个x与它对应, 为确定起见,对任意 0£y£1,定义
F-1(y) = sup{x: F(x)
P(q£x) = P( F(ξ) £x) = P(ξ£ F-1(x)) = F(F-1(x)) = x,
即q= F(ξ)服从[0, 1]上的均匀分布.
例6 (例5的反问题)若q服从 [0, 1] 上的均匀分布, F(x)满足分布函数的三个性质,求ξ= F-1(q)的分布.
解 ξ的分布函数为
P(x£x) = P(F-1(q) £x) = P(q£F(x)),
因为0£F(x) £1,而q~U [0, 1],由均匀分布函数的定义,对任意x,上式等于F(x).
本例说明:不论F(x)是什么函数,只要满足分布函数的三个条件,就存在随机变量使其分布函数为F(x).
三、(连续型)随机向量函数的分布律
设 () 为连续型随机向量,其密度为p (). 又设η=f (),则η的分布函数可由下式决定:
Fh(y) = P (f ()£y) =. (6)
下面看几种特殊情况.
1.η=
Fh(y) ==,
作变量代换x2=z- x2,再交换积分次序,得
Fh(y)==,
这说明η是连续型随机变量,其密度函数为
. (7)
特别, 当x1与x2相互独立,各自有密度p1(x), p2(x)时, x1+x2的密度为
(或) .
式称为卷积公式(convolution),与离散卷积公式 (2) 对照,两者极为相似.
例7 ξ,η独立同分布,都服从N (0,1), 求ζ=ξ+η的分布密度.
解 用卷积公式. 对任意zÎR,
=.
注意到上面积分号中是N(z/2 ,1/2)的密度, 就有=, 这说明ζ=ξ+η~N (0, 2).
以后会用更简单的方法证明:若ξ,η相互独立,ξ~N(), η~N (), 则ξ+η~N (). 本例是其特殊情况. 与本节的例2对照,可知正态分布对两个参数都有再生性.
例8 设ξ,η相互独立,密度函数分别如下两式,求ζ=ξ+η的密度.
(a > 0); (b > 0).
解 当且仅当x >0且z-x >0时, 即z > x >0时,¹0. 因此由(7)¢式,当z£0时;当z >0时,
故1) a = b时,; 2) a¹b时,.
2.η=x1/x2
,
令, 并交换积分次序,得
.
这说明若 (x1, x2) 是连续型随机向量,则η=x1/x2是连续型随机变量,其密度为
. (8)
例9 ξ,η相互独立,都服从U [0, a], 求ξ/η的密度.
解 又ξ,η相互独立,故只有当时,p(zx, x) ==¹0. 上述区域为图中阴影部分.由(8)式,当z < 0时,对任何x, p(z x, x) = 0, 此时; 当0£z<1时,由图中区域I,;
当1£z<+∞时,为图中II,.
3.次序统计量的分布
设独立同分布,分布函数都为F(x). 把每取一组值(wÎW)都按大小次序排列,所得随机变量,,…,称为次序统计量(order statistic), 它们满足££…£. 因此,= min {},=max{}.
现在来求,及(,)的分布,这在数理统计中是有用的.
1)的分布函数
P(£x) = P()
= P(=. (9)
2)的分布函数 先考虑{£x}的逆事件{> x},
P{> x}===,
故
P(£x)=1-. (10)
3) (,)的联合分布函数
F(x, y) = P(£x,£y) = P (£y )-P(> x,£y)
=-P(),
因此当x < y时,
F(x, y) =-;
当x³y时,
F(x, y) =. (11)
如果还是连续型随机向量,有密度p(x) =F¢(x),则上面各随机变量(向量)也是连续型,可将各分布函数求导以得到密度函数.
四、随机向量的变换
设 () 的密度为p(). 现有m个的函数: h1=f1(),…,hm=fm(), 则 (h1,…, hm) 也是随机向量,除了各边际分布外,还要求其联合分布. 类似(6)式, 其联合分布函数为
G()=P()=.(12)
这里D是n维区域:{():,…,}.
定理2 如果m = n, {fj}有唯一的反函数组:xi= xi (), i=1,…,n, 且J=¹0, 则(h1,…, hn)是连续型随机向量. 当()Î(的值域时,其密度为
q() = p[x1 (),…, xn ()J|, (13)
其它情况 q()=0.
证 只须在(12)式中利用重积分的变量代换: u1=,…,=, 就有
G() =,
故q()确为(h1,…,hn)的联合密度.
例10 ξ,η相互独立,都服从参数为1的指数分布,求α=ξ+η与β=x/h的联合密度; 并分别求出ξ+η与x/h的密度.
解 (x,h)的联合密度:当x > 0且y > 0时,p(x, y) =, 其它情况为0.
函数组的反函数组为,当x, y>0时, u, v>0,
==-, 故 |J| =,
由(13)式,(a,b)的联合密度为:
u >0且v >0时, q(u, v ) =; 在其它情况q(u, v) = 0.
a=ξ+η与b=x/h各自的密度为q(u, v) 的边际密度. 不难看出:
u>0时,; u£0时,=0;
v>0时,=1/; v£0时,=0,
并且a,b相互独立.
本例中,自然也可以用第三段中的方法计算ξ+η与x/h各自的分布,但这里的方法显然更方便.
这是一个富有启发性的例子,它告诉我们:要判断随机向量的几个函数h1,…,hn是否独立,可用随机向量变换公式求得它们的联合分布,再用独立性的各种充要条件来判断;要求随机向量的一个函数的分布,有时可适当补充几个函数,先求它们的联合分布,而原来要求的函数的分布可作为其边际分布.
例11 假设X是一个随机变量,令Y=2X,那么我们可以用X的分布函数FX(x)来表示(X,Y)的联合分布函数FXY(x,y).
如果y³2x,那么
P(X£x,Y£y)=P(X£x)=FX(x);
如果y<2x, 那么
P(X£x, Y£y)=P(Y£y)=P(X£y/2)=FX(y/2)
因此
例12 x,h相互独立,并且x服从N(0,s2), h服从(0,p)上的均匀分布.求a=x+acosh的密度函数,其中a为常数.
解 (x,h)的联合密度为:
p(x,y)=
令b=h,那么与变换a=x+acosh,b=h相对应的方程组是
它有唯一解
并且J=1. 这样我们得到q(u,v)=p(u-acosv,v).因此,a的密度函数为
例13 x与h独立同分布,都服从N(0, 1), ξ=,η=. 求证: r=r (x,h)与j=j(x,h)相互独立.
证 先利用(13)式求(r,j)的联合密度. 变换的函数组与反函数组分别为
在{-∞< x <∞,-∞< y <∞, (x, y) ¹(0, 0)} 与 {r>0, 0£q<2p}中变换是一一对应的, J=r, (x,h)的联合密度为
p(x, y) =,
故(r,j)的联合密度为
q(r, q) =
q(r, q)可分离成R(r) ×Q(q),其中
R(r) =, Q(q)=
分别为r,j的密度,故r与j相互独立. 这里r的分布称为瑞利(Rayleigh)分布,j是[0, 2p]上的均匀分布.
反之,设x1, x2相互独立,都服从U[0, 1],
,,
则相互独立,都服从N(0, 1);这是产生N(0, 1)随机数的一种基本方法.
从本章习题我们可以看到, 即使x,h相互独立, x和h的两个函数f1(x,h)与f2(x,h)仍然可以不独立. 但在某些特殊情况,仍保持独立性.
例14 假设随f1机变量X和Y相互独立,并且Z仅是X的函数,W仅是Y的函数:如果导数存在,那么Z和W仍相互独立.
证. 首先假设,有唯一解. 既然
=
并且,我们有
但x1仅是z的函数,y1仅是w的函数;因此,Z和W相互独立. 至于解并不唯一的情况,也可类似证明,请读者自行完成.
更一般地我们有下面的定理.
定理3 令;f1是n1个变量的Borel可测函数,f2是个变量的Borel可测函数,…,fk是个变量的Borel可测函数. 如果X1, X2,… , Xn是独立随机变量,那么
是相互独立的.
特别,当是单变量函数时,我们有相互独立.
注意逆命题不成立,即有这样的例子:x2,h2相互独立,但x与h不独立(见本章习题65).
五、数理统计中几个重要分布
本段介绍数理统计中应用很广的三个重要分布——c2分布, t分布和F分布. 它们都与正态分布有密切关系,都可作为随机变量的函数来导出它们的密度.
先讨论比c2分布更广泛的一类分布——G分布,它的密度函数由§2的(15)式定义. 这里再来介绍G分布的一个重要性质.
引理(G分布的可加性)G分布G (l,r)对第二个参数具有可加性:若x1, x2相互独立,x1~G(l,r1), x2~G(l, r2), 则x1+x2~G(l,r1+ r2).
证 由卷积公式(7)¢式,h= x1+x2的密度:当z<0时,ph(z)=0; 当z>0时,
ph(z)=.
整理后,作变量代换x=z t,并利用第二型欧拉积分
B(r1, r2) ==G(r1)G(r2)/G(r1+ r2),
就有
,
所以η~G(l,r1+ r2).
当r=1时,G(l,1) 即为指数分布. 另一特殊情况是取l=1/ 2, r =n/2(n为自然数),即为下面的
1. c2分布
称G(1/2, n /2)为c2(n)分布,其中称n为它的自由度(degree of freedom). 它的密度为
(14)
定理4 (1)c2分布具有可加性,也就是说,设x1~c2(n1),x2~c2(n2),则x1+x2~c2(n1+ n2);(2) 若x1,¼, xn相互独立,都服从N(0,1),则
~c2(n). (15)
证 (1) 由G分布的可加性即得c2分布的可加性.
(2) 记, i=1,…,n, 由{xi}相互独立,可知{hi}相互独立. 又在本节的例4已经直接算得hi的密度,由于,故hi~c2(1),再由(1), 运用数学归纳法,就得~c2(n).
上述定理显示了c2分布的本质属性,c2分布中的自由度n即是中独立正态变量xi的个数.
2. t分布
定理5 若x~N(0,1), η~c2(n), 且x与η相互独立,则随机变量的密度函数为
p(x) =, -∞< x <+∞. (16)
称具有上述密度的随机变量T服从t(n)分布,n为它的自由度.
为了证明定理5, 可先用定理1求出的密度,再用商的密度公式(8)求出T=x/q的密度,详细证明见本章末的补充与注记6.
3.F分布
定理6 设随机变量x~c2(m), η~c2 (n), x与η相互独立, 则F=的密度函数为
(17)
称具有上述密度的随机变量服从F(m,n)分布,m与n分别为它的第一自由度和第二自由度.
为了证明定理,可先用定理1求得与的密度,然后再利用商的密度公式(8)求得F=的密度,详细计算见本章末的补充与注记6.
F分布有下述性质:
(1)若F~F(m, n), 则1/ F~F(n, m). 这从F的定义立即可以得到.
2) 若T~t(n),则T2~F(1, n).
证,x与η相互独立, x~N(0,1),h~c2(n),而,且x2~c2(1), x2与η相互独立,所以T2~F(1, n).
补充与注记
1. 十九世纪中叶以前,概率论的主要兴趣仍然集中在随机事件的概率计算上. 俄国数学家切贝雪夫(Chebyshev 1821-1894),马尔可夫(Markov 1856-1922)和李雅普洛夫(Lyapunov 1857-1918)等首先明确地引进随机变量这一概念,并加以广泛地应用与研究.
2. 电话的呼叫数, 等车的乘客数, 放射粒子数等等随机变量为什么服从普阿松分布呢?这些随机变量表示的都是在一定的时间或空间内出现的事件数, 它们具有下列共同的特性,即平稳性,独立增量性和普通性. 以电话交换台固定时间t内收到的呼唤数x为例来说明这件事,它具有
平稳性,即在 [t0, t0+t] 时段内来到的呼叫数x= k的概率只与时段的长度t有关,而与区间的起点t0无关,记作Pk (t). 从而对不同时段的呼叫数的考察当长度t相同时可以看成重复试验.
独立增量性(无后效性),即x=k这一事件与t0以前所发生的一切事件独立,所以考察不同时段的呼叫数是独立试验.
普通性,指在充分小的时间间隔内,最多来到一个呼叫,严格地说,当t→0时
1-P0(t)-P1(t)=o(t) (1)
现在我们来计算Pk (t),把区间[t0, t0+1)n等分,则 [t0, t0+ t) 分成nt份,取足够大的n并把nt看成整数,并使近似地在每个小区间 [t0+ (r-1)/n, t0+ r/n) 内至多有一次呼叫, (t=1/n), r=1,2,…, nt. 故在一个小区间内有还是没有一次呼叫是一次贝努里试验,而由于头两条性质,对整个时段[t0, t0+ t) (即对nt个小区间) 的考察可看成是nt重贝努里概型,故事件{x= k}近似服从二项分布:
P(x= k)≈b(k; nt, pn) (2)
这里pn是在一个小区间中有一次呼叫的概率,它与区间长度t成正比,即pn=lDt.
现在我们来计算Pk (t),把区间[t0, t0+1)n等分,则 [t0, t0+ t) 分成nt份,取足够大的n并把nt看成整数,并使近似地在每个小区间 [t0+ (r-1)/n, t0+ r/n) 内至多有一次呼叫, (t=1/n), r=1,2,…, nt. 故在一个小区间内有还是没有一次呼叫是一次贝努里试验,而由于头两条性质,对整个时段[t0, t0+ t) (即对nt个小区间) 的考察可看成是nt重贝努里概型,故事件{x= k}近似服从二项分布:
P(x= k)≈b(k; nt, pn) (2)
这里pn是在一个小区间中有一次呼叫的概率,它与区间长度t成正比,即pn=lDt.
(2)式是近似的,其原因是略去了高阶无穷小,当Dt→0即n→∞时, (2)变为精确值. 由普阿松定理,得到 (注意)
, k=0,1,2,….
这就说明了x服从参数为lt的普阿松分布.
在随机过程理论中,将用更严密的方法讨论这件事,并把上述结果进一步推广.
3. 我们来说明G-分布及指数分布的实际意义. 把参数为的普阿松过程中接待r个顾客所需要的时间记为tr我们来推导它的分布函数F( t ).
当t£0时,F(t) = 0;
当t>0时,以x(t)表示t秒内接待的顾客数,它服从参数为lt的普阿松分布,而事件{tr≤t} = {ξ(t)≥r}, 从而
F(t) =P(tr≤t) = P(ξ(t)≥r) =1-P(ξ(t)< r) = 1-,
故而其密度函数
p(t) =F¢(t) =
, (t >0).
这正是G-分布. 上面推导说明普阿松过程中接待r个顾客所需要的时间tr服从G-分布. 如果我们把某机器更换一个零件看成接待一个顾客,则更换相同的r个零件所需的时间tr服从G-分布. 特别,更换一个另件所需时间t(即该另件的寿命) 服从指数分布. 所以指数分布有时也称为寿命分布.
4. 离散型随机变量的概率密度函数
定义脉冲函数,即所谓广义函数,它是满足下列积分关系的函数:对所有在0点连续的函数f
通过平移变换,不难看出下式成立:
这样,对任意函数F(x),如果x0是其不连续点,令k是F(x)在x0处的跳跃高度,即. 那么在x0的值可看成是在x0处的导数. 假如X是离散型随机变量,具有分布列
,
那么,它的密度函数可写为:即.
同样也可用p(x)的积分来表达事件的概率,如
,
.
例. 如果X服从退化分布,只取一个值c,那么它的密度函数为;如果X服从两点分布,取0,1两个值的概率分别为1-p和p,那么它的密度函数为.
混合型随机向量的联合概率密度函数
假设X是离散型随机变量,分布列如上;Y是连续型随机变量,分布密度为, 这样(X,Y)的联合概率分布完全集中在一族直线上. 落在线段上的概率为
.
这时,联合分布函数对y连续,对x不连续,其中不连续点为如果X和Y相互独立,那么利用前面关于离散型随机变量密度函数,同样可以写出(X,Y)的联合密度函数为
,即
例. 假设Z是一个服从(-p,p)上均匀分布的随机变量,如果,, 那么(X,Y)的联合概率分布完全集中在圆周上. 为了计算其概率密度函数,令,那么r和Z相互独立,
并且联合概率密度函数为
另外,方程组
有唯一解,并且|J|=1. 因此,(X,Y)的联合概率密度函数为
5. 存在性定理
尽管常用的随机变量和分布函数都有其实际背景,与某个具体的随机试验相联系,但为了理论研究的方便,我们通常假设某随机变量服从某分布或具有某密度函数,而不涉及具体的随机试验. 事实上,下面的存在性定理表明,给定任一个分布函数,总可以构造一个适当的试验和相应的随机变量使得其具有分布函数.
定理 假如G(x)是一个分布函数,那么存在一个概率空间和一个随机变量使得在下的分布函数恰好等于G(x).
证. 我们把所有实数看成是想象的某试验的结果,即,并定义其上的域F为R上的Borel域B. 定义概率P如下:对任意x,定义F中的事件(-¥,x]的概率
.
这样,由测度论中的有关理论知道,F上的所有事件的概率都是确定的. 现在定义随机变量X如下:
这是合理的,因为这里的w是一个实数. 进而,对任意x我们有
6.复合分布. 以上我们介绍了一些常用的分布函数,但在实际问题中往往需要考虑其他类型的分布函数或者是上述常用分布函数的复合. 例如,在保险精算业务中,时常需要考虑下列一种风险模型. 记N是给定时期保单的理赔次数,Xi是第i次理赔的理赔量,则该时期的总理赔量S等于. 这个模型的特点在于理赔次数N是随机变量,因此S的分布是Xi的分布与N的分布的复合. 为讨论模型方便,我们作如下假定:
i) 随机变量序列Xi同分布,共同分布为F(x);
ii) 随机变量序列N, X1,X2,¼,相互独立.
这样S的分布可由全概率公式加以计算
当N服从普阿松分布时,我们称S的分布为复合普阿松分布.
例. 假设N服从几何分布,,,其中,;Xi为指数分布,,求S的分布
解. 记. 由上述公式得,;对,
=
=
=.
这表明S是一个混合型分布:取0值的概率为p,以概率q在(0,¥)上服从参数为p的指数分布.
7. 全概率公式的连续形式
假设A是任一事件,并且,令X是一随机变量,其分布函数为F(x),密度函数为p(x). 对,因为,那么
并且进而有
. (1)
对任意集合B,如果,那么没有定义. 然而,如果B与X有关,那么我们可以用某种极限的方式来定义. 现考虑一种重要情形,即. 假设对某个x,,我们可以定义
.
这样由(1)有
,
其中
称为在条件A下的条件密度函数,它具有密度函数的性质. 从上述进一步成立
既然右边等于,那么我们获得全概率公式的连续形式
和相应的贝叶斯公式
例. 假设随机变量P服从(0,1)区间上的均匀分布. 现独立投掷一枚硬币10次,每次出现正面的概率为. 求出现4次正面的概率?
解. 用表示投掷硬币10次所出现的正面次数,当时,x服从二项分布. 因此,由全概率公式得
=
=
8. t分布与F分布的密度函数的推广.
1). t(n)分布
若ξ~N(0, 1),h~,且ξ与η相互独立,我们来计算t =ξ/的密度.
先求θ=的密度. y =是x的严格增加函数,其反函数x = ny2有连续导数. 对 y>0
=;
显然当y£0时,.
再求t =ξ/θ的密度. 因为ξ与η相互独立,故ξ与θ也独立. 由商的密度公式,t的密度为
= (令u=) =
=, (-∞< z <∞).
2). F(m, n )分布
设ξ~,η~,ξ与η相互独立. 我们来计算F=的密度.
先计算的密度. 令y = x / m, 则x = my.的密度为
=, (y >0).
同理,的密度为, (x >0). 因此的密度是
= (令u=)
=
=, (z >0);
第二章第五节
第二章 第五节 奇格异局福寿多
第二章 阴阳是个总纲,寒热左右健康 第五节
第五节 法律解释 第二章 法的运行 法理学 法法网2011年司法考试教材
第十三章 第五节 时带正马格
第五章 第五节 飞天禄马格
第三章 第五节 日柱断婚姻
第四章 第五节 日时最关键
第五节 数组
第五节 分 型
第五节 王昌龄研究
第五节 疟疾
第五节 白血病
第五节 失眠1
第五节 职业生涯规划
第五节 科举考试
第五节 神经系统病症
童年第五节
第九章 第五节 福德秀气格
第八章 第五节 六十花甲纳音论命(水)
第八章 第五节 六十花甲纳音论命(土)
第八章 第五节 六十花甲纳音论命(木)
第八章 第五节 六十花甲纳音论命(火)
第八章 第五节 六十花甲纳音论命(金)