中心极限定理典型习题

2024-11-09

中心极限定理典型习题(精选6篇)

1.中心极限定理典型习题 篇一

CH5 大数定律及中心极限定理

1.设Ф(x)为标准正态分布函数,Xi=

1001,事件A发生;0,事件A不发生,i=1,2,…,100,且P(A)=0.8,X1,X2,…,X100

相互独立。令Y=

i1Xi,则由中心极限定理知Y的分布函数F(y)近似于()

y80

4A.Ф(y)

2.从一大批发芽率为0.9的种子中随机抽取100粒,则这100粒种子的发芽率不低于88%的概率约为.(已知φ(0.67)=0.7486)

3.设随机变量X1,X2,…,Xn,…独立同分布,且i=1,2…,0

nB.Ф()C.Ф(16y+80)D.Ф(4y+80)

Yn

i1Xi,n1,2,.Φ(x)为标准正态分布函数,则limPn1()np(1p)Ynnp

A.0B.Φ(1)C.1-Φ(1)D.1

4.设

5.设X服从(-1,1)上的均匀分布,试用切比雪夫不等式估计

6.设

7.报童沿街向行人兜售报纸,设每位行人买报纸的概率为0.2,且他们买报纸与否是相互独立的。试求报童在想100为行人兜售之后,卖掉报纸15到30份的概率

8.一个复杂系统由n个相互独立的工作部件组成,每个部件的可靠性(即部件在一定时间内无故障的概率)为0.9,且必须至少有80%的部件工作才能使得整个系统工作。问n至少为多少才能使系统的可靠性为0.95

9.某人有100个灯泡,每个灯泡的寿命为指数分布,其平均寿命为5小时。他每次用一个灯泡,灯泡灭了之后立即换上一个新的灯泡。求525小时之后他仍有灯泡可用的概率近似值相互独立的随机变量,且都服从参数为10的指数分布,求 的下界 是独立同分布的随机变量,设, 求

2.中心极限定理典型习题 篇二

1.1独立同分布下的中心极限定理

林德伯格-莱维中心极限定理:设{Xn}是独立同分布的随机变量序列, 且E (Xi) =μ, D (Xi) =σ2>0, (i=1, 2, …n) , 记, 则对任意实数y, 有

也可记作.

1.2二项分布的正态近似

棣莫弗-拉普拉斯中心极限定理:设n重伯努利试验中, 事件A在每次试验中出现的概率为p (0<p<1) , 记μn为n次试验中事件A出现的次数, 且记, 则对任意实数y, 有

也可记作.

棣莫弗-拉普拉斯中心极限定理是概率论历史上的第一个中心极限定理, 它是专门针对二项分布的, 因此又被称为“二项分布的正态近似”, 与泊松定理给出的 “二项分布的泊松近似”相比, 一般地, 当p较小时, 用泊松分布近似较好, 而当np>5时, 用正态分布近似较好.

2.应用举例

2.1社会保险问题

例1.某地有2500人参加人寿保险, 每人在年初向保险公司交付保险费12元, 若在这一年内死亡, 则由家属从保险公司领取2000元, 设该地人口死亡率为2‰, 求保险公司获利不少于10000元的概率?

解:设X表示“投保中死亡的人数”, 则X-B (2500, 0.002) , , 由中心极限定理, 公司获利不少于10000, 必须满足:2500×12-2000X>10000, 即X<10

即保险公司盈利不少于10000元的概率大约是0.9874, 这个概率还是挺大的.

2.2商品订购问题

例2.某商店负责供应某地1000人的商品, 此种商品在一段时间内每人需用一件的概率为0.7, 问商店至少要进多少件商品才能以99%的把握不脱销?

解:设Xi表示第i个人购买与否, 则

设商店备货a件, X=X1+X2+…+Xn (n=1000) , 则X~B (1000, 0.7) , E (X) =np=700, , 由中心极限定理,

查正态分布表得, 故a取731.

2.3医药测试问题

例3.某药厂断言, 该厂生产的某种药品对于医治某种疾病的治愈率为0.9, 医院化验员随机抽查100个服用此药品的病人, 如果多于85人治愈, 就接受这一断言, 否则就拒绝接受.如果检查结果是这种疾病的治愈率为0.9, 则接受这一断言的概率是多少?

解:设X表示其中治愈病人的人数, 则X~B (100, 0.9) , E (x) =np=90, , 由中心极限定理,

故接受这一断言的概率为0.952.

中心极限定理在实际中应用广泛, 以上仅说明了其在三个方面的应用. 中心极限定理就是用来描述随机变量和的概率分布的极限定理, 阐述了一些原来并不服从正态分布的独立随机变量, 它们的和的分布近似服从正态分布.正是这个定理使得正态分布在概率统计中占有重要地位.

参考文献

[1]李子强.概率论与数理统计教程.科学出版社, 2012:137-138.

3.中心极限定理典型习题 篇三

关键词 导数算子; Malliavin随机变分;中心极限定理;高斯过程

中图分类号 O211 文献标识码 A

Central Limit Theorem for Function of Gaussian Process and Its Applications

SUNLin

(Applied Mathematics, Guangdong University of Technology, Guangdong, Guangzhou 510090, China)

AbstractUsing two operators and the relative identity of Wiener space, this paper presented a new method to provethe central limit theorem for function of Gaussian process. Furthermore, the applications of this central limit theoremwere presented.

Keywords derivative operator; Malliavin calculus; central limit theorem; Gaussian processes

1引 言

前苏联著名概率论学者Gnedenko和Kolmogrov曾说过“概率论的认识论的价值只有通过极限定理才能被揭示,没有极限定理就不可能去理解概率论的基本概念的真正含义” [1].因此研究统计量或者随机变量的统计特性,最重要的就是研究其极限理论.而实际问题中所获得的很多数据都可以认为来自高斯过程函数总体,比如来自正态随机变量就可以看成来自关于高斯过程恒等映射的总体.从而自上世纪30年代起,概率极限理论已获得完善的发展.近年来关于高斯过程函数的统计特性成为研究中的热门方向之一,大量学者研究了关于高斯过程函数的极限定理,如Nualart和Peccati (2005)[2],Nualart和Ortiz-Latorre (2008)[3], Peccati (2007)[4] ,Hu和Nualart(2005)[5] ,Peccati和Taqqu (2008)[6]以及Peccati和Taqqu (2007)[7].大量的文献如Deheuvels、Peccati与Yor (2006) [8],Hu和Nualart(2009) [9] 应用了该定理.

本文首先利用Malliavin随机变分法,通过导数算子和散度型算子,并利用恒等式构造了证明高斯过程函数的中心极限定理的新方法,该证明避免了采用Dambis-Dubins-Schwarz以及Clark-Ocone公式.进一步结合具体实例,给出了该中心极限定理的应用.

2 主要结论及其证明

定理 1[3]:设定k≥2,且Fnn≥1为k阶维纳混沌中平方可积随机变量序列.若lim n→+

EF2n=‖fn‖2H⊙k→σ2,则当n→

时,下面命题是等价的:

ⅰ)Fn→N(0,σ2);

ⅱ)lim n→

EF4n→3σ2;

ⅲ)对于所有的1≤l≤k-1,有

lim n→+

‖fnlfn‖2H2(n-1)=0;

ⅳ)‖DFn‖2HL2(Ω)n→+

kσ2,

其中,fn是关于随机变量Fn的平方可积核函数,

fnlfn表示两核函数的l次指数压缩.

证明 将采用下面的证明路线:ⅳ)ⅰ)ⅱ)ⅲ)ⅳ).

1)ⅳ)ⅰ)

不失一般性,令σ2=1,则由已知条件‖DFn‖2HL2(Ω)n→+

σ2,待证当n→+

时,有依分布收敛Fn→ε~N(0,1)成立.也就是说对于任意二次连续可微有界函数φ•有下面式子成立:

lim n→+

Eφ(Fn)=Eφ(ε). (1)

对于0≤t≤1,定义

ψt=EφtFn+1-tε.(2)

注意到ψ0=Eφε且ψ1=EφFn,由微积分基本定理知

EφFn-Eφε

=ψ1-ψ0=∫10ψ′tdt. (3)

另一方面,利用Malliavin随机变分恒等式

δDF=kF与E[〈DF(ξ),u((ξ))〉]=E[DF(ξ)δu(ξ)],易知∫10ψ′(t)dt可以表示为:

∫10ψ′tdt=∫10ddtEφtFn+1-tεdt

=∫10EddtφtFn+1-tεdt

=12k∫10Eφ″tFn+1-tε‖DFn‖2dt

-12∫10Eφ″tFn+1-tεdt

=12∫10Eφ″tFn+1-tε•

1k‖DFn‖2-1dt. (4)

由式(3)和式(4)知

EφFn-Eφε

=12∫10Eφ″tFn+1-tε•

1k‖DFn‖2-1dt.(5)

两边取绝对值,并利用φ•的二阶导的有界性以及假设条件‖DFn‖2HL2(Ω)n→+

k,则有

EφFn-Eφε

=12∫10Eφ″tFn+1-tε•

1k‖DFn‖2-1dt→0.

故lim n→+

Eφ(Fn)=Eφ(ε)成立,即有当n→

时,Fn→N(0,σ2).

2)ⅰ)  ⅱ)

首先由参考文献Nualart(2006)知对于任意p≥2,有

EFnp≤ckEFn2, (6)

其中,ck∈R且与n独立.

式(4)结合假设条件lim n→+

EF2n=σ2可得当n→

时,

EFnp≤ckEFn2→ckσ2.(7)

则对于任意p≥2,有

sup nEFnp<+

.(8)

进一步根据假设当n→

时,Fn→η~N(0,σ2),根据期望的连续性有EF4n→Eε4,从而要证明lim n→

EF4n→3σ2,只需证Eη4→3σ2即可.

令X~N(0,σ2)且Y=Xσ~N(0,1),则对于任意n≥0,有

Eηn=EXn=σnEXσn=σnEYn.

另一方面,随机变量Y的特征函数可以表示为

φt=EeitY=e-t22=∑+

n=0-1nt2n2nn!

=∑+

n=01n!φn0tn=1-t22•1!+

t422•2!-t623•3!+…,

其中,φn00,n=2k+1,

-1k2k!2kk!,n=2k.

从而

EYn=φn0in=0,n=2k+1,

2k!2kk!=n!!,n=2k.(9)

令n=4,则有EYn=4!222!=3.

3)ⅱ)ⅲ) 见参考文献Nualart和Peccati(2005).[2]

4)ⅲ)ⅳ) 见参考文献Nualart和Ortiz-Latorre(2008).[3]

3应用实例

由定理1可知:若Fnn≥1为k≥2阶维纳混沌中平方可积随机变量序列.且lim n→+

EF2n→σ2,则如果要证明当n→

时,Fn→N(0,σ2).只需证明‖DFn‖2HL2(Ω)n→+

kσ2即可.该定理在证明统计量以及随机变量的函数满足中心极限定理时非常有用.下面给出该定理的应用例子.

首先由于林德伯格—勒维中心极限定理在概率中有着重要地位,是数理统计中大样本统计推断的理论基础.该定理说明如果现实生活中的某个量是由许多独立的因素影响叠加而成的,而其中偶然因素的影响又是一致得微小,则可以断定这个量近似服从正态分布.可采用定理1来证明该定理.

实例1(林德伯格—勒维定理) 设X1,X2,…,Xn,…是独立同分布的随机变量序列, 且

E(Xi)=μ,Var(Xi)=σ2,i=1,2,…,n,…

则∑ni=1Xi-nμσn→N(0,1).

证明 该定理表明:当n充分大时, n个具有相同期望和方差的独立同分布的随机变量之和近似服从正态分布.虽然在一般情况下, 很难求出X1+X2+…+Xn分布的具体形式, 但当n很大时, 可求出其近似分布.由定理结论有

∑ni=1Xi-μn→N(0,σ2).(10)

采用定理1来证明式(10).证明的关键在于找到合适的函数序列Fn∈Hk使得当n→

时:有EF2n→σ2且‖DFn‖22L2(Ω)kσ2.

对于任意k≥1,令ξi=Xi-μ,i=1,2,…,n,则ξi为独立且服从标准正态分布的随机变量.进一步令Fn=1nhkξ1+hkξ2+…+hkξn,这里k≥1且hk•为厄米多项式(详见参考文献Nualart (2006)).另一方面,

EF2n=E1nhkξ1+hkξ2+…+hkξn2

=1nnEh2kξ1=1k!=σ2. (11)

同时根据导数算子的定义知,对于1≤i≤n,有DiFn=0,…,1nh′kξi,0…0,故

‖DFn‖22=D1Fn2+D2Fn2+…+

DnFn2→Eh2k-1ξ1

=1k-1!=kσ2.(12)

由式(11)和式(12)知EF2n→σ2且‖DFn‖22L2(Ω)kσ2成立,从而林德伯格—勒维定理证毕.

实例 2(高斯移动平均)考虑独立高斯时间序列Znn≥0,满足EZn=0且

VarZn=σ21-λ,n=0;

σ2,n≥1,

这里λ2<1.再定义迭代过程

X0=Z01-λ2,Xn=λXn-1+1-λ2Zn,n≥1.

则Xn可以表示为

Xn=∑nj=0cn-jZj .

其中cn-j=λn-j.易证Xn是平稳遍历时间序列且满足

EX0=0,

VarXn=1.

下面证明∑ni=1Xin→N(0,1).利用定理1,需要构造合理的Fn,令

Fn=1nhkX0+hkX1+…+hkXn,

其中,k≥1且hk•为厄米多项式(详见参考文献Nualart (2006)),则显然Fn∈Hk,且有

EF2n=E1nhkX0+hkX1+…+hkXn2

=1nnEh2kX1=1k!=σ2,

以及

‖DFn‖22=D1Fn2+D2Fn2+…+DnFn2

→Eh2k-1X1=1k-1!=kσ2.

根据定理1知Fn→N(0,1).取k=1以及利用厄米多项式h1x=x知∑ni=1Xin→N(0,1).

实例 3 (带漂移项的布朗运动)20世纪初,Bachelier采用带漂移的布朗运动来刻画股票的价格行为模式,即:

St=s0+σBt,t∈0,T.

显然St为均值为S0,方差为σ2的高斯过程.固定观察间隔h,得到观察量Sh,…,Sjh,…,Snh,令 t=h,…,jh,…,nh′,Bt=Bh,…,Bjh,…,Bnh′,S0=s0,…,s0,…,sn′与S=Sh,…Sjh…Snh′.从而该随机向量的联合分布密度函数可以表示为

LS;σ2=2π-n2Γ-12•

exp-12S-S0′Γ-1S-S0,(13)

其中,

Γ=[Cov[Si,Sj]]i,j=1,2,…,n=σ2[Cov [Bi, Bj]]i,j=1,2,…,n =σ2[i∧j]i,j=1,2,…,n.

对式(13)两边取对数,并对σ2求导可得其极大似然估计量

2=1nS′Γ-1St′Γ-1t-t′Γ-1Y2t′Γ-1t.(14)

于是利用定理1得出由式(14)给出的估计量的中心极限定理.令

Fn=1σ2n22-σ2

=1σ2n21nS′Γ-1St′Γ-1t-t′Γ-1Y2t′Γ-1t-σ2,

显然有

lim n→

EFn=E1σ2n2σ^2-σ22

=1σ4n2σ4nnn+2-2n+2+3+σ4-2σ2n-1nσ2

=1.(15)

另一方面将St=s0+σBt代入式(15)并对其求Malliavin导数可得

DFn=12n2DB′tΓ-1Bt-2t′Γ-1Btt′Γ-1DBtt′Γ-1t,(16)

其中

DBt=(1[0,h](s),1[0,2h](s),…,1[0,nh](s))′.由式(16)知

‖DFn‖2H=2n‖DB′tΓ-1Bt‖2H+t′Γ-1Bt2‖t′Γ-1DBt‖2Ht′Γ-1t2-2t′Γ-1DBt〈DB′tΓ-1Bt,t′Γ-1DBt〉Ht′Γ-1t

=2nB′tΓ-1Bt-t′Γ-1Bt2t′Γ-1t=22σ2. (17)

根据式(15)和式(17),结合定理1知

Fn=1σ2n2σ^2-σ2~N0,1

4结 论

本文主要采用了新的方法证明了关于高斯过程函数的中心极限定理,并将给出了该定理的具体应用.虽然本文只给出了一维情况下的中心极限定理,但对于多维情况,可以得到类似的结论.当然,除了研究高斯过程函数的几乎处处中心极限定理之外,对高斯过程函数的几乎处处大偏差性质、几乎处处局部中心极限定理及几乎处处中心极限定理收敛度等问题需进一步研究.

参考文献

[1] B V GNEDENKO, A M KOLMOGORV. Limit distributions for sums of independent random variables [M]. Addison-Wesley, 1954.

[2] D NUALART, G PECCATI. Central iimit theorems for sequences of multiple stochastic integrals [J]. Annals of Probability. 2005, 33(1): 177-193.

[3] D NUALART, S Ortiz-Latorre. Central iimit theorems for multiple stochastic integrals and malliavin calculus [J]. Stochastic Processes and their Applications. 2008, 118(4):614-628.

[4] G PECCATI. Gaussian approximations of multiple integrals [J]. Electronic Communications in Probability. 2007, 34(12): 350-364.

[5] YHU, D NUALART. Renormalized self-intersection local time for fractional Brownian motion [J]. Annals of Probability. 2005, 33(3): 948-983.

[6] G PECCATI,MTAQQU. Stable convergence of multiple Wiener-It integrals [J]. Journal of theoretical probability. 2008, 21(3): 527-570.

[7] GPECCATI, M S TAQQU. Stable convergence of generalized  L2 stochastic integrals and the principle of conditioning [J]. Electronic Journal of Probability. 2007, 12(15): 447-480.

[8] P DEHEUVELS, G PECCATI, M YOR. On quadratic functionals of the Brownian sheet and related processes [J]. Stochastic Processes and their Applications. 2006, 116 (3): 493-538.

[9] Y HU, D NUALART. Parameter estimation for fractional Ornstein-Uhlenbeck processes [J]. Statistics and Probability Letters. 2010, 80(11-12), 1030-1038.

[10]D NUALART. The malliavin calculus and related topics [M]. 2nd Edition. Berlin: Springer-verlag, 2006.

4.中心极限定理典型习题 篇四

概率论与数理统计是研究随机现象统计规律性的学科.而随机现象的规律性在相同的条件下进行大量重复试验时会呈现某种稳定性.例如, 大量的抛掷硬币的随机试验中, 正面出现频率;在大量文字资料中, 字母使用频率;工厂大量生产某种产品过程中, 产品的废品率等.一般地, 要从随机现象中去寻求事件内在的必然规律, 就要研究大量随机现象的问题.在生产实践中, 人们还认识到大量试验数据、测量数据的算术平均值也具有稳定性.这种稳定性就是我们将要讨论的大数定律的客观背景.在这一节中,我们将介绍有关随机变量序列的最基本的两类极限定理----大数定理和中心极限定理.内容分布图示

★大数定理的引入 ★切比雪夫不等式

★例1

★例2 ★大数定理

★中心极限定理的引入 ★林德伯格—勒维定理

★例3 ★例6

★推论

大数定理

★棣莫佛—拉普拉斯定理 ★例4

★例5 ★例7

★例8 ★高尔顿钉板试验

中心极限定理

★内容小结

★课堂练习★习题4-4

内容要点:

一、依概率收敛

与微积分学中的收敛性的概念类似, 在概率论中, 我们要考虑随机变量序列的收敛性.定义

1设X1,X2,,Xn,是一个随机变量序列, a为一个常数,若对于任意给定的正数,有 limP{|Xna|}1, 则称序列X1,X2,,Xn,依概率收敛于a, 记为

nXnaP(n).PP定理1 设Xna,Ynb,又设函数g(x,y)在点(a,b)连续, 则

g(Xn,Yn)g(a,b).P

二、切比雪夫不等式

定理2设随机变量X有期望E(X)和方差D(X)2,则对于任给0, 有

P{|X|}22.上述不等式称切比雪夫不等式.注:(i)由切比雪夫不等式可以看出,若2越小, 则事件

{|XE(X)|} 的概率越大, 即, 随机变量X集中在期望附近的可能性越大.由此可见方差刻划了随机变量取值的离散程度.(ii)当方差已知时,切比雪夫不等式给出了X与它的期望的偏差不小于的概率的估计式.如取3, 则有

P{|XE(X)|3}9220.111.故对任给的分布,只要期望和方差2存在, 则随机变量X取值偏离E(X)超过3的概率小于0.111.三、大数定理 1.切比雪夫大数定律

定理3(切比雪夫大数定律)设X1,X2,,Xn,是两两不相关的随机变量序列,它们数学期望和方差均存在, 且方差有共同的上界, 即D(Xi)K,i1,2,, 则对任意0, 有

1limPnnni1Xi1nni1E(Xi)

11nn注: 定理表明: 当n很大时,随机变量序列{Xn}的算术平均值学期望

2.伯努利大数定理 1nni1Xi依概率收敛于其数E(X).ii1定理4(伯努利大数定律)设nA是n重伯努利试验中事件A发生的次数, p是事件A在每次试验中发生的概率, 则对任意的0, 有

nnlimPAp1

或 limPAp0.nnnn注:(i)伯努利大数定律是定理1的推论的一种特例, 它表明: 当重复试验次数n充分大时, 事件A发生的频率nAn依概率收敛于事件A发生的概率p.定理以严格的数学形式表达了频率的稳定性.在实际应用中, 当试验次数很大时,便可以用事件发生的频率来近似代替事件的概率.(ii)如果事件A的概率很小,则由伯努利大数定律知事件A发生的频率也是很小的,或者说事件A很少发生.即“概率很小的随机事件在个别试验中几乎不会发生”,这一原理称为小概率原理,它的实际应用很广泛.但应注意到,小概率事件与不可能事件是有区别的.在多次试验中,小概率事件也可能发生.3.辛钦大数定理

定理5(辛钦大数定律)设随机变量X1,X2,,Xn,相互独立, 服从同一分布,且具有数学期望E(Xi),i1,2,, 则对任意0, 有

1limPnnni1Xi1.注:(i)定理不要求随机变量的方差存在;

(ii)伯努利大数定律是辛钦大数定律的特殊情况;

(iii)辛钦大数定律为寻找随机变量的期望值提供了一条实际可行的途径.例如, 要估计某地区的平均亩产量, 可收割某些有代表性的地块, 如n块,计算其平均亩产量, 则当n较大时,可用它作为整个地区平均亩产量的一个估计.此类做法在实际应用中具有重要意义.四、中心极限定理

在实际问题中, 许多随机现象是由大量相互独立的随机因素综合影响所形成, 其中每一个因素在总的影响中所起的作用是微小的.这类随机变量一般都服从或近似服从正态分布.以一门大炮的射程为例, 影响大炮的射程的随机因素包括: 大炮炮身结构的制造导致的误差, 炮弹及炮弹内炸药在质量上的误差, 瞄准时的误差, 受风速、风向的干扰而造成的误差等.其中每一种误差造成的影响在总的影响中所起的作用是微小的, 并且可以看成是相互独立的, 人们关心的是这众多误差因素对大炮射程所造成的总影响.因此需要讨论大量独立随机变量和的问题.中心极限定理回答了大量独立随机变量和的近似分布问题, 其结论表明: 当一个量受许多随机因素(主导因素除外)的共同影响而随机取值, 则它的分布就近似服从正态分布.1.林德伯格—勒维定理

定理6(林德伯格—勒维)设X1,X2,,Xn,是独立同分布的随机变量序列, 且

E(Xi),D(Xi),i1,2,,n,2

nXini1limPxnnx12et2/2dt

注: 定理6表明: 当n充分大时, n个具有期望和方差的独立同分布的随机变量之和近似服从正态分布.虽然在一般情况下, 我们很难求出X1X2Xn的分布的确切形式, 但当n很大时, 可求出其近似分布.由定理结论有

ni1Xinn1近似n~N(0,1)ni1Xin近似/~N(0,1)X~N(,22/n),X1nni1Xi.故定理又可表述为: 均值为, 方差的0的独立同分布的随机变量X1,X2,,Xn,的算术平均值X, 当n充分大时近似地服从均值为,方差为2/n的正态分布.这一结果是数理统计中大样本统计推断的理论基础.2.棣莫佛—拉普拉斯定理

在第二章中,作为二项分布的正态近似,我们曾经介绍了棣莫佛—拉普拉斯定理,这里再次给出,并利用上述中心极限定理证明之.定理7(棣莫佛—拉普拉斯定理)设随机变量Yn服从参数n,p(0p1)的二项分布, 则对任意x, 有

YnnplimPxnnp(1p)x12et22dt(x)

注: 易见,棣莫佛—拉普拉斯定理就是林德伯格—勒维定理的一个特殊情况.3.用频率估计概率的误差

设n为n重贝努里试验中事件A发生的频率, p为每次试验中事件A发生的概率,q1p,由棣莫佛—拉普拉斯定理,有

nPpPnnpqnnpnpqn pqn1.pq

npqn2pq这个关系式可用解决用频率估计概率的计算问题:

4.李雅普诺夫定理

定理8(李雅普诺夫定理)设随机变量X1,X2,,Xn, 相互独立, 它们具有数学期望

n和方差: E(Xk)k,n时, D(Xk)2k0,i1,2,,记B2n.若存在正数, 使得当

k12k1Bn2nnE{|k1Xkk|2}0,则随机变量之和Xk的标准化变量: k1nZnk1nXkEXkk1DXkk1nnnkXk1Bnk1k 的分布函数Fn(x)对于任意x, 满足

nnXkkk1k1limFn(x)limPxnnBnx12et/22dt(x).注:定理8表明, 在定理的条件下, 随机变量

nnZnk1XkBnk1k.nn当n很大时,近似地服从正态分布N(0,1).由此, 当n很大时,XkBnZnk近似地服

k1k1n2.这就是说,无论各个随机变量Xk(k1,2,)服从什么分布,只要满从正态分布N,Bknk1n足定理的条件,那么它们的和Xk当n很大时,就近似地服从正态分布.这就是为什么正态随

k1机变量在概率论中占有重要地位的一个基本原因.在很多问题中,所考虑的随机变量可以表示成很多个独立的随机变量之和,例如,在任一指定时刻,一个城市的耗电量是大量用户耗电量的总和;一个物理实验的测量误差是由许多观察不到的、可加的微小误差所合成的,它们往往近似地服从正态分布.例题选讲:

切比雪夫不等式

例1(讲义例1)已知正常男性成人血液中, 每一毫升白细胞数平均是7300, 均方差是700.利用切比雪夫不等式估计每毫升白细胞数在5200~9400之间的概率.解 设每毫升白细胞数为X, 依题意, 7300,27002,P{5200X9400}P{52007300X730094007300}

P{2100X2100}P{|X|2100}.所求概率为

由切比雪夫不等式

P{|X|2100}1222/(2100)1(700/2100)11/98/9,即每毫升白细胞数在5200 ~ 9400之间的概率不小于8/9.例2 在每次试验中, 事件A发生的概率为0.75, 利用切比雪夫不等式求: 事件A出现的频率在0.74~0.76之间的概率至少为0.90? 解 设X为次试验中, 事件A出现的次数, 则

X~b(n,0.75), 0.75n, 20.750.25n0.1875n,所求为满足P{0.74X/n0.76}0.90的最小的n.P{0.74X/n0.76}可改写为

P{0.74nX0.76n}P{0.01nX0.75n0.01n}P{|X|0.01n}

在切比雪夫不等式中取0.01n, 则

P{0.74X/n0.76}P{|X|0.01n}122/(0.01n)2

10.1875n/0.0001n11875/n

依题意, 取n使11875/n0.9, 解得

n1875/(10.9)1875,0 即n取18750 时, 可以使得在n次独立重复试验中, 事件A出现的频率在0.74~0.76之间的概率至少为 0.90.中心极限定理

例3(讲义例2)

一盒同型号螺丝钉共有100个, 已知该型号的螺丝钉的重量是一个随机变量, 期望值是100g, 标准差是10g, 求一盒螺丝钉的重量超过10.2kg的概率.解 设为第i个螺丝钉的重量, i1,2,,100,100且它们之间独立同分布, 于是一盒螺丝钉的重量为XXi1i,且由E(Xi)100,D(Xi)10,n100,知E(X)100E(Xi)10000,由中心极限定理有

P{X10200}PnD(X)100,i1Xinn10200nX10000pn1001020010000

100X10000X10000P21P2

1001001(2)10.977250.02275.例4(讲义例3)计算机在进行数学计算时, 遵从四舍五入原则.为简单计.现在对小数点后面第一位进行舍入运算, 则误差X可以认为服从[0.5,0.5]上的均匀分布.若在一项计算中进行了100次数字计算, 求平均误差落在区间[3/20,3/20]上的概率.解 n100, 用Xi表示第i次运算中产生的误差.相互独立, 都服从[0.5,0.5]上的均匀分布, X1,X2,,X100且E(Xi)0,var(Xi)1/12,i1,2,,100, 从而

Y100100i1Xi1000100/1235100i1近似Xi~N(0,1).故平均误差X1100100i133,Xi落在2020上的概率为

3331PXP201002020100i1Xi320

3P35100i1Xi3(3)(3)0.9973.

例5(讲义例4)某公司有200名员工参加一种资格证书考试.按往年经验考试通过率为0.8,试计算这200名员工至少有150人考试通过的概率.解 1,令10,第i人通过考试第i人未通过考试,i1,2,,200,依题意,P{Xi1}0.8,np2000.8160,np(1p)32.200i1Xi是考试通过人数, 由中心极限定理4, 得

P{XiX160/32~N(0,1),150}P{X160/32}150160/200近似i1i200ii32

P{200i1Xi160/321.77}

1(1.77)(1.77)0.96, 即至少有150名员工通过这种考试的概率为0.96.例6(讲义例5)某市保险公司开办一年人身保险业务, 被保险人每年需交付保险费160元, 若一年内发生重大人身事故, 其本人或家属可获2万元赔金.已知该市人员一年内发生重大人身事故的概率为0.005, 现有5000人参加此项保险, 问保险公司一年内从此项业务所得到的总收益在20万到40万元之间的概率是多少? 解 记Xi1,若第i个被保险人发生重大事0,若第i个被保险人未发生重大故事故(i1,2,,5000)

于是Xi均服从参数为p0.005的两点分布, 且p{Xi1}0.005,np25.5000i1Xi是5000个被保险人中一年内发生重大人身事故的人数, 保险公司一年内从此

5000i1项业务所得到的总收益为0.01650002于是

Xi万元.5000P200.01650002Xi40P20i15000i1Xi30

P2025250.9955000i1Xi25250.995(1)(1)0.6826

250.9953025 例7 对于一个学校而言, 来参加家长会的家长人数是一个随机变量, 设一个学生无家长, 1名家长, 2名家长来参加会议的概率分别0.05, 0.8, 0.15.若学校共有400名学生, 设各学生参加会议的家长数相互独立, 且服从同一分布.求参加会议的家长数X超过450的概率.解 以Xk(k1,2,,400)记第k个学生来参加会议的家长数, 则Xk的分布律为

Xkpk00.0510.820.15

400易知E(Xk)1.1,D(Xk)0.19,k1,2,,400, 而XXk1k,由定理3, 随机变量

400Xk1k4001.1X4001.14000.190.19近似~400N(0,1), 故

X4001.14504001.1P{X450}P

4000.194000.19X4001.11P1.147

4000.191(1.147)0.1357.例8 设有1000人独立行动, 每个人能够按时进入掩蔽体的概率为0.9.以95%概率估计, 在一次行动中, 至少有多少人能进入掩蔽体.解 用Xi表示第i人能够按时进入掩蔽体, 令SnX1X2X1000.设至少有m人能进入掩蔽体, 则要求

P{mSn}0.95,Sn90090 {mSn}m10000.910000.90.1Sn900 90近似由中心极限定理, 有

~N(0,1), 所以

m900Sn900S900m900P{mSn}Pn1P

90909090查正态分布数值表, 得

m900901.65, 故m90015.65884.35884人.课堂练习

5.第五章 大数定律及中心极限定理 篇五

大数定律及中心极限定理

概率统计是研究随机变量统计规律性的数学学科,而随机现象的规律只有在对大量随机现象的考察中才能显现出来。研究大量随机现象的统计规律,常常采用极限定理的形式去刻画,由此导致对极限定理进行研究。极限定理的内容非常广泛,本章中主要介绍大数定律与中心极限定理。

5.1 切比雪夫Chebyshev不等式

一个随机变量离差平方的数学期望就是它的方差,而方差又是用来描述随机变量取值的分散程度的。下面我们研究随机变量的离差与方差之间的关系式。

定理5-1(切比雪夫不等式)设随机变量X的期望E(X)及方差D(X)存在,则对任意小正数ε>0,有:

或:

[例5-1]设X是抛掷一枚骰子所出现的点数,若给定ε=2,2.5,实际计算P{|X-E(X)|≥ε},并验证切比雪夫不等式成立。

解 X的分布律为

所以

当ε=2时,当ε=2.5时,可见,切比雪夫不等式成立。

[例5-2]设电站供电网有10 000盏灯,夜晚每一盏灯开灯的概率都是0.7,而假定所有电灯开或关是彼此独立的。试用切比雪夫不等式估计夜晚同时开着的灯数在6 800~7 200的概率。

解:设X表示在夜晚同时开着的电灯的数目,它服从参数n=10 000,p=0.7的二项分布。于是有

E(X)=np=10 000×0.7=7 000,D(X)=npq=10 000×0.7×0.3=2100,P{6 800

可见,虽然有10 000盏灯,但是只要有供应7 000盏灯的电力就能够以相当大的概率保证够用。

[例5-3补充] 用切比雪夫不等式估计

解: 的三倍的可能性极

可见,随机变量X取值与期望EX的差的绝对值大于其均方差小。

5.2 大数定律

在第一章中曾经提到过,事件发生的频率具有稳定性,即随着试验次数增多,事件发生的频率将逐渐稳定于一个确定的常数值附近。另外,人们在实践中还认识到大量测量值的算术平均值也具有稳定性,即平均结果的稳定性。大数定律以严格的数学形式表示证明了在一定的条件下,大量重复出现的随机现象呈现的统计规律性,即频率的稳定性与平均结果的稳定性。

5.2.1 贝努利大数定律

定理5-2 设m是n次独立重复试验中事件A发生的次数,p是事件A的概率,则对任意正数ε,有

贝努利大数定律说明,在大量试验同一事件A时,事件A的概率是A的频率的稳定值。

5.2.2 独立同分布随机变量序列的切比雪夫大数定律

先介绍独立同分布随机变量序列的概念。

称随机变量序列X1,X2,…Xn,…是相互独立的,若对任意的n>1,X1,X2,…Xn是相互独立的。此时,若所有的Xi又具有相同的分布,则称X1,X2,…Xn,…是独立同分布随机变量序列。

定理5-3 设X1,X2,…Xn,…是独立同分布随机变量序列E(Xi)=μ,D(Xi)=σ2(i=1,2…)均存在,则对于任意ε>0有

这一定理说明:经过算术平均后得到的随机变量在统计上具有一种稳定性,它的取值将比较紧密聚集在它的期望附近。这正是大数定律的含义。在概率论中,大数定律是随机现象的统计稳定性的深刻描述;同时,也是数理统计的重要理论基础。

5.3 中心极限定理

5.3.1独立同分布序列的中心极限定理

定理5-4 设X1,X2,…Xn,…是独立同分布的随机变量序列,且具有相同数学期望和方差E(Xi)=μ,D(Xi)=σ2(i=1,2,…)。记随机变量 的分布函数为Fn(x),则对于任意实数x,有

(不证)

其中φ(x)为标准正态分布函数。

由这一定理知道下列结论:

(1)当n充分大时,独立同分布的随机变量之和的分布近似于正态分布N2(nμ,nσ)。我们知道,n个独立同分布的正态随机变量之和服从正态分布。中心极限定理进一步告诉我们。

不论X1,X2,…Xn,…独立同服从什么分布,当n充分大时,其和Zn近似服从正态分布。

(2)考虑X1,X2,…Xn,…的平均值,有

它的标准化随机变量为,即为上述Yn。因此的分布函数即是上述的F(,nx)因而有

由此可见,当n充分大时,独立同分布随机变量的平均值 的分布近似于正态分布

[例5-3]对敌人的防御地段进行100次射击,每次射击时命中目标的炮弹数是一个随机变量,其数学期望为2,均方差为1.5,求在100次射击中有180颗到220颗炮弹命中目标的概率。解 设Xi为第i次射击时命中目标的炮弹数(i=1,2,…,100),则中命中目标的炮弹总数,而且X1,X2,…X100同分布且相互独立。

为100次射击

由定理5-4可知,随机变量近似服从标准正态分布,故有

[例5-4]某种电器元件的寿命服从均值为100(单位:小时)的指数分布。现随机抽出16只,设它们的寿命是相互独立的,求这16只元件的寿命的总和大于1 920小时的概率。

解 设第i只电器元件的寿命为Xi=(i=1,2,…16),E(Xi)=100,D(Xi)=1002=10 000,则是这16只元件的寿命的总和。

E(Y)=100×16=1 600,D(Y)= 160 000,则所求概率为:

5.3.2 棣莫弗(De Moivre)-拉普拉斯(Laplace)中心极限定理

下面介绍另一个中心极限定理,它是定理5-4的特殊情况。

定理5-5(棣莫弗-拉普拉斯中心极限定理)设随机变量Zn是n次独立重复试验中事件A发生的次数,p是事件A发生的概率,则对于任意实数x

其中q=1-p,φ(x)为标准正态分布函数。由棣莫弗-拉普拉斯中心极限定理得到下列结论:

(1)在贝努利试验中,若事件A发生的概率为p。又设Zn为n次独立重复试验中事件A发生的频数,则当n充分大时,Zn近似服从正态分布N(np,npq)。

(2)在贝努利试验中,若事件中A发生的概率为p,发生的频率,则当n充分大时,近似服从正态分布

【例5-5】用中心极限定理得到求解5.1例5-2的概率。

解 设同时开着的灯数为X,则

X-B(1000,0.7),np=1000×0.7=7000,为n次独立重复试验中事件A

【例5-6】设某单位内部有1000台电话分机,每台分机有5%的时间使用外线通话,假定各个分机是否使用外线是相互独立的,该单位总机至少需要安装多少条外线,才能以95%以上的概率保证每台分机需要使用外线时不被占用?

解:把观察每一台分机是否使用外线作为一次试验,则各次试验相互独立,设X为1000台分机中同时使用外线的分机数,则

X~B(1000,0.05),np=1000×0.05=50,根据题意,设N为满足条件的最小正整数

由于φ(-7.255)≈0,故有

查标准正态分布表得φ(1.65)=0.9505,故有

由此

N≥61.37

即该单位总机至少需要62条外线,才能以95%以上的概率保证每台分机在使用外线时不被占用。

小结 本章考核要求

(一)知道切比雪夫不等式

并且会用切比雪夫不等式估计事件|X-EX|≥ε或|X-EX|<ε的概率。

(二)知道贝努利大数定律

其中n是试验次数,m是A发生次数,p是A的概率,它说明试验次数很多时,频率近似于概率。

(三)知道切比雪夫不等式大数定律

取值稳定在期望附近。

它说明在大量试验中,随机变量

(四)知道独立同分布中心极限定理

记Yn~Fn(x),则有

它说明当n很大时,独立同分布的随机变量之和近似服从正态N(nμ,nσ2)所以,无论n个独立同分布的X1,X2,…Xn服从何种分布,n很大时,X1+X2+…Xn却近似正态N(nμ,nσ2).(五)知道棣莫弗—拉普拉斯中心极限定理

若Zn表示n次独立重复事件发生次数,即

Zn~B(n,p),则有

6.中心极限定理典型习题 篇六

limPxx;

nn

21nnXXniii1i

1C)limPxx;D)limPxx;

nnn

2

其中x为标准正态分布函数.解由李雅普诺夫中心极限定理:

E(Xi)

,D(Xi)

2i1,2,,n,111

Sn22

2



nn11

XinXiXin

i1i1N(0,1)

Snn

故选(B)

4.设随机变量X与Y的数学期望分别为-2和2,方差分别为1和4,而相关系数为0.5,则根据切贝谢夫不等式估计PXY6().A)



1111

B)C)D)461216

解|EXY220

(Y,)XY DXYDXDY2covX,Y,covX

1420.5123.由切贝谢夫不等式得 PXYEXY6故选(C)

5.若随机变量XB1000,0.01, 则P4X16().A)0.925B)0.825C)0.9D)0.725 解|因为 EX10000.0110,DXnpq100.999.9



DXY31

.623612

由切贝谢夫不等式得

P4X16PX106

1PX1061

故选(D)

DX9.9

110.2750.725.3662

二、填空题(每空2分,共10分)

1.已知离散型随机变量X服从参数为3的泊松分布,则利用切贝谢夫不等式估计概率

PX35解因为XPm

所以EXDX

3由切贝谢夫不等式PXEX5



DX3

.522

52.已知随机变量X存在数学期望EX和方差DX,且数学期望EX10,EX109,利用



切贝谢夫不等式估计概率PX106解因为 EX10,DXEX



EX

1091009

由切贝谢夫不等式PX106



DX9

1.2636

43.已知随机变量X的方差为4,则由切贝谢夫不等式估计概率PXEX3解由切贝谢夫不等式PXEX3





4.9

4.若随机变量XBn,p,则当n充分大时,X近似服从正态分布N 解因为 EXnp,DXnp1p.三、计算或证明题题(每题10分,共80分)

1.如果随机变量X存在数学期望EX和方差DX,则对于任意常数0,都有切贝谢夫不等式:

PXEX

DX

2

(证明当X为连续型随机变量时的情况)

证明 设连续性随机变量X的概率密度函数为x,则

PXEX

XEX

xdx

XEX

XEX

2

xdx

DX

2





XEXxdx

2

.2.投掷一枚均匀硬币1000次,试利用切贝谢夫不等式估计出现正面次数在450次~550次之间的概率.解设随机变量X表示1000次试验中出现正面朝上的次数, 由于

XB1000,0.5,所以EX500,DX250;

由切贝谢夫不等式

P450X550PX500501

DX250

10.9.2

250050

3.已知连续型随机变量X服从区间1,3的均匀分布,试利用切贝谢夫不等式估计事件X4发生的概率.133(1)4;

1,DX解由于XU1,3, 所以EX2123

由切贝谢夫不等式

D(X)11

PX141210.9167.41216

4.对敌人的防御工事进行80次轰炸,每次轰炸命中目标炸弹数目的数学期望为2,方差为0.8,且各次轰炸相互独立,求在80次轰炸中有150颗~170颗炸弹命中目标的概率.解设随机变量X表示80次轰炸中炸弹命中目标的次数, Xi表示第i次轰炸命中目标的次数, 则EXi2,DXi0.8;由于X

X

i1

i

所以EX160,DX800.864;由中心极限定理得

P150X170

170160150160



88

1.251.2521.25120.894410.7888.5.袋装食糖用机器装袋,每袋食糖净重的数学期望为100克,方差为4克,一盒内装100袋,求一盒食糖

净重大于10,060克的概率.解 设每袋食糖的净重为Xii1,2,,100,则Xii1,2,,100服从独立同分布,且

E(Xi)100,D(Xi)4;设一盒食糖为X,则

XXi,E(X)10000,D(X)400,i1100

由中心极限定理得

PX10060 1PX

10060

11310.998650.00135.6.某人寿保险公司为某地区100,000人保险,规定投保人在年初向人寿保险公司交纳保险金30元,若投保人死亡,则人寿保险公司向家属一次性赔偿6,000元,由历史资料估计该地区投保人死亡率为0.0037,求人寿保险公司一年从投保人得到净收入不少于600,000元的概率.解设随机变量X表示一年内投保人中死亡人数, 则XBn,p,其中n100000,p0.0037;

EXnp370,DXnpq3700.9963368.31;由100000306000X600,000,得X400

由拉普拉斯中心极限定理,所求概率为



PX400

P

30

1.560.9406.19.1940

7.某车间有同型号机床200部,每部开动的概率为0.7,假定各机床开与关是独立的,开动时每部机床要消耗电能15个单位.问电厂最少要供应这个车间多少电能,才能以95%的概率,保证不致因供电不足而影响生产?

解设随机变量X表示200部机床中同时开动机床台数, 则

XB200,0.7,EXnp140,DX426.482

用K表示最少开动的机床台数,则

PXKPXK



K1400.95

6.5

查表1.650.95, 故

K140

1.65 6.5

由此得K151

这说明, 这个车间同时开动的机床数不大于151部的概率为0.95.所以电厂最少要供应这个车间151152265个单位电能,才能以95%的概率, 保证不致因供电不足而影响生产.8.设某妇产医院生男婴的概率为0.515,求新生的10000个婴儿中,女婴不少于男婴的概率? 解设X表示10000个婴儿中男婴的个数, 则XBn,p其中n10000,p0.515.由拉普拉斯中心极限定理,所求概率为



PX5000

P

313

10.998650.00135.附表:

上一篇:食物中毒事件应急演练活动总结下一篇:中秋节月夜作文