概率论与数理统计公式整理
第 第 1 1 章
随机事件及其概率
(1)排列 组 合公式 )! (!n mmPnm
从 m 个人中挑出 n 个人进行排列的可能数。
)! ( !!n m nmCnm
从 m 个人中挑出 n 个人进行组合的可能数。
(2)加法 和 乘法原理 加法原理(两种方法均能完成此事):
m+n
某件事由两种方法来完成,第一种方法可由 m 种方法完成,第二种方法可由 n 种方法来完成,则这件事可由 m+n 种方法来完成。
乘法原理(两个步骤分别不能完成这件事):m m ×n n
某件事由两个步骤来完成,第一个步骤可由 m 种方法完成,第二个步骤可由 n 种方法来完成,则这件事可由 m×n 种方法来完成。
(3)一些 常 见排列 重复排列和非重复排列(有序)
对立事件(至少有一个)
顺序问题 (4)随机 试 验和 随 机事件 如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。
试验的可能结果称为随机事件。
(5)基本 事在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质:
件 、 样本 空 间和事件 ①每进行一次试验,必须发生且只能发生这一组中的一个事件; ②任何事件,都是由这一组中的部分事件组成的。
这样一组事件中的每一个事件称为基本事件,用 来表示。
基本事件的全体,称为试验的样本空间,用 表示。
一个事件就是由 中的部分点(基本事件 )组成的集合。通常用大写字母 A,B,C, …表示事件,它们是 的子集。
为必然事件,Ø 为不可能事件。
不可能事件(Ø )的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件(Ω)的概率为 1,而概率为 1 的事件也不一定是必然事件。
(6)事件 的 关系 与 运算 ①关系:
如果事件 A 的组成部分也是事件 B 的组成部分,( A发生必有事件 B 发生):
B A
如果同时有 B A , A B ,则称事件 A 与事件 B 等价,或称 A 等于 B :
A=B 。
A、B 中至少有一个发生的事件:
A B ,或者 A + B 。
属于 A 而不属于 B 的部分所构成的事件,称为 A 与 B的差,记为 A-B ,也可表示为 A-AB 或者 B A ,它表示A 发生而 B 不发生的事件。
A、B 同时发生:
A B ,或者 AB 。A B=Ø ,则表示 A与 B 不可能同时发生,称事件 A 与事件 B 互不相容或
者互斥。基本事件是互不相容的。
-A 称为事件 A 的逆事件,或称 A 的对立事件,记为A 。它表示 A 不发生的事件。互斥未必对立。
②运算:
结合率:A(BC)=(AB)C
A∪(B∪C)=(A∪B)∪C
分配率:(AB)∪C=(A∪C)∩(B∪C)
(A∪B)∩C=(AC)∪(BC)
德摩根率: 1 1 iiii A A
B A B A , B A B A
(7)概率 的 公理 化 定义 设 为样本空间, A 为事件,对每一个事件 A 都有一个实数 P(A),若满足下列三个条件:
1° 0≤P(A)≤1,
2° P(Ω) =1 3° 对于两两互不相容的事件1 A , 2 A ,…有 1 1) (iiii A P A P 常称为可列(完全)可加性。
则称 P(A)为事件 A 的概率。
(8)古典概型 1° n 2 1 , , 2° nP P Pn1) ( ) ( ) (2 1 。
设任一事件 A ,它是由m 2 1 ,组成的,则有 P(A) = ) ( ) ( ) (2 1 m
= ) ( ) ( ) (2 1 mP P P
nm基本事件总数所包含的基本事件数 A
(9)几何概型 若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,同时样本空间中的每一个基本事件可以使用一个有界区域来描述,则称此随机试验为几何概型。对任一事件 A,
) () () (LA LA P 。其中 L 为几何度量(长度、面积、体积)。
( 10 )加 法 公式 P(A+B)=P(A)+P(B)-P(AB) 当 P(AB)=0 时,P(A+B)=P(A)+P(B) ( 11 )减 法 公式 P(A-B)=P(A)-P(AB) 当 B A 时,P(A-B)=P(A)-P(B) 当 A=Ω时,P( B )=1- P(B) ( 12 )条 件 概率 定义 设 A、B 是两个事件,且 P(A)>0,则称) () (A PAB P为事件 A 发生条件下,事件 B 发生的条件概率,记为 ) / ( A B P) () (A PAB P。
条件概率是概率的一种,所有概率的性质都适合于条件概率。
例如 P(Ω/B)=1 P( B /A)=1-P(B/A) ( 13 )乘 法 公式 乘法公式:
) / ( ) ( ) ( A B P A P AB P
更一般地,对事件 A 1 ,A 2 ,…A n ,若 P(A 1 A 2 …A n-1 )>0,则有 2 1 ( A A P…) n A ) | ( ) | ( ) ( 2 1 3 1 2 1 A A A P A A P A P ……2 1 | ( A A A P n…) 1 n A。
( 14 )独立性 ①两个事件的独立性
设事件 A 、 B 满足) ( ) ( ) ( B P A P AB P ,则称事件 A 、 B 是相互独立的。
若事件 A 、 B 相互独立,且0 ) ( A P,则有 ) () () ( ) () () () | ( B PA PB P A PA PAB PA B P 若事件 A 、 B 相互独立,则可得到 A 与 B 、 A 与 B 、 A与 B 也都相互独立。
必然事件 和不可能事件 Ø 与任何事件都相互独立。
Ø 与任何事件都互斥。
②多个事件的独立性
设 ABC 是三个事件,如果满足两两独立的条件, P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A) 并且同时满足 P(ABC)=P(A)P(B)P(C) 那么 A、B、C 相互独立。
对于 n 个事件类似。
( 15 )全 概 公式 设事件n B B B , , , 2 1 满足 1°n B B B , , , 2 1 两两互不相容,) , , 2 , 1 ( 0 ) ( n i B P i , 2°nii B A1 , 则有 ) | ( ) ( ) | ( ) ( ) | ( ) ( ) ( 2 2 1 1 n n B A P B P B A P B P B A P B P A P 。
( 16 )贝 叶 斯公式 设事件1 B , 2 B ,…,n B 及 A 满足 1° 1 B , 2 B ,…,n B 两两互不相容,) (Bi P>0, i1,2,…, n , 2° nii B A1 ,0 ) ( A P, 则 njj ji iiB A P B PB A P B PA B P1) / ( ) () / ( ) () / ( ,i=1,2,…n。
此公式即为贝叶斯公式。
) (iB P ,(1 i, 2 ,…, n ),通常叫先验概率。
) / ( A B Pi,(1 i, 2 ,…, n ),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。
( 17 )伯 努 利概型 我们作了 n 次试验,且满足 每次试验只有两种可能结果, A 发生或 A 不发生;
n 次试验是重复进行的,即 A 发生的概率每次均一样; 每次试验是独立的,即每次试验 A 发生与否与其他次试验 A 发生与否是互不影响的。
这种试验称为伯努利概型,或称为 n 重伯努利试验。
用p 表示每次试验A 发生的概率,则 A 发生的概率为q p 1,用) (k P n表示 n 重伯努利试验中 A 出现) 0 ( n k k 次的概率, k n kknn q p k PC ) (,n k , , 2 , 1 , 0 。
第二章
随机变量及其分布
(1)离散型随机变量的分布律 设离散型随机变量 X 的可能取值为 X k (k=1,2,…)且取各个值的概率,即事件(X=X k )的概率为 P(X=x k )=p k ,k=1,2,…, 则称上式为离散型随机变量 X 的概率分布或分布律。有时也用分布列的形式给出:
, , , ,, , , ,|) ( 2 12 1kkk p p px x xx X PX。
显然分布律应满足下列条件:
(1)0 k p, , 2 , 1 k,
(2)11kk p。
(2)连续型随机变量的分布密度 设) (x F是随机变量 X 的分布函数,若存在非负函数) (x f,对任意实数 x ,有 xdx x f x F ) ( ) (,
则称 X 为连续型随机变量。) (x f称为 X 的概率密度函数或密度函数,简称概率密度。
密度函数具有下面 4 个性质:
1°
0 ) ( x f。
2°
1 ) ( dx x f。
(3)离散与连续型随机变量的关系 dx x f dx x X x P x X P ) ( ) ( ) (
积分元 dx x f ) ( 在连续型随机变量理论中所起的作用与k k p x X P ) (在离散型随机变量理论中所起的作用相类似。
(4)分布函数 设 X 为随机变量, x 是任意实数,则函数 ) ( ) ( x X P x F
称为随机变量 X 的分布函数,本质上是一个累积函数。
) ( ) ( ) ( a F b F b X a P
可以得到 X 落入区间 ] , ( b a 的概率。分布函数 ) (x F 表示随机变量落入区间(– ∞,x]内的概率。
分布函数具有如下性质:
1°
, 1 ) ( 0 x F
x ; 2°
) (x F 是单调不减的函数,即 2 1 x x 时,有 ) ( 1 x F ) ( 2 x F ; 3°
0 ) ( lim ) ( x F Fx,
1 ) ( lim ) ( x F Fx; 4°
) ( ) 0 ( x F x F ,即 ) (x F 是右连续的; 5°
) 0 ( ) ( ) ( x F x F x X P 。
对于离散型随机变量,x xkkp x F ) ( ; 对于连续型随机变量, xdx x f x F ) ( ) (
。
(5)八大分布 0-1 分布 P(X=1)=p, P(X=0)=q
二 项 分布 在 n 重贝努里试验中,设事件 A 发生的概率为p 。事件 A 发生的次数是随机变量,设为 X ,则 X 可能取值为 n , , 2 , 1 , 0 。
k n k knn q p C k P k X P ) ( ) ( ,
其 中n k p p q , , 2 , 1 , 0 , 1 0 , 1 , 则称随机变量 X 服从参数为 n , p 的二项分布。记为 ) , ( ~ p n B X 。
当 1 n 时,k k qp k X P 1) ( , 1 . 0 k ,这就是(0-1)分布,所以(0-1)分布是二项分布的特例。
泊 松 分布 设随机变量 X 的分布律为 ekk X Pk!) ( , 0 , 2 , 1 , 0 k , 则称随机变量 X 服从参数为 的泊松分布,记为 ) ( ~ X 或者 P( )。
泊松分布为二项分布的极限分布(np=λ,n→∞)。
超 几 何分布 ) , min(, 2 , 1 , 0, ) (n M ll kCC Ck X PnNk nM NkM 随机变量X服从参数为n,N,M的超几何分布,记为 H(n,N,M)。
几 何 分布 , 3 , 2 , 1 , ) (1 k p q k X Pk,其中 p≥0,q=1-p。
随机变量 X 服从参数为 p 的几何分布,记为G(p)。
均 匀 分布 设随机变量 X 的值只落在[a,b]内,其密度函数) (x f在[a,b]上为常数a b 1,即
, 0,1) ( a b x f
其他, 则称随机变量 X 在[a,b]上服从均匀分布,记为 X~U(a,b)。
分布函数为
xdx x f x F ) ( ) (
当 a≤x 1 <x 2 ≤b 时,X 落在区间(2 1 ,xx)内的概率为 a bx xx X x P 1 22 1) ( 。
指 数 分布
其中0 ,则称随机变量 X 服从参数为 的指数分布。
X 的分布函数为
记住积分公式:
!0n dx e xx n 0,
x<a, ,a ba x
a≤x≤b
1,
x>b。
a≤x≤b ) (x f,xe
0 x, 0,
0 x, ) (x F, 1xe
0 x, , 0
x<0。
正 态 分布 设随机变量 X 的密度函数为 222) (21) ( xe x f ,
x, 其中 、0 为常数,则称随机变量 X 服从参数为 、 的正态分布或高斯(Gauss)分布,记为) , ( ~2 N X。
) (x f具有如下性质:
1°
) (x f的图形是关于 x对称的; 2°
当 x时, 21) ( f 为最大值; 若) , ( ~2 N X,则 X 的分布函数为 dt e x Fxt 222) (21) (。。
参数0 、1 时的正态分布称为标准正态分布,记为) 1 , 0 ( ~ N X,其密度函数记为 2221) (xe x, x , 分布函数为 x tdt e x2221) (。
) (x 是不可求积函数,其函数值,已编制成表可供查用。
Φ(-x)=1-Φ(x)且Φ(0)=21。
如果 X ~ ) , (2 N ,则 X~ ) 1 , 0 ( N 。
1 22 1) (x xx X x P 。
(6)分位数 下分位表:
= ) ( X P ; 上分位表:
= ) ( X P 。
(7)函数分布 离散型 已知 X 的分布列为
, , , ,, , , ,) ( 2 12 1nni p p px x xx X PX, ) (X g Y 的分布列( ) (i ix g y 互不相等)如下:
, , , ,), ( , ), ( ), () (2 12 1nnip p px g x g x gy Y PY, 若有某些 ) ( i x g 相等,则应将对应的ip 相加作为 ) ( i x g 的概率。
连续型 先利用 X 的概率密度 f X (x)写出 Y 的分布函数F Y (y)=P(g(X)≤y),再利用变上下限积分的求导公式求出 f Y (y)。
第三章
二维随机变量及其分布
(1)联合分布 离散型 如果二维随机向量 (X,Y)的所有可能取值为至多可列个有序对(x,y),则称 为离散型随机量。
设 = ( X , Y )
的 所 有 可 能 取 值 为) , 2 , 1 , )( , ( j i y xj i,且事件{ = ) , (j iy x }的概率为 p ij, ,称 ) , 2 , 1 , ( )} , ( ) , {( j i p y x Y X Pij j i 为 =(X,Y)的分布律或称为 X 和 Y 的联合分布律。联合分布有时也用下面的概率分布表来表示:
Y X
y 1
y 2
… y j
… x 1
p 11
p 12
… p 1j
… x 2
p 21
p 22
… p 2j
…
x i
p i1
… ijp
…
这里 p ij 具有下面两个性质:
(1)
p ij ≥0(i,j=1,2,…); (2)
. 1 iji jp
连续型 对于二维随机向量 ) , ( Y X ,如果存在非负函数 ) , )( , ( y x y x f ,使对任意一个其邻边分别平行于坐标轴的矩形区域D,即 D={(X,Y)|a<x<b,c<y<d}有 Ddxdy y x f D Y X P , ) , ( } ) , {(
则称 为连续型随机向量;并称 f(x,y)为 =(X,Y)的分布密度或称为 X 和 Y 的联合分布密度。
分布密度 f(x,y)具有下面两个性质:
(1)
f(x,y)≥0; (2)
. 1 ) , ( dxdy y x f
(2)二维 随 机变 量 的本质 ) ( ) , ( y Y x X y Y x X
(3)联合 分 布函数 设(X,Y)为二维随机变量,对于任意实数 x,y,二元函数 } , { ) , ( y Y x X P y x F
称为二维随机向量(X,Y)的分布函数,或称为随机变量 X 和 Y 的联合分布函数。
分布函数是一个以全平面为其定义域,以事件} ) ( , ) ( | ) , {(2 1 2 1y Y x X 的概率为函数值的一个实值函数。分布函数 F(x,y)具有以下的基本性质:
(1)
; 1 ) , ( 0 y x F
(2)F(x,y)分别对 x 和 y 是非减的,即 当 x 2 >x 1 时,有 F (x 2 ,y)≥F(x 1 ,y);当 y 2 >y 1 时,有 F(x,y 2 ) ≥F(x,y 1 ); (3)F(x,y)分别对 x 和 y 是右连续的,即 ); 0 , ( ) , ( ), , 0 ( ) , ( y x F y x F y x F y x F
(4)
. 1 ) , ( , 0 ) , ( ) , ( ) , ( F x F y F F
(5)对于 , ,2 1 2 1y y x x
0 ) ( ) ( ) ( ) (1 1 2 1 1 2 2 2 y x F y x F y x F y x F , , , , . (4)离散 型 与连 续 型的关系 dxdy y x f dy y Y y dx x X x P y Y x X P ) ( ) ( ) ( , , ,
(5)边缘分布 离散型 X 的边缘分布为 ) , 2 , 1 , ( ) ( j i p x X P Pijji i; Y 的边缘分布为 ) , 2 , 1 , ( ) ( j i p y Y P Pijij j。
连续型 X 的边缘分布密度为 ; dy y x f x f X ) , ( ) (
Y 的边缘分布密度为 . ) , ( ) ( dx y x f y f Y
(6)条件分布 离散型 在已知 X=x i 的条件下,Y 取值的条件分布为 ; iiji jppx X y Y P ) | (
在已知 Y=y j 的条件下,X 取值的条件分布为 , ) | (jijj ippy Y x X P
连续型 在已知 Y=y 的条件下,X 的条件分布密度为 ) () , () | (y fy x fy x fY ; 在已知 X=x 的条件下,Y 的条件分布密度为 ) () , () | (x fy x fx y fX
(7)独立性 一般型 F(X,Y)=F X (x)F Y (y) 离散型 j i ijp p p
有零不独立
连续型 f(x,y)=f X (x)f Y (y) 直接判断,充要条件:
①可分离变量 ②正概率密度区间为矩形 二 维 正态分布 ,1 21) , (2222 12 121122 1) )( ( 2) 1 ( 212 y y x xe y x f
=0 随 机 变量 的 函数 若 X 1 ,X 2 ,…X m ,X m+1 ,…X n 相互独立, h,g 为连续函数,则:
h(X 1 ,X 2 ,…X m )和 g(X m+1 ,…X n )相互独立。
特例:若 X 与 Y 独立,则:h(X)和 g(Y)独立。
例如:若 X 与 Y 独立,则:3X+1 和 5Y-2 独立。
(8)二维 均 匀分布 设随机向量(X,Y)的分布密度函数为 其他 , 0) , (1) , (D y xSy x fD 其中 S D 为区域 D 的面积,则称(X,Y)服从 D 上的均匀分布,记为(X,Y)~U(D)。
例如图 3.1、图 3.2 和图 3.3。
y 1
D 1
O
1
x
图 3.1
y 1
O
2
x
图 3.2
y d D 2
1 D 3
(9)二维 正 态分布 设随机向量(X,Y)的分布密度函数为 ,1 21) , (2222 12 121122 1) )( ( 2) 1 ( 212 y y x xe y x f
其中 1 | | , 0 , 0 ,2 1 , 2 1 是 5 个参数,则称(X,Y)服从二维正态分布, 记为(X,Y)~N( ). , , ,2221 , 2 1
由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布, 即 X~N( ). ( ~ ), ,22 , 221 1 N Y
但是若 X~N( ) ( ~ ), ,22 , 221 1 N Y ,(X,Y)未必是二维正态分布。
( 10 )函 数 分布 Z=X+Y 根据定义计算:
) ( ) ( ) ( z Y X P z Z P z F Z
对于连续型,f Z (z)= dx x z x f ) , (
两个独立的正态分布的和仍为正态分布(2221 2 1, )。
n 个相互独立的正态分布的线性组合,仍服从正态分布。
ii iC ,
ii iC2 2 2
Z=max,min(X 1 ,X 2,…X n ) 若nX X X 2 1 ,相互独立,其分布函数分别为) ( ) ( ) (2 1x F x F x Fnx x x , ,则 Z=max,min(X 1 ,X 2 ,…X n )的分布函数为:
) ( ) ( ) ( ) (2 1maxx F x F x F x Fnx x x
)] ( 1 [ )] ( 1 [ )] ( 1 [ 1 ) (2 1minx F x F x F x Fnx x x
2 分布 设 n 个随机变量nX X X , , ,2 1 相互独立,且服从标准正态分布,可以证明它们的平方和 niiX W12 的分布密度为 . 0 , 0, 0221) (2122uu e unu fu nn 我们称随机变量 W 服从自由度为 n 的2 分布,记为 W~ ) (2n ,其中 .2012dx e xnxn
所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。
2 分布满足可加性:设 ), (2i in Y
则 ). ( ~2 112kkiin n n Y Z
t 分布 设 X,Y 是两个相互独立的随机变量,且 ), ( ~ ), 1 , 0 ( ~2n Y N X
可以证明函数 n YXT/
的概率密度为 2121221) ( nntnnnt f
). ( t
我们称随机变量T服从自由度为n的t分布,记为 T~t(n)。
) ( ) (1n t n t F 分布 设 ) ( ~ ), ( ~2212n Y n X ,且 X 与 Y 独立,可以证明21//n Yn XF 的概率密度函数为 0 , 00 , 12 22) (221122212 12 12 111yy ynnynnn nn ny fn nnn 我们称随机变量 F 服从第一个自由度为 n 1 ,第二个自由度为 n 2 的 F 分布,记为 F~f(n 1 , n 2 ). ) , (1) , (1 22 1 1n n Fn n F 第四章
随机变量的数字特征
( 1)一维随机变量的数字特征
离散型 连续型 期望 期望就是平均值 设 X 是离散型随机变量 , 其 分 布 律 为P(kx X ) = p k ,k=1,2,…,n, nkk k px X E1) (
(要求绝对收敛)
设 X 是连续型随机变量,其概率密度为 f(x), dx x xf X E ) ( ) (
(要求绝对收敛)
函数的期望 Y=g(X) nkk kp x g Y E1) ( ) (
Y=g(X) dx x f x g Y E ) ( ) ( ) (
方差 D(X)=E[X-E(X)]2 , 标准差 ) ( ) ( X D X ,
kk kp X E x X D2)] ( [ ) (
dx x f X E x X D ) ( )] ( [ ) (2
矩 ①对于正整数 k,称随机变量 X 的 k 次幂的数学期望为 X 的 k 阶原点矩,记为 v k ,即 ν k =E(Xk )= iikip x , k=1,2, …. ②对于正整数 k,称随机变量 X 与 E(X)差的 k 次幂的数学期望为 X 的 k 阶中心矩,记为k ,即 .)) ( (kkX E X E =iikip X E x )) ( ( , k=1,2, …. ①对于正整数 k,称随机变量 X 的 k 次幂的数学期望为 X 的 k 阶原点矩,记为 v k ,即 ν k =E(Xk )= , ) ( dx x f xk
k=1,2, …. ②对于正整数 k,称随机变量 X 与 E(X)差的k 次幂的数学期望为 X的 k 阶中心矩,记为k ,即 .)) ( (kkX E X E = , ) ( )) ( ( dx x f X E xk k=1,2, …. 切比雪夫不等式 设随机变量 X 具有数学期望 E(X)=μ,方差 D(X)=σ2 ,则对于任意正数ε,有下列切比雪夫不等式 22) ( X P
切比雪夫不等式给出了在未知 X 的分布的情况下,对概率 ) ( X P
的一种估计,它在理论上有重要意义。
( 2)期望的性质 (1)
E(C)=C (2)
E(CX)=CE(X) (3)
E(X+Y)=E(X)+E(Y), ninii i i iX E C X C E1 1) ( ) (
(4)
E(XY)=E(X) E(Y),充分条件:X 和 Y 独立;
充要条件:X 和 Y 不相关。
( 3)方差的性质 (1)
D(C)=0;E(C)=C (2)
D(aX)=a2 D(X);
E(aX)=aE(X) (3)
D(aX+b)= a2 D(X);
E(aX+b)=aE(X)+b (4)
D(X)=E(X2 )-E 2 (X) (5)
D(X±Y)=D(X)+D(Y),充分条件:X 和 Y 独立;
充要条件:X 和 Y 不相关。
D(X±Y)=D(X)+D(Y) ±2E[(X-E(X))(Y-E(Y))],无条件成立。
而 E(X+Y)=E(X)+E(Y),无条件成立。
( 4)常见分布的期 期望 方差 0-1 分布 ) , 1 ( p B
p ) 1 ( p p
二项分布 ) , ( p n B
np ) 1 ( p np
泊松分布 ) ( P
几何分布 ) (p G
p1 21pp 超几何分布) , , ( N M n H
NnM 11Nn NNMNnM
望和方差 均匀分布 ) , ( b a U
2b a 12) (2a b 指数分布 ) ( e
1 21 正态分布 ) , (2 N
2
分布2
n 2n t 分布 0 2 nn(n>2) ( 5)二维随机变量的数字特征 期望 nii i px X E1) (
njj j py Y E1) (
dx x xf X EX) ( ) (
dy y yf Y EY) ( ) (
函数的期望 )] , ( [ Y X G E = i jij j ip y x G ) , (
)] , ( [ Y X G E = - -dxdy y x f y x G ) , ( ) , (
方差
ii ip X E x X D2)] ( [ ) (
jj jp Y E x Y D2)] ( [ ) (
dx x f X E x X DX) ( )] ( [ ) (2 dy y f Y E y Y DY) ( )] ( [ ) (2 协方差 对于随机变量 X 与 Y,称它们的二阶混合中心矩11 为 X 与 Y 的 协 方 差 或 相 关 矩 , 记 为) , cov( Y XXY 或 ,即 ))]. ( ))( ( [(11Y E Y X E X EXY
与记号XY 相对应,X 与 Y 的方差 D(X)与 D(Y)也可分别记为XX 与YY 。
相关系数 对于随机变量 X 与 Y,如果 D(X)>0, D(Y)>0,则称 ) ( ) ( Y D X DXY 为 X 与 Y 的相关系数,记作XY (有时可简记为 )。
| |≤1,当| |=1 时,称 X 与 Y 完全相关:1 ) ( b aY X P
完全相关 , 时 负相关,当, 时 正相关,当) 0 ( 1) 0 ( 1aa 而当 0 时,称 X 与 Y 不相关。
以下五个命题是等价的:
① 0 XY ; ②cov(X,Y)=0; ③E(XY)=E(X)E(Y); ④D(X+Y)=D(X)+D(Y); ⑤D(X-Y)=D(X)+D(Y). 协方差矩阵 YY YXXY XX 混合矩 对于随机变量 X 与 Y,如果有 ) (l k YX E 存在,则称之为 X 与 Y 的 k+l 阶混合原点矩,记为kl ;k+l 阶混合中心矩记为:
]. )) ( ( )) ( [(l kklY E Y X E X E u
( 6)协方差的性质 (i) cov (X, Y)=cov (Y, X); (ii) cov(aX,bY)=ab cov(X,Y); (iii) cov(X 1 +X 2 , Y)=cov(X 1 ,Y)+cov(X 2 ,Y); (iv) cov(X,Y)=E(XY)-E(X)E(Y). ( 7)独立和不相关 (i)
若随机变量 X 与 Y 相互独立,则 0 XY ;反之不真。
(ii)
若(X,Y)~N( , , , ,2221 2 1), 则 X 与 Y 相互独立的充要条件是 X 和 Y 不相关。
第五章
大数定律和中心极限定理
(1)大数定律 X
切比雪夫大数定律 设随机变量 X 1 ,X 2 ,…相互独立,均具有有限方差,且被同一常数 C 所界:D( X i )<C(i=1,2,…),则对于任意的正数ε,有 . 1 ) (1 1lim1 1 niiniinX EnXnP
特殊情形:若 X 1 ,X 2 ,…具有相同的数学期望 E(X I )=μ,则上式成为 . 11lim1 niinXnP
伯努利大数定律 设μ是 n 次独立试验中事件 A 发生的次数,p 是事件 A 在每次试验中发生的概率,则对于任意的正数ε,有 . 1 lim pnPn
伯努利大数定律说明,当试验次数 n 很大时,事件 A 发生的频率与概率有较大判别的可能性很小,即 . 0 lim pnPn 这就以严格的数学形式描述了频率的稳定性。
辛钦大数定律 设 X 1 ,X 2 ,…,X n ,…是相互独立同分布的随机变量序列,且 E(X n )=μ,则对于任意的正数ε有 . 11lim1 niinXnP
(2)中心极限定理 ) , (2nN X 列维-林德伯格定理 设随机变量 X 1 ,X 2 ,…相互独立,服从同一分布,且具有相同的数学期望和方差:) , 2 , 1 ( 0 ) ( , ) (2 k X D X Ek k ,则随机变量 nn XYnkkn1 的分布函数 F n ( x )对任意的实数 x ,有 xtnkknnndt e xnn XP x F .21lim ) ( lim212 此定理也称为 独立同分布的中心极限定理。
棣莫弗-拉普拉斯定理 设随机变量nX 为具有参数 n, p(0<p<1)的二项分布,则对于任意实数 x,有 xtnndt e xp npnp XP .21) 1 (lim22 (3)二项定理 若当 ) , ( , 不变 时 k n pNMN ,则 k n k knnNk nM NkMp p CCC C ) 1 (
). ( N
超几何分布的极限分布为二项分布。
(4)泊松定理 若当 0 , np n 时 ,则 ekp p Ckk n k kn!) 1 (
). ( n
其中 k=0,1,2,…,n,…。
二项分布的极限分布为泊松分布。
第六章
样本及抽样分布
(1)数理 统 计的 基 本概念 总体 在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体)。我们总是把总体看成一个具有分布的随机变量(或随机向量)。
个体 总体中的每一个单元称为样品(或个体)。
样本 我们把从总体中抽取的部分样品nx x x , , ,2 1称为样本。样本中所含的样品数称为样本容量,一般用 n 表示。在一般情况下,总是把样本看成是 n 个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,nx x x , , ,2 1 表示 n 个随机变量(样本);在具体的一次抽取之后,nx x x , , ,2 1 表示 n 个具体的数值(样本值)。我们称之为样本的两重性。
样 本 函数 和 统计量 设nx x x , , ,2 1 为总体的一个样本,称
(nx x x , , ,2 1 )
为样本函数,其中 为一个连续函数。如果 中不包含任何未知参数,则称 (nx x x , , ,2 1 )为一个统计量。
常 见 统计 量 及其性质 样本均值
.11niixnx
样本方差
niix xnS12 2. ) (11 样本标准差
. ) (1112niix xnS
样本 k 阶原点矩
niki kk xnM1. , 2 , 1 ,1
样本 k 阶中心矩 niki kk x xnM1. , 3 , 2 , ) (1
) (X E ,nX D2) ( , 2 2 )( S E ,2 21) * ( nnS E , 其中 niiX XnS12 2) (1* ,为二阶中心矩。
(2)正态 总 体下 的 四大分布 正 态 分布 设nx x x , , ,2 1 为来自正态总体 ) , (2 N 的一个样本,则样本函数 ). 1 , 0 ( ~/Nnxudef t 分布 设nx x x , , ,2 1 为来自正态总体 ) , (2 N 的一个样本,则样本函数 ), 1 ( ~/n tn sxtdef 其中 t(n-1)表示自由度为 n-1 的 t 分布。
分布2
设nx x x , , ,2 1 为来自正态总体 ) , (2 N 的一个样本,则样本函数 ), 1 ( ~) 1 (222nS nwdef 其中 ) 1 (2 n 表示自由度为 n-1 的2 分布。
F 分布 设nx x x , , ,2 1 为来自正态总体 ) , (21 N 的一个样本,而ny y y , , ,2 1 为来自正态总体 ) , (22 N的一个样本,则样本函数 ), 1 , 1 ( ~//2 122222121 n n FSSFdef 其中 , ) (11211211niix xnS
; ) (11212222niiy ynS
) 1 , 1 (2 1 n n F 表示第一自由度为 11 n ,第二自由度为 12 n 的 F 分布。
(3)正态 总 体下 分 布的性质 X 与2S 独立。
第七章
参数估计
(1)点 估计 矩 估计 设总体 X 的分布中包含有未知数m , , ,2 1 ,则其分布函数可以表成 ). , , , ; (2 1 mx F 它的 k 阶原点矩) , , 2 , 1 )( ( m k X E vkk 中 也 包 含 了 未 知 参 数m , , ,2 1 ,即 ) , , , (2 1 m k kv v 。又设nx x x , , ,2 1 为总体 X 的 n 个样本值,其样本的 k 阶原点矩为 nikixn11 ). , , 2 , 1 ( m k
这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有 nimi m mnii mnii mxnvxnvxnv12 1122 1 212 1 1.1) , , , (,1) , , , (,1) , , , ( 由上面的 m 个方程中,解出的 m 个未知参数) , , , (2 1 m 即为参数(m , , ,2 1 )的矩估计量。
若 为 的矩估计, ) (x g 为连续函数,则 )ˆ( g 为 ) ( g的矩估计。
极 大似 然估计 当总体 X 为连续型随机变量时,设其分布密度为 ) , , , ; (21 mx f ,其中m , , ,21 为未知参数。又设nx x x , , ,21 为总体的一个样本,称 ) , , , ; ( ) , , , (11 12 2 nim i mx f L
为样本的似然函数,简记为 L n .
当总体 X 为离型随机变量时,设其分布律为) , , , ; ( } {21 mx p x X P ,则称 ) , , , ; ( ) , , , ; , , , (11 1 12 2 2 nim i m nx p x x x L
为样本的似然函数。
若似然函数 ) , , , ; , , , (2 21 1 m nx x x L 在m , , ,21 处取到最大值,则称 m , , ,21 分别为m , , ,21 的最大似然估计值,相应的统计量称为最大似然估计量。
m iLiiin, , 2 , 1 , 0ln
若 为 的极大似然估计, ) (x g 为单调函数,则 )ˆ( g为 ) ( g 的极大似然估计。
(2)估 计量 的无 偏性 设 ) , , , (2 1 nx x x 为未知参数 的估计量。若 E ( )= ,则称 为 的无偏估计量。
E( X )=E(X), E(S2 )=D(X)
评 选标准 有 效性 设 ) , , , , (2 11 1nx x x 和 ) , , , , (2 12 2nx x x 是未知参数 的两个无偏估计量。若 ) ( ) ( 2 1 D D ,则称2 1 比 有效。
一 致性 设n 是 的一串估计量,如果对于任意的正数 ,都有 , 0 ) | (| lim nnP
则称n 为 的一致估计量(或相合估计量)。
若 为 的无偏估计,且 ), ( 0 )ˆ( n D 则 为 的一致估计。
只要总体的 E(X)和 D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。
(3)区 间估计 置 信区 间和 置信度 设总体 X 含有一个待估的未知参数 。如果我们从样 本nx x x , , , ,2 1 出 发 , 找 出 两 个 统 计 量) , , , , (2 1 1 1 nx x x 与 ) , , , , (2 1 2 2 nx x x ) (2 1 ,使得区间 ] , [2 1 以 ) 1 0 ( 1 的概率包含这个待估参数 ,即 , 1 } {2 1 P
那么称区间 ] , [2 1 为 的置信区间, 1 为该区间的置信度(或置信水平)。
单 正态 总体 的期 望和 方差 的区 间估计
设nx x x , , , ,2 1 为总体 ) , ( ~2 N X 的一个样本,在置信度为 1 下,我们来确定2 和 的置信区间] , [2 1 。具体步骤如下:
(i)选择样本函数; (ii)由置信度 1 ,查表找分位数; (iii)导出置信区间 ] , [2 1 。
已知方差,估计均值 (i)选择样本函数 ). 1 , 0 ( ~/0Nnxu
(ii) 查表找分位数 . 1/0 nxP
(iii)导出置信区间 nxnx0 0,
未知方差,估计均值 (i)选择样本函数 ). 1 ( ~/ n tn Sxt
(ii)查表找分位数
. 1/ n SxP
(iii)导出置信区间 nSxnSx ,
方差的区间估计 (i)选择样本函数 ). 1 ( ~) 1 (222 nS nw (ii)查表找分位数
. 1) 1 (2221 S nP
(iii)导出 的置信区间 SnSn1 21,1 第八章
假设检验
基本思想 假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。
为了检验一个假设 H 0 是否成立。我们先假定 H 0 是成立的。如果根据这个假定导致了一个不合理的事件发生,那就表明原来的假定 H 0 是不正确的,我们拒绝接受H 0 ;如果由此没有导出不合理的现象,则不能拒绝接受H 0 ,我们称 H 0 是相容的。与 H 0 相对的假设称为备择假设,用 H 1 表示。
这里所说的小概率事件就是事件 } {R K ,其概率就是检验水平α,通常我们取α=0.05,有时也取 0.01 或0.10。
基本步骤 假设检验的基本步骤如下:
(i) 提出零假设 H 0 ;
(ii) 选择统计量 K ; (iii) 对于检验水平α查表找分位数λ; (iv) 由样本值nx x x , , ,2 1 计算统计量之值 K ; 将 与K 进行比较,作出判断:当 ) ( | | K K 或 时否定H 0 ,否则认为 H 0 相容。
两类错误
第一类错误 当 H 0 为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定 H 0 。这时,我们把客观上 H 0 成立判为 H 0 为不成立(即否定了真实的假设),称这种错误为“以真当假”的错误或第一类错误,记 为犯此类错误的概率,即 P{否定 H 0 | H 0 为真}= ; 此处的α恰好为检验水平。
第二类错误 当 H 1 为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受 H 0 。这时,我们把客观上 H 0 。不成立判为 H 0成立(即接受了不真实的假设),称这种错误为“以假当真”的错误或第二类错误,记 为犯此类错误的概率,即 P{接受 H 0 | H 1 为真}= 。
两类错误的关系 人们当然希望犯两类错误的概率同时都很小。但是,当容量 n 一定时, 变小,则 变大;相反地, 变小,则 变大。取定 要想使 变小,则必须增加样本容量。
在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平α。α大小的选取应根据实际情况而定。当我们宁可“以假为真”、而不愿“以真当假”时,则应把α取得很小,如 0.01,甚至 0.001。反之,则应把α取得大些。
单正态总体均值和方差的假设检验 条件 零假设 统计量 对应样本 函数分布 否定域 已知2
0 0: H
nxU/00
N (0,1)
21| |u u
0 0: H
1u u
0 0: H
1u u
未知2
0 0: H
n SxT/0
) 1 ( n t
) 1 ( | |21 n t t 0 0: H
) 1 (1 n t t 0 0: H
) 1 (1 n t t 未知2
2 20: H
202) 1 (S nw
) 1 (2 n
) 1 () 1 (22122 n wn w 或 2020: H
) 1 (21 n w
2020: H
) 1 (2 n w
上一篇:科技论文题名误区与编写技巧
下一篇:档案管理相关论文特辑