|
R- U8 U/ F. W% L2 D, z
仔细看了“所研究的随机变量如果是有大量独立的而且均匀的随机变量相加而成,那么它的分布将近似于正态分布。”这句话
& X* S% T( H/ q8 d1 S2 c我的理解是这样的。无论研究的变量是离散的,还是连续的。只要是“有大量独立的而且均匀的随机变量相加而成”。那么这些变量的分布将近似于正态分布
! V& L& D% Z- n5 Z3 q: S. g0 F对于本身就遵从正态分布的变量就不用说了。即使变量不遵从正态分布的变量。采取上面的方式处理也可以具有正态分布的特征) c {* \& x( l/ \
这与我原来学过的即使不是正态分布,其子集的均值分布也遵从正态分布应该是一个意思
3 A; W! `- R( p( T5 E' Z4 ]举例说明:布匹的疵点遵从泊松分布。如果我们把每10匹布作为一个子集。那么这每10匹布的子集的疵点总数遵从正态分布。
& f+ k5 \% x' C! s这里有个前提,就是子集的数量必须是大量的,也就是大抵是5匹为一子集、还是10匹为一子集,还是20匹为一子集合适。实际操作中这点十分重要。 6 H8 y3 O( H7 e- C7 k& y7 ~
一个亲身的经历:以前上世纪 八十年代中期,那时工厂都是用的国产设备。每匹布疵点大多在15-20多个。那时每子集为5匹,以此绘制控制图很适用。后来我去广东外资厂。用的是进口设备。每匹疵点0-2个。这样按原来5匹一子集根本就反应不出问题。要达到原来的控制效果至少要50匹一子集。这是不现实的。判断系统是否正常,凭经验就行。控制图在这种情况下已经不适用。子集的均值、标准差与总体的均值、标准差的关系记得是:
- o7 S1 o! b5 l1 S# }% T 记得是 子集的均值/总体的期望(均值)= N
+ d# M( C$ n, I" N) K( v. y, ?记得是 子集的标准差/总体的标准差= 1/ N " ]- D% f6 m+ _* O* @& u- v) j
其准确度与总体的数量无关,只与子集的数量有关 ( N-1)/N --可能还应该有个根号,但记不得了 --我们抽样就是利用这个原理。如样品100个准确度就是99% |
|