抽样分布理论 抽样分布

什么是抽样分布?样本统计量的分布与总体分布的关系是什么所谓抽样分布,就是指样本统计量的分布 。所有的样本均值形成的分布就是样本均值的抽样分布 。样本均值抽样分布的形状与原有总体的分布有关,如果原有总体是正态分布,那么,无论样本容量的大小,样本均值也服从正态分布,其分布的数学期望为总体均值,方差为总体方差的1/n,即 。如果原有总体的分布不是正态分布,就要看样本容量的大小了,当n为大样本时(n≥30),根据统计上的中心极限定理可知,当样本容量n增大时,不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于服从正态分布,其分布的数学期望为总体均值,差为总体方差的1/n 。

抽样分布理论 抽样分布

文章插图
什么叫抽样分布抽样分布也称统计量分布、随机变量函数分布,是指样本估计量的分布 。样本估计量是样本的一个函数,在统计学中称作统计量,因此抽样分布也是指统计量的分布 。以样本平均数为例,它是总体平均数的一个估计量,如果按照相同的样本容量,相同的抽样方式,反复地抽取样本,每次可以计算一个平均数,所有可能样本的平均数所形成的分布,就是样本平均数的抽样分布 。
定理
(1)从总体中随机抽取容量为n的一切可能个样本的平均数之平均数,等于总体的平均数,即,(E为平均的符号,为样本的平均数,μ为总体的平均数) 。
(2)从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布 。
(3)虽然总体不是正态分布,如果样本容量较大,反映总体μ和σ的样本平均数的抽样分布,也接近于正态分布 。
举例说明什么是抽样分布(一)样本均值的抽样分布
1.样本均值抽样分布的形成
样本均值的抽样分布即所有样本均值的可能取值形成的概率分布 。例如,某高校大一年级参加英语四级考试的人数为6000人,为了研究这6000人的平均考分,欲从中随机抽取500人组成样本进行观察 。若逐一抽取全部可能样本,并计算出每个样本的平均考分,将会得出很多不完全相同的样本均值,全部可能的样本均值有一个相应的概率分布,即为样本均值的抽样分布 。
我们知道,从总体的N个单位中抽取一个容量为n的随机样本,在重复抽样条件下,共有 个可能的样本;在不重复抽样条件下,共有 个可能的样本 。因此,样本均值是一个随机变量 。
2.样本均值抽样分布的特征
从抽样分布的角度看,我们所关心的分布的特征主要是数学期望和方差 。这两个特征一方面与总体分布的均值和方差有关,另一方面也与抽样的方法是重复抽样还是不重复抽样有关 。样本均值的方差则与抽样方法有关 。在重复抽样条件下,样本均值的方差为总体方差的1/n,即:
公式一:
在不重复抽样条件下,样本均值的方差为:
公式二:
从公式一和公式二可以看出两者仅相差系数 ,该系数通常被称为有限总体修正系数 。在实际应用中,这一系数常常被忽略不计,主要是因为:对于无限总体进行不重复抽样时,由于N未知,此时样本均值的标准差仍可按公式一计算,即可按重复抽样处理;对于有限总体,当N很大而抽样比例n/N很小时,其修正系数 ,通常在样本容量n小于总体容量N的5%时,有限总体修正系数就可以忽略不计 。因此,公式一是计算样本均值方差的常用公式 。
3.样本均值抽样分布的形式
样本均值抽样分布的形式与原有总体的分布和样本容量n的大小有关 。如果原有总体是正态分布,那么,无论样本容量的大小,样本均值的抽样分布都服从正态分布 。如果原有总体的分布是非正态分布,就要看样本容量的大小 。随着样本容量n的增大(通常要求n≥30),不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于正态分布,即统计上著名的中心极限定理 。虽然总体成绩的分布形态未知,但σ已知,且n=150为大样本,依据中心极限定理可知:样本均值的抽样分布近似服从正态分布 。
(二)样本比例的抽样分布
【抽样分布理论 抽样分布】样本比例即指样本中具有某种特征的单位所占的比例 。样本比例的抽样分布就是所有样本比例的可能取值形成的概率分布 。例如,某高校大一年级学生参加英语四级考试的人数有6000人,为了估计这6000人中男生所占的比例,从中抽取500人组成样本进行观察,若逐一抽取全部可能样本,并计算出每个样本的男生比例,则全部可能的样本比例的概率分布,即为样本比例的抽样分布 。可见,样本比例也是一个随机变量 。

秒懂生活扩展阅读