第三节 统计基础知识
一、单项选择题(每题的备选项中,只有1个最符合题意)
1.下列关于总体的描述正确的是( )。
A.关心的是研究对象的某个数量指标,每个具体的数量指标都可以看成是整体
B.总体不可以看成分布
C.从总体中可推断出样本性质
D.在一个统计问题中,称研究对象的全体为总体
【答案】D
【解析】在一个统计问题中,称研究对象的全体为总体,构成总体的每个成员称为个体。若关心的是研究对象的某个数量指标,那么将每个个体具有的数量指标X称为个体,总体就是某数量指标值X的全体(即一堆数),这一堆数有一个分布,从而总体可用一个分布描述,即总体就是一个分布。从样本中可推断出总体的性质。
2.分布与样本的关系为( )。
A.分布愈分散,样本愈分散
B.分布愈分散,样本愈集中
C.分布愈集中,样本愈分散
D.分布愈集中或愈分散,样本都不受影响
【答案】A
【解析】分布愈分散,样本也很分散;分布愈集中,样本也相对集中。
3.生产过程中某种缓慢因素的影响造成的直方图的分布可能是( )。
A.双峰型
B.孤岛型
C.对称型
D.平顶型
【答案】D
【解析】双峰型直方图往往是将两台不同精度的机床生产的或两个不同操作水平的工人生产的或由两批不同原材料生产的产品的数据混合所致;孤岛型直方图往往表示出现某种异常,譬如原材料发生了变化,生产过程发生了变化,或有不熟练的工人替班等;对称型直方图,即中间高,两边低,左右基本对称的情况,在正常生产中许多质量指标呈现这种形状;平顶型直方图往往是由于生产过程中有某种缓慢变化的因素造成的,譬如刀具的磨损等。
4.可能由于测量方法不当,或者是量具的精度较差,也可能是因分组不当引起的是( )直方图。
A.锯齿型
B.孤岛型
C.对称型
D.平顶型
【答案】A
5.改变直方图的形状可用( )方法。
A.精确制图
B.改变组距
C.数据变换
D.组限变换
【答案】C
【解析】对数据作变换会改变直方图的形状,例如选择适当的变换可使偏态分布转化为正态分布。
6.以下不是用来描述样本分散程度的统计量是( )。
A.样本极差
B.样本方差
C.样本均值
D.样本标准差
【答案】C
【解析】用来描述样本分散程度的统计量有三个,分别是样本极差、样本方差(或样本标准差)、样本变异系数;描述样本集中位置的统计量有样本均值、样本中位数和样本众数。
7.样本数据中出现频率最高的是( )。
A.样本众数
B.样本中位数
C.样本均值
D.样本标准数
【答案】A
【解析】样本众数是样本数据中出现频率最高的值;样本中位数是表示数据集中位置的度量;样本均值是样本数据的算术平均数。
8.关于组距,下列描述正确的是( )。
A.组距必定相等
B.组距可以相等,也可以不相等
C.组距不相等的情况用的比较多
D.对应于数据最大及最小的一个或两个组,使用与其他组不相等的组距,这样的情况不可能存在
【答案】B
【解析】每一组的区间长度称为组距,组距可以相等也可以不等。组距相等的情况用得比较多,不过也有不少的情形在对应于数据最大及最小的一个或两个组,使用与其他组不相等的组距。
9.轴直径的一个n=5的样本观测值(单位:cm)为:15.09,15.29,15.15,15.07,15.21,则样本均值为( )。
A.0.89
B.10
C.14.15
D.15.16
【答案】D
【解析】样本均值(15.09+15.29+15.15+15.07+15.21)=15.162cm。
10.有一个分组样本,如表1-5所示,该分组样本的样本均值为( )。
表1-5
A.162
B.163
C.164
D.165
【答案】B
【解析】分组样本均值=(150×4+160×8+170×6+180×2)/20=3260/20=163。
11.从一个总体中随机抽取了两个样本,一个样本的样本量为20,样本均值为158,另一个样本的样本量为10,样本均值为152,则将它们合并为一个样本,其样本均值为( )。
A.153
B.154
C.155
D.156
【答案】D
【解析】合并后的样本量为30,样本均值为=156。
12.轴直径的一个n=5的样本观测值(单位:cm)为:15.09,15.29,15.15,15.07,15.21,则样本中位数为( )。
A.0.89
B.10
C.15.15
D.15.16
【答案】C
【解析】将观测值排序得有序样本为:15.07,15.09,15.15,15.21,15.29,样本中位数为有序样本的第3个位置的数据,即为15.15。
13.一个n=10的样本观测值为:15.9,18.3,17.4,19.5,18.5,18.6,18.8,18.7,19.2,18.8,则样本众数为( )。
A.1.062
B.1.5
C.18.6
D.18.8
【答案】D
【解析】该样本中18.8出现的次数最多,即样本众数为18.8。
14.一个n=3的样本观测值为15.9,18.3,17.4,样本方差为( )。
A.0.89
B.1.47
C.2.6
D.2.94
【答案】B
【解析】样本均值为:
样本方差为:[(15.9-17.2)2+(18.3-17.2)2+(17.4-17.2)2]=1.47。
15.一个n=10的样本观测值为:15.9,18.3,17.4,19.5,18.5,18.6,18.8,18.7,19.2,18.8,则样本标准差为( )。
A.0.94
B.1.03
C.1.61
D.1.71
【答案】B
【解析】样本均值为:
样本方差为:
从而样本标准差为:s=≈1.03。
16.一个n=10的样本观测值为:15.9,18.3,17.4,19.5,18.5,18.6,18.8,18.7,19.2,18.8,则样本变异系数为( )。
A.0.05
B.0.06
C.0.89
D.1.623
【答案】B
【解析】样本均值为:
样本标准差为:
所以样本变异系数为:
17.一个样本由n个观测值组成,已知样本均值和样本标准差s皆为正数,如果每个观测值扩大到2倍,则下列说法正确的是( )。
A.和s都扩大到2倍
B.和s都不变
C.扩大到2倍,s扩大到4倍
D.扩大到4倍,s扩大到2倍
【答案】A
【解析】由于
所以和s都扩大到2倍。
18.一个样本由n个观测值组成,已知样本均值和样本标准差s皆为正数,且有一个观测值等于样本均值,如果把该观测值从原样中去掉,则下列说法正确的是( )。
A.和s都不变
B.和s都变
C.不变,s变大
D.变小,s不变
【答案】C
【解析】对于样本均值来说,因减少了一个与均值相等的数,故其值不变;对于s来说,可由其计算公式
知,由于分子不变,分母减1,故其值变大。
19.已知Xi(i=1,2,3,…,35,36)是36个来自正态分布N(216,16)的独立随机变量。设,关于的分布可描述为( )。
A.均值为216,方差为16
B.均值为6,标准差为4
C.均值为6,方差为16
D.均值为216,标准差为2/3
【答案】D
【解析】由X~N(216,16),则E(X)=216,Var(X)=42。根据中心极限定理可知,样本量为36的样本均值近似服从正态分布N(216,),即均值为216,标准差为2/3。
20.从某轴承厂生产的轴承中随机抽取10000个样品组成一个样本,测得其平均寿命为200000转,标准差为20转,则其样本均值的标准差约为( )转。
A.0.2
B.10
C.20
D.200
【答案】A
【解析】由正态样本均值服从正态分布N(μ,),得样本量为10000的样本均值的标准差为:
=0.2。
21.从正态总体N(10,12)中随机抽出样本为4的样本,则样本均值的标准差为( )。
A.0.5
B.1
C.2
D.4
【答案】A
【解析】由正态样本均值服从正态分布N(μ,),得样本量为4的样本均值的标准差为:
22.关于抽样分布,下列说法错误的是( )。
A.统计量的分布称为抽样分布
B.每一个统计量都有一个抽样分布
C.不同的统计量可得不同的抽样分布
D.抽样分布只能通过理论推导获得
【答案】D
【解析】D项,一些抽样分布可通过抽样方法的运用获得,一些可通过理论推导获得。
23.t分布的α分位数是tα,则有( )。
A.tα+t1-α=1
B.tα-t1-α=1
C.tα+t1-α=0
D.tα-t1-α=0
【答案】C
【解析】由于t分布是对称分布,故有tα=-t1-α,从而有tα+t1-α=0。
24.下列关于F分布的说法错误的是( )。
A.F分布是两个样本方差比的分布
B.F分布的分子的自由度称为分子自由度或第1自由度;分母的自由度称为分母自由度或第2自由度
C.构成F分布的两个样本方差来自两个独立的正态总体,它们的方差相等
D.F分布的概率密度函数在整个轴上呈偏态分布
【答案】D
【解析】设有两个独立的正态总体N(μ1,σ2)和N(μ2,σ2),它们的方差相等。又设x1,x2,…,xn是来自N(μ1,σ2)的一个样本:y1,y2,…,yn是来自N(μ2,σ2)的一个样本,两个样本相互独立,它们的样本方差比的分布是自由度为n-1和m-1的F分布:
其中,n-1称为分子自由度或第1自由度;m-1称为分母自由度或第2自由度。F分布的概率密度函数在正半轴上呈偏态分布。
二、多项选择题(每题的备选项中,有2个或2个以上符合题意,至少有1个错项)
1.样本成为简单随机样本的条件有( )。
A.每个个体在总体中都有相同的机会入样
B.每个个体在总体中都有不同的机会入样
C.从总体中抽取的每个个体对其他个体的抽取无任何影响
D.随机性
E.独立性
【答案】ACDE
【解析】简单随机样本简称为随机样本。它是在样本满足两个条件的情况下成立的,即随机性,独立性。A项是对D项的解释,C项是对E项的解释。
2.设X1,X2,…,Xn是简单随机样本,则有( )。
A.X1,X2,…,Xn相互独立
B.X1,X2,…,Xn有相同分布
C.X1,X2,…,Xn彼此相等
D.X1与(X1+X2)/2同分布
E.X1与Xn的均值相等
【答案】ABE
【解析】简单随机样本满足随机性和独立性,且每一个样本都与总体同分布,样本均值相等。
3.统计学的主要任务有( )。
A.确定统计学的研究目标
B.确定统计学的研究方法
C.研究总体是什么分布
D.研究个体是什么分布
E.这个分布的均值、方差或标准差是多少
【答案】CE
4.关于总体,下列说法正确的有( )。
A.一组被研究对象的全体
B.抽取的部分个体所组成的集合
C.可以用一个分布来描述
D.根据形状的不同可分为正态分布和偏态分布
E.所抽取的所有个体组成的集合
【答案】ACD
【解析】在一个统计问题中,研究对象的全体称为总体,构成总体的每个成员称为个体;总体可以用一个分布来描述,根据形状的不同可以分为正态分布和偏态分布;从总体中抽取的部分个体组成的集合称为样本。
5.为了把零散的信息集中起来反映总体的特征,需要对样本进行加工,其加工方法有( )。
A.图与表
B.构造函数
C.信息变换
D.抽样统计
E.数据变换
【答案】AB
【解析】对样本进行加工的有效方法有图与表,还有构造样本的函数。
6.下列各项属于从样本推断总体的内容的有( )。
A.推断总体中有多少个个体
B.推断总体是什么类型的分布
C.推断总体的均值是多少
D.推断总体的方差是多少
E.推断总体的标准差是多少
【答案】BCDE
【解析】可以从样本推断总体的分布类型、均值、方差及标准差。
7.常见直方图的形状有( )。
A.对称型
B.偏态型
C.平顶型
D.双峰型
E.圆弧型
【答案】ABCD
【解析】直方图的常见形状有很多,除去ABCD四种类型外还有孤岛型、锯齿型等。
8.直方图的制作过程为( )。
A.整理数据,找出其中的最大值Xmax及最小值Xmin,计算它们的差R=Xmax-Xmin,R称为极差,也就是这组数据的取值范围
B.根据数据个数,即样本量n,决定分组数k及组距h
C.确定组限,即每个区间的端点及组中值,并计算落在每组的数据的频率及频数
D.绘出频率频数直方图
E.修改直方图
【答案】ABCD
9.已知样本X1,X2,…,Xn,其中μ未知。下列表达式中,不是统计量的是( )。
A.X1+X2
B.max(X1,X2,…,Xn)
C.X1+X2-2μ
D.(X1-μ)/σ
E.X1+μ
【答案】CDE
【解析】不含未知参数的样本函数称为统计量。CDE三项都含有未知数μ,不是统计量。
10.设X~N(μ,σ2),均值μ已知,而方差σ2未知,X1,X2,X3为总体X的样本,下列各式是统计量的有( )。
A.X1+3X2+σ2
B.X1+2μ
C.max(X1,X2,X3)
D.(X2-μ)2/σ
E.(Xi-μ)2
【答案】BCE
【解析】AD两项都含有未知数σ,不是统计量。
11.描述中心位置的统计量包括( )。
A.有序样本
B.样本均值
C.众数
D.样本中位数
E.方差
【答案】BCD
【解析】样本均值、众数和样本中位数都是描述中心位置的统计量;中心位置与样本有序与否没有关系;样本方差是描述分散程度的统计量。
12.样本中位数是( )。
A.描述样本分散程度的统计量
B.与均值相等
C.有序样本中位于中间的数值
D.是描述样本集中位置的统计量之一
E.位于中间位置的数值
【答案】CD
【解析】中位数是经过排序后位于中间的数。样本中位数是描述中心位置的统计量。
13.样本的变异系数是( )。
A.样本极差和样本均值的比值
B.相对标准差
C.样本方差和样本极差的比值
D.样本标准差和样本均值的比值
E.样本方差与样本均值的比值
【答案】BD
【解析】样本变异系数反映了样本的分散程度,是样本标准差与样本均值的比值,有时也称之为相对标准差。
14.设X1,X2,…,Xn是一个样本,样本的观测值分别为x1,x2,…,xn,则样本方差s2的计算公式正确的有( )。
【答案】ACD
【解析】
15.样本量为2的样本x1,x2的方差是( )。
A.
B.(x1+x2)2/2
C.(x1-x2)2/2
D.-(x1+x2)2/2
E.()/2
【答案】ACD
【解析】
或
16.在理论上已被推导出来的,号称“三大抽样分布”的是( )。
A.t分布
B.χ2分布
C.F分布
D.正态分布
E.均匀分布
【答案】ABC
17.设X1,X2,…,Xn是来自正态总体N(μ,σ2)的一个样本,与s分别为其观测值的样本均值与样本标准差,则在下列抽样分布中正确表述的有( )。
【答案】AD
【解析】设X1,X2,…,Xn是来自正态总体N(μ,σ2)一个样本,则~N,对样本均值施行标准化变换,则有:~N(0,1)。当用样本标准差s代替~N(0,1)中的σ时,有
~t(n-1)。
三、综合分析题(由单项选择题和多项选择题组成)
(一)假设某总体服从正态分布N(12,4),现从中随机抽取一容量为5的样本X1,X2,X3,X4,X5,则:
1.样本均值与总体均值之差的绝对值大于1的概率是( )。
A.0.2628
B.0.98
C.0.9877
D.0.9977
【答案】A
【解析】样本均值服从正态分布N(12,0.8),样本均值与总体均值之差的绝对值大于1的概率为:
2.概率P{max(X1,X2,X3,X4,X5)>15}=( )。
A.0.2533
B.0.2893
C.0.2923
D.0.2934
【答案】C
【解析】因为P(Xi≤15)=Φ()=Φ(1.5)=0.9332,所以:
P{max(X1,X2,X3,X4,X5)>15}=1-P{max(X1,X2,X3,X4,X5)≤15}=1-P(X1≤15)P(X2≤15)P(X3≤15)P(X4≤15)P(X5≤15)=1-0.93325=0.2923。