搜索
您的当前位置:首页正文

统计学试卷2012

来源:抵帆知识网
中央财经大学2011-2012学年第二学期

《统计学》试题

专业___________________ 学号_____________ 姓名_______________

注意事项:

1.考试中可以使用计算器。

2.本试卷共有四道大题,请不要漏答。

3.考试时间为110分钟,请注意合理分配考试时间。 4.答题中可能用到的部分公式已经附在试卷末尾供参考。 5.试卷不得带出考场,交卷时请将试卷和答题纸分开。 6. 可以把试卷的空白处用作草稿纸,不另附草稿纸。

7. 所有假设检验中显著性水平都取为0.05,不再另行说明。 8.请将所有答案写在答题纸对应的位置上或者写清题号,评分只以答题纸为准。空间不足时可在答题纸背面答题。

一、单项选择题(选出最为恰当的一项。每题1分,共20分)。

1. 根据人的性别特征将人口划分为男性和女性两类,所采用的测度计量尺度是 A、名义尺度 B、顺序尺度 C、定距尺度 D、定比尺度

2. 某市场调查公司为了对一家大型商场做顾客满意度调查,对不同性别和年龄的顾客按事先规定的人数随意进行了一些调查询问,这种调查属于

A、整群抽样 B、分层抽样 C、配额抽样 D、方便抽样

3. 进行抽样调查,当总体内部差异较大且有明显的不同类型界限或标志时,通常采用 A、简单随机抽样 B、系统抽样 C、整群抽样 D、分层抽样

4. 一组数据的偏度系数为-3,则该数据的统计分布应具有如下特征 A、尖峰分布 B、扁平分布 C、左偏分布 D、右偏分布

5. 在一项抽样调查中,由于抽样随机性造成的误差属于

A、抽样误差 B、抽样框误差 C、无回答误差 D、计量误差

6. 观测数据序列为,1,3,3,7,9,25。则数字“3”的秩为: A、2 B、2.5 C、3 D、以上都不对

7. 观测数据序列为,1,3,3,7,9,25。则这组数据的中位数等于: A、3 B、5 C、7 D、以上都不对

8. 如果假设检验中原假设为H0:≥ 0,备则假设为H1:< 0,则该检验是

A、左侧检验 B、右侧检验 C、双侧检验 D、独立样本检验

1

9. 要描述我国国内生产总值的三次产业构成,最恰当的图形是: A、线图 B、直方图 C、茎叶图 D、饼图

10. 某地粮食总产量比去年增长了10%,粮食播种面积增长了5%,则粮食平均亩产量增长了:

A、0.5% B、2% C、4.8% D、5%

11. 用SPSS软件对变量做描述统计分析时,会计算“标准差”和“标准误”。以下说法正确的是:

A、标准差反映了样本均值抽样分布的离散程度 B、标准误反映了样本均值抽样分布的离散程度 C、标准差反映了变量的集中趋势 D、标准误反映了变量的集中趋势

12. 在一项抽样调查中采用有放回的简单随机抽样,已知最大允许误差为5,置信度为95%,总体标准差为50,则必要样本容量为:

A、20 B、196 C、385 D、以上都不对

13. 对于一个平稳的时间序列,其自相关和偏自相关函数都是拖尾的,则该序列最可能适合的模型形式是:

A、AR模型 B、MA模型 C、ARMA模型 D、以上都不对

14. 多元回归分析中修正的R2:

A、可以是负值 B、取值在0-1之间

C、总是大于R2 D、与方程中自变量的个数无关

15. 对1,2,5,7,10共5个数做系统聚类分析,则以下说法正确的是 A、最先聚在一起形成一类的是1和2 B、最后聚在一起形成一类的是1和2 C、最先聚在一起形成一类的是7和10 D、不能确定,因为未说明距离的计算方法

16. 系统聚类分析中计算个体之间的距离可以使用的方法是:

A、最短距离 B、最长距离 C、平均距离 D、欧式距离

17. 为了检验两个独立样本对应总体的均值是否相等,可以使用的检验方法是 A、Kruskal-Wallis检验 B、Wlicoxon秩和检验 C、独立样本t检验 D、匹配样本t检验

18. 使用K-S检验来进行正态性检验时,以下说法正确的是: A、检验的原假设是样本服从正态分布 B、检验的备择假设是样本服从正态分布 C、检验的原假设是总体服从正态分布 D、检验的备择假设是总体服从正态分布

2

19.回归分析中的最小平方法是使______达到最小。 A、残差之和 B、残差平方和

C、残差绝对值之和 D、因变量的离差平方和

20. 在对多个ARIMA模型进行比较以选择模型时,以下最为恰当的指标是 A、模型的R2 B、模型的BIC值 C、模型的估计标准误 D、模型的t检验值

二、多项选择题(至少有一个选项是正确,多选、少选均不得分。每题2分,共10分)。 1. 以下关于面访调查的说法正确的有: A、一般有较高的回答率 B、调查成本相对较低

C、调查的时效性高,可以迅速获得调查结果 D、适合对敏感性问题的调查 E、可以询问比较复杂的问题

2. 多元线性回归分析中,需要以下哪些假设条件以保证OLS估计量的优良性质? A、模型中随机误差项的方差保持不变 B、模型中随机误差项之间不存在自相关 C、自变量和因变量之间高度相关 D、自变量之间相互独立

E、自变量之间不存在完全的多重共线性

3. 以下关于检验的说法正确的有:

A、可以用来检验两个定性变量是否相互独立 B、可以用来检验单个定性变量是否服从正态分布 C、可以用来检验单个定量变量是否服从正态分布 D、要求每个分组(单元格)中的观测频数大于等于5 E、是一种参数检验方法

4. 以下以Kruskal-Wallis检验的输出结果,根据结果以下正确的有:

工资

卡方 12.316 df 3 渐近显著性 0.006

A、检验中需要假设各个子总体的方差相等

B、检验结论是各个子总体的均值不全相等 C、检验结论是各个子总体的中位数不全相等 D、从表格可以看出检验中总共涉及4个子总体 E、从表格可以看出检验中总共涉及3个子总体

3

5. 对x和y两个变量计算相关系数并进行假设检验的结果如下表,则相关说法正确的有:

相关性

x

Pearson 相关性 显著性(双侧) N

y

Pearson 相关性 显著性(双侧) N

X

1 y .271 .006 100 100 1 **

.271 .006 100 **

100 **. 在 .01 水平(双侧)上显著相关。

A、以y为因变量,x为自变量做回归(包含常数项),则方程的判定系数0.073。 B、以y为因变量,x为自变量做回归(包含常数项),则方程的判定系数0.271。 C、对相关系数的假设检验中p值=0.271。 D、对相关系数的假设检验中p值=0.006。

E、假设检验的结果是拒绝原假设,认为两个变量的相关系数是显著的。

三、判断题(正确的在答题纸相应位置打√,错误的打×。每题1分,共10分) 1.定性变量不能计算算术平均数。

2.对于等间隔的时点序列,将所有数值之和除以数据个数即可以计算出平均发展水平。 3.由于调查中被调查者一般不愿意如实回答敏感性问题,因此调查问卷中不应该包含此类问题。

4.基于两个独立样本对两个总体的均值进行假设检验时,需要先检验两个总体的方差是否相等。

5. Wlicoxon符号秩检验可以用来检验两个独立样本的中位数是否相等。 6.方差分析中的因变量也称为因素。 7. 在多元线性回归分析中,如果在t检验中所有的自变量都不显著,则方程在整体显著性的F检验中一定是不显著的。

8. 计算加权综合指数时,如果同度量因素固定在基期,则相应的指数称为拉氏指数。 9. 因子分析中必须先对变量进行标准化以消除计量单位对计算结果的影响。 10.聚类分析中可以通过共同度这一指标来比较聚类效果的好坏。

四、计算和案例分析题(共60分)。

1.(9分)人民网在6月6日推出的“如何看待人保部拟适时建议弹性延迟领养老金年龄”调查显示,截止到6月11日下午14点,该调查已有超过80万人参加,其中,超过75万人表示反对,占93.7%;有2.5%的人表示支持,2.1%的人持中立态度。对于这一调查结果,人社部认为“网络调查具有一定片面性,上网的人多数比较年轻,某种意义上老人占位子,年轻人压力会很大,网上很难展现出全景的结果,需要对不同行业、单位、层级的人进行调查。”

(1)你如何看待网络调查结果的代表性?(3分)

(2)如果由你来设计一个调查,要求在短时间内了解全国15-64岁人口对延迟退休年龄的态度,你将采用何种调查方法?通过何种方式收集数据?为调查设计3-5个封闭式的问题和备选答案。(6分)

4

2.(8分)中国统计年鉴公布的我国2007-2010年的居民消费价格指数(CPI)和居民消费支出数据见下表(当年价格)。

居民消费价格指数

2007 2008 2009 2010

104.8 105.9 99.3 103.3

居民消费支出(当年价格,亿元)

95609.8 110594.5 121129.9 133290.9

(1)简要说明居民消费价格指数的含义和统计方法。 (2)计算以2007年价格表示的各年居民消费。

(3)以2007年为基期,计算2008-2010年我国实际居民消费支出的年平均增长率。 3、(8分)要检验一种新的操作方法是否能够增加钢产量,在10个平炉中分别用原有的操作方法炼一炉,再用新操作方法炼一炉。用X1和X2分表表示原操作方法和新操作方法产量。对测试结果用匹配样本t检验进行分析,SPSS的部分输出结果如下。

成对样本检验 均值 成对差分 标准差 均值的标准误 下限 对 1 X2 – X1 3.20000 2.40832 差分的 95% 置信区间 上限 4.202 9 .002 t df Sig.(双侧) .76158 1.47719 4.92281

(1)写出检验中的原假设和备择假设。 (2)写出检验的p值以及检验的结论。

(3)如果差值序列不服从正态分布,可以使用哪种非参数检验方法进行假设检验? 4、(9分)为了测试4种不同的原材料对产品使用寿命的影响,随机抽取4种不同原材料的产品若干件测试其使用寿命,对实验数据进行单因素方差分析的结果如下,请据此回答问题。

方差齐性检验 Y Levene 统计量 3.532 df1 3 df2 22 显著性 .032 单因素方差分析 Y 组间 组内 总数 平方和 49212.353 166622.262 215834.615 df A B 25 均方 C D F E 显著性 .121 5

(1)请判断数据是否满足方差分析关于“方差齐性”的假设条件,并给出依据; (2)请计算方差分析表中A、B、C、D、E五项数值;

(3)根据方差分析的结果,能否认为4种材料的产品使用寿命有显著差异?

5. (6分)SPSS软件估计的一个AR(2)模型(不包含常数项)的结果如下。

ARIMA 模型参数

x-模型_1 x

无转换 AR

滞后 1 滞后 2

估计 .550 .275

SE .109 .109

t 5.065 2.515

Sig. .000 .014

(1)写出模型表达式(3分);

(2)已知x最近3期(t-2、t-1、t)的值分别为0.11,1.04和0.12,请根据模型预测t+1时刻x的值。(3分) 6、(12分)一家大型超市每个月都会由于偷窃行为造成一定的损失。以各个月份的损失额(Y,美元)为因变量,员工人数(X1,人)、交易量(X2,笔数)为自变量的回归结果如下:

模型汇总 模型 1 R .758 aR 方 .574 调整 R 方 估计的标准误差 .513 311.60426 a. 预测变量: (常量), X2, X1。 Anova 模型 回归 1 残差 总计 a. 因变量: Y b. 预测变量: (常量), X2, X1。 平方和 1833270.524 1359361.005 3192631.529 df 2 14 16 均方 916635.262 97097.215 F 9.440 Sig. .003 ba 系数 模型 非标准化系数 B (常量) 1 X1 X2 a. 因变量: Y 4600.805 -21.567 .203 标准 误差 1010.545 8.956 .056 -1.062 1.606 标准系数 试用版 4.553 -2.408 3.642 .000 .030 .003 t Sig. a

6

(1)请写出估计的回归方程,并说明回归系数的含义。

(2)说明模型估计标准误的含义。已知Y的均值为3300美元,计算一个离散系数来反映模型的拟合效果。

(3)分析方程t检验和F检验的结果。

(4)某一个月份职工人数为200人,交易笔数15618笔。根据模型估计该月份的偷窃损失。

7. (8分)一项研究中试图比较多个城市综合发展水平的差异。研究中选择的变量如下: X1:年末总人口 ; X2:地区生产总值 X3:城乡居民储蓄余额 ; X4:在岗职工平均工资 X5:年末邮政局数 ; X6:社会商品零售总额 ; X7:医院卫生院个数

以下是使用主成分方法提取因子、采用最大方差法进行因子旋转得到的因子分析的部分结果。请根据结果回答题。

解释的总方差 初始特征值 提取平方和载入 旋转平方和载入 成份 合计 方差的 % 累积 % 合计 方差的 % 累积 % 合计 方差的 % 累积 % 1 2 3 4 5 6 7 4.792 1.764 .251 .103 .056 .022 .013 68.452 68.452 4.792 25.206 93.658 1.764 3.581 97.239 1.465 98.704 .796 99.500 .316 99.816 .184 100.000 68.452 68.452 3.651 25.206 93.658 2.905 52.152 52.152 41.506 93.658 提取方法:主成份分析。

成份矩阵

a

旋转成份矩阵

2 .621 -.299 -.347 -.600 .528 -.298 .664 X1 X2 X3 X4 X5 X6 X7

a

X1 X2 X3 X4 X5 X6 X7

成份 1 .752 .942 .916 .756 .740 .936 .712

成份 1 .212 .927 .936 .965 .259 .922 .154 2 .953 .342 .289 -.010 .871 .340 .961

(1)结合本例说明因子分析中确定因子的个数的方法。(3分) (2)分析各个因子的含义,并给予适当命名。(3分) (3)写出用公共因子表示的X7变量的表达式。(2分)

7

附:可能用到的公式。

Z0.025=1.96

sCV(总体)或cv(样本)

Xxt x0 s/n离差平方和SS SSA SSE SST 自由度df r-1 n-r n-1 均方MS MSA MSE F值 MSA/MSE 变差来源 组 间 组 内 总变异 xnaaa1a2nnn a0a1an1a022Z/2nE2 n2Z(1)/2E2, nn0 n01N

ARIMA模型公式:(遗漏)

8

因篇幅问题不能全部显示,请点此查看更多更全内容

Top