您好,欢迎来到抵帆知识网。
搜索
您的当前位置:首页立用多元线性回归研究国家婴儿死亡率与妇女文盲率之间的关系(DOC)

立用多元线性回归研究国家婴儿死亡率与妇女文盲率之间的关系(DOC)

来源:抵帆知识网
实验二:多元线性回归分析

一.实验目的

熟练应用EViews软件作多元线性回归分析。

二.实验主题

立用多元线性回归分析研究国家婴儿死亡率与妇女文盲率之间的关系。

三.实验内容

1、先验的预期CM和各个变量之间的关系。 2、做CM对FLR的回归,得到回归结果。

3、做CM对FLR和PGNP的回归,得到回归结果。

4、做CM对FLR,PGNP和TFR的回归结果,并给出ANOVA。 5、根据各种回归结果,选择哪个模型?为什么?

6、如果回归模型(4)是正确的模型,但却估计了(2)或(3),会有什么后果? 7、假定做了(2)的回归,如何决定增加变量PGNP和TFR?使用了哪种检验?给出必要的计算结果。

四.实验报告

要求:

1、问题提出2、指标选择 3、数据选择 4、数据处理5、数据分析6、建立模型 以及模型检验 7、报告结论 8、实验总结 1、问题提出

一个国家的婴儿死亡率关系到一个国家的未来发展,反映了国家人民的健康水平与国家的发展水平,这一指标也是采取相关的一个重要依据。在社会学中,一个国家的婴儿死亡率与妇女的文盲率之间存在一定的相关关系,但这两个指标之间存在着怎样的关系,为此,我们利用统计数据对这一问题进行实证分析。 2、指标选择

我们选取一个国家的婴儿死亡率CM,女性识字率FLR进行分析。考虑到影响婴儿死亡率的因素较复杂,尤其是经济发展状况、总生育率等也会对其产生重要影响,考虑到实验的准确性,同时研究人均GNP(PGNP)和总生育率(TFR)对婴儿死亡率的影响。 预期:

1)预期CM与FLR存在负相关关系。

一方面,女性受教育程度越高,其知识越丰富,自我保护意识和能力就越强,则更善于保护自己和婴儿;另一方面,女性教育程度越高,其就业机会与收入获得途径就越多,可以更好的保障自己和婴儿的生活。因此,我们预期FLR的提高会导致CM降低。

2)预期CM与PGNP存在负相关关系。

人均GNP的提高使人们的物质生活水平得到提高,改善了人民、食、住、行等诸方面的条件,特别是使人们摄取的营业素增加,营养素结构合理,从而增加人们的体质;使人们从繁重的体力劳动和恶劣的工作环境中解脱出来,有充足的精力和时间来关心自己及其后代的身体健康,提高生活质量。因此,我们预期PGNP的提高会导致CM降低。

3)预期CM与TFR存在正相关关系。

总生育率直接或间接地影响着婴儿死亡率,总生育率提高,人口数量上升,人均GNP,人均受教育程度等一系列人均享受的权利和福利都会有所下降。因此,我们预期TFR的提高会导致CM降低。 3、数据选择

考虑到实验结果的普遍性,我们选择世界各地区个国家的各项指标数据作为样本进行研究分析。数据由老师提供,详细数据见表1 序号 婴儿死亡率CM 女性识字率FLR 人均GNP(PGNP) 总生育率TFR 1 128 37 1870 6.66 2 204 22 130 6.15 3 202 16 310 7.00 4 197 65 570 6.25 5 96 76 2050 3.81 6 209 26 200 6.44 7 170 45 670 6.19 8 240 29 300 5. 9 241 11 120 5. 10 55 55 290 2.36 11 75 87 1180 3.93 12 129 55 900 5.99 13 24 93 1730 3.50 14 165 31 1150 7.41 15 94 77 1160 4.21 16 96 80 1270 5.00 17 148 30 580 5.27 18 98 69 660 5.21 19 161 43 420 6.50 20 118 47 1080 6.12 21 269 17 290 6.19 22 1 35 270 5.05 23 126 58 560 6.16 24 12 81 4240 1.80 25 167 29 240 4.75 26 135 65 430 4.10 27 107 87 3020 6.66 28 72 63 1420 7.28 29 128 49 420 8.12 30 27 63 19830 5.23 31 152 84 420 5.79 32 224 23 530 6.50 33 142 50 80 7.17 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 55 56 57 58 59 60 61 62 63 表1 104 287 41 312 77 142 262 215 246 191 182 37 103 67 143 83 223 240 312 12 52 79 61 168 28 121 115 186 47 178 142 62 31 66 11 88 22 22 12 9 31 19 88 35 85 78 85 33 19 21 79 83 43 88 28 95 41 62 45 85 45 67 350 230 1620 190 2090 900 230 140 330 1010 300 1730 780 1300 930 690 200 450 280 4430 270 1340 670 410 4370 1310 1470 300 3630 220 560 6.60 7.00 3.91 6.70 4.20 5.43 6.50 6.25 7.10 7.10 7.00 3.46 5.66 4.82 5.00 4.74 8.49 6.50 6.50 1.69 3.25 7.17 3.52 6.09 2.86 4.88 3. 6.90 4.10 6.09 7.20

4.数据处理

表1中的实验数据可直接应用于研究分析,无需经过其他处理。 5.数据分析

1、观察表1数据,婴儿死亡率CM,女性识字率FLR,人均GNP(PGNP)和总生育率(TFR)中,不存在与现实意义不相符的数据,因此可以拿来进行问题的研究。

2、通过EViews软件分析进行相关分析: 1) CM与FLR的相关性

320280240200 FLR CM FLR 1.000000 -0.818285 CM -0.818285 1.000000 表2 CM1601208040002040FLR6080100 图1

由散点图(图1)和相关系数(表2)知,这两组数据的相关性较高,且CM与FLR之间存在负相关关系。

2)CM与PGNP的相关性

320280240200 PGNP CM PGNP 1.000000 -0.407697 CM 表3 CM1601208040004,0008,00012,00016,00020,000-0.407697 1.000000 PGNP

图2 由散点图(图2)和相关系数(表3)知,这两组数据有一定的相关性,且CM与PGNP之间存在负相关关系。

3)CM与TFR的相关性

PGNP CM 320280240200PGNP CM 1.000000 -0.407697 -0.407697 1.000000 CM1601208040012345TFR67表4 图3

由散点图(图3)和相关系数(表3)知,这两组数据具有一定的相关性,且CM与TFR之间存在正相关关系。

通过相关分析可以发现,CM与FLR之间存在负相关关系,与PGNP之间存在负相关关系,与TFR之间存在正相关关系。 6.建立模型以及模型检验

1、分别做出CM对FLR、CM对FLR和PGNP以及CM对FLR,PGNP和TFR进行回归分析,建立回归模型

2、分别对各个模型进行检验,包括经济检验及统计检验 3.给出CM对FLR,PGNP和TFR回归结果的ANOVA 6.1 CM对FLR的回归模型建立及检验 (1)建立回归模型

根据图1,建立如下线性模型:CMi01FLRii

得出回归结果如下

Dependent Variable: CM Method: Least Squares Date: 04/15/16 Time: 11:44 Sample: 1

Included observations:

Variable FLR C

R-squared

Coefficient -2.390496 263.8635

Std. Error 0.213263 12.22499

t-Statistic -11.20917 21.58395

Prob. 0.0000 0.0000 141.5000

0.669590 Mean dependent var

Adjusted R-squared Dependent Variable: CM S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)

0.6261 S.D. dependent var

44.02399 Akaike info criterion 120163.0 Schwarz criterion -332.0191 Hannan-Quinn criter. 125.55 Durbin-Watson stat 0.000000

75.97807 10.43810 10.50556 10.468 2.314744

回归方程式:CM2.390496*FLR263.8635 其中: Se=(0.213263) (12.22499) t=(-11.20917) (21.58395)

)(0.0000) R20.669590 F125.55 p(0.0000 (2)模型检验

CM对FLR的回归模型的检验 经济检验:斜率值为 - 2.390496,说明女性识字率(FLR)与婴儿死亡率(CM)负 相关,且在其他条件不变的情况下女性识字率(FLR)增加1%,可导致婴儿死亡率(CM)减少2.390496%。

统计检验:

(1)拟合优度检验:

2

拟合度R=0.669590,说明所建模型整体上对样本数据还不算很好,即解释变量

CM对 FLR的大部分差异作出了解释,但可能还有其他因素影响婴儿死亡率。

(2)t检验:

变量β1和β2的原假设与备择假设为:H0:β0=0,β1≠0;H0:β1=0,β1≠0。查表可得,在5%的显著水平下,自由度为n-2=-2=62的t的临界值为2.000。因为计算得到的β0的估计值的t值21.58395>2.000,所以拒绝原假设H0:β0=0,β1的估计值的t值-11.20917<-2.000,所以拒绝原假设H0:β1=0。这说明在95%的置信水平下,解释变量女性识字率(FLR)通过了显著性检验,即解释变量女性识字率(FLR)对婴儿死亡率(CM)有显著影响。

6.2 CM对FLR和PGNP的回归模型建立及检验

(1)建立回归模型

根据图2,建立如下线性模型:CMi01FLRi2PGNPii 得出回归结果如下:

Dependent Variable: CM Method: Least Squares Date: 04/15/16 Time: 11:49 Sample: 1

Included observations:

Variable C

Coefficient 263.16

Std. Error 11.59318

t-Statistic 22.74109

Prob. 0.0000

FLR PGNP

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)

-2.231586 -0.0057

0.209947 0.002003

-10.62927 -2.818703

0.0000 0.0065 141.5000 75.97807 10.34691 10.44811 10.38678 2.186159

0.707665 Mean dependent var 0.698081 S.D. dependent var 41.74780 Akaike info criterion 106315.6 Schwarz criterion -328.1012 Hannan-Quinn criter. 73.832 Durbin-Watson stat 0.000000

回归方程式:CM2.231586*FLR0.0057*PGNP263.16 其中:

)(0.002003)(11.59318) Se(0.209947)(2.818703)(22.74109) t(10.62927)(0.0065)(0.0000) R20.707665 p(0.0000 F73.832(2)模型检验

经济检验:所估计参数β1和β2的估计值均为负数,说明女性识字率(FLR)和人均GNP(PGNP)与婴儿 的死亡率(CM)负相关,与预期假设相同。β1的估计值为-2.231586,表示在其他变量保持不 变的情况下,女性识字率每增加1%,婴儿死亡率减少2.231586%。β2的估计值为- 0.0057,表示在其他变量保持不变的条件下,人均GNP每增加1%,婴儿死亡率减少0.0057%。 统计检验:

(1)拟合优度检验:

2

拟合度R=0.707665,说明所建模型整体上对样本数据还不算很好,即解释变量CM对 FLR的大部分差异作出了解释,但可能还有其他因素影响婴儿死亡率。

(2)t检验:

查表可得,在5%的显著水平下,自由度为n-3 = -3 = 61的t的临界值为2.000,β1的估计值的t值为-10.62927<-2.000,β2的估计值为-2.818703<-2.000,说明在95%的置信水平下,解释变量女性识字率(FLR) 和人均GNP(PGNP)均通过了显著性检验,即解释变量女性识字率 (FLR) 和人均GNP(PGNP)对婴儿死亡率(CM)有显著影响。 7.3 CM对FLR、PGNP和TFR的回归模型建立及检验 (1)建立回归模型

根据图3,建立如下线性模型:CMi01FLRi2PGNPi3TFRi 得出回归结果如下:

Dependent Variable: CM Method: Least Squares Date: 04/19/16 Time: 11:31

Sample: 1

Included observations:

Coefficient 168.3067 -1.768029 -0.005511 12.868

Std. Error 32.165 0.248017 0.001878 4.190533

t-Statistic 5.117003 -7.128663 -2.934275 3.070883

Prob. 0.0000 0.0000 0.0047 0.0032 141.5000 75.97807 10.23218 10.36711 10.28534 2.170318

 Variable C FLR PGNP TFR

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)

 0.747372 Mean dependent var 0.734740 S.D. dependent var 39.13127 Akaike info criterion 91875.38 Schwarz criterion -323.4298 Hannan-Quinn criter. 59.16767 Durbin-Watson stat 0.000000

CM1.768029FLR0.005511PGNP12.868TFP168.3067

其中:Se= (0.248017)(0.001878)(4.190533)(32.165)

)(2.934275)(3.070883)(5.117003) t(7.128663)(0.0047)(0.0032)(0.0000) p(0.0000R20.747372 F59.16767

(2)模型检验

经济检验:

所估计参数β1和β2的估计值为负数,β3的估计值为正数,说明女性的文化率(FLR)和人均GNP(PGNP)与婴儿的死亡率(CM)负相关,总生育率(TFR)和婴儿的死亡率(CM)正相关, 与预期假设相同。β1的估计值为– 1.768029,表示在其他变量保持不变的情况下,女性识字率 每增加1%,婴儿死亡率减少 1.768029%;β2的估计值为- 0.005511,表明在其他变量保持不变的条件下,人均GNP每增加1%,婴儿死亡率减少- 0.005511%;β3的估计值为12.868,表明总生育率增加1%,婴儿死亡率增加12.868%。 统计检验:

(1)拟合优度检验:

拟合度R2=0.747372 ,说明所做模型整体对样本数据拟合较好,即解释变量 FLR、PGNP和TFR对CM的大多数差异作了解释,但该模型仍有进一步改良的空间。 (2)t检验:

查表可得,在5%的显著水平下,自由度为n-4 = -4 = 60的t的临界值为2.000,β1的估计值的t值为-7.128663<-2.000,β2的估计值为-2.934275<-2.000,β3的估计值为3.070883>2.000,说明在95%的置信水平下,解释变量女性识字率(FLR) ,人均GNP(PGNP)和总生育率(TFR)均通过了显著性检验,即解释变量女性识字率(FLR) 、人均GNP(PGNP) 、

总生育率(TFR)对婴儿死亡率(CM)均有显著影响。

8.报告结论

1)根据各种回归结果,应选择CM对FLR,PGNP和TFR的回归模型。

因为从各个回归结果中的可决系数 看,CM对FLR的回归模型中 =0.669590 ,CM对FLR和PGNP回归模型中 =0.707665,CM对FLR,PGNP和TFR的回归模型中 =0.747372,因为CM对FLR,PGNP和TFR的回归模型中 最大,对样本数据的拟合程度最高

2) 如果回归模型CM对FLR,PGNP和TFR是正确的模型,但却估计了前两种回归模型,就忽略了影响婴儿死亡率的其他重要因素,而且根据上面各模型的分析可知正确回归模型中FLR,PGNP和TFR这三个解释变量的系数的绝对值都小于其他模型,采用前两种回归模型会使模型中仅有的解释变量对被解释变量的影响增大,使回归模型的误差可能很大,失去其意义,甚至得出与实际相反的结论

3)在实际中,为了解释某个现象,往往面临着在若干解释变量间进行取舍的问题。通常的做法是:只要调整的可决系数值增加,就可以增加新的解释变量。在上述三个回归模型中,CM对FLR的回归模型中的调整的可决系数值为0.6261,CM对FLR和PGNP回归模型中的调整可决系数值为0.698081,CM对FLR,PGNP和TFR的回归模型中的调整可决系数值为0.734740。因此CM对FLR,PGNP和TFR的回归模型中引入PGNP和TFR提高了模型的解释能力,也就是说,PGNP和TFR应该作为重要的解释变量引入到模型中来。 9、报告结论

1、婴儿死亡率受多个因素的影响,包括女性识字率FLR,人均GNP(PGNP)和总生育率(TFR)等。尽管这三项是决定婴儿死亡率的重要因素,但现实生活中一定还存在其他的影响因素,应该去探索和研究

2、婴儿死亡率受女性识字率FLR,人均GNP(PGNP)和总生育率(TFR)的影响较大,在采取相关的时候应重点考虑这些因素的影响。

3、EViews的应用能力还有待提高,应在多次运用中渐渐熟练。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- dfix.cn 版权所有 湘ICP备2024080961号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务