《应用回归分析》课后题答案解析

《应用回归分析》部分课习题答案   回归分析概述 变量统计关系和函数关系区别是什么? 答变量统计关系是指变量具有密切关而又不能由某或某些变量唯确定另外变量关系而变量函数关系是指由变量唯确定另外变量确定关系。

回归分析与相关分析系与区别是什么? 答系有回归分析和相关分析都是研究变量关系统计学课题。

区别有回归分析变量称因变量处被释特殊地位。

相关分析变量x和变量处平等地位即研究变量变量x密切程与研究变量x与变量密切程是回事。

b相关分析所涉及变量变量x全是随机变量

回归分析因变量是随机变量变量x可以是随机变量也可以是非随机确定变量

相关分析研究主要是了刻画两类变量线性相关密切程。

回归分析不仅可以揭示变量x对变量影响还可以由回归方程进行预测和控制。

3 回归模型随机误差项ε义是什么? 答ε随机误差项正是由随机误差项引入才将变量关系描述随机方程使得我们可以借助随机数学方法研究与x,x…x关系由客观济现象是错综复杂种济现象很难用有限因素准确说明随机误差项可以概括表示由人们认识以及其他客观原因局限而没有考虑种种偶然因素。

线性回归模型基假设是什么? 答线性回归模型基假设有释变量xx…x是非随机观测值xx…x是常数。

等方差及不相关假定条件{(ε)0 ,… v(ε,ε){σ^ 3正态分布假定条件相独立。

样容量数要多释变量数即 5 回归变量设置理论根据是什么?回归变量设置应哪些问题? 答理论判断某变量应该作释变量即便是不显著如理论上无法判断那么可以采用统计方法判断释变量和被释变量存统计关系。

应问题有选择变量要与些专门领域专合作不要认回归模型所涉及变量越多越回归变量确定工作并不能次完成要反复试算终出合适些变量

6 收集整理数据包括哪些容? 答;常用样数据分序列数据和横截面数据因而数据收集方法主要有按顺序统计数据和截面上统计数据数据收集样容量多少般要与设置释变量数目相配套。

而数据整理不仅要把些变量数据进行折算差分甚至把数据对数化标准化等有还剔除别特别或特别“野值”。

7 构造回归理论模型基依据是什么? 答选择模型数学形式主要依据是济行理论根据变量样数据作出释变量与被释变量关系散图并将由散图显示变量函数关系作理论模型数学形式。

对问题我们可以采用不形式进行计算机模拟对不模拟结选择较作理论模型

8 什么要对回归模型进行检验? 答我们建立回归模型目是了应用它研究济问题但如马上就用这模型预测控制分析显然是不够慎重所以我们必须通检验才能确定这模型是否真正揭示了被释变量和释变量关系。

9 回归模型有那几方面应用? 答回归模型应用方面主要有济变量因素分析和进行济预测

0 什么强调运用回归分析研究济问题要定性分析和定量分析相结合? 答回归模型运用我们还强调定性分析和定量分析相结合。

这是因数理统计方法只是从事物外数量表面上研究问题不涉及事物质规定性单纯表面上数量关系是否反映事物质?这质究竟如何?必须依靠专门学科研究才能下定论所以济问题研究我们不能仅凭样数据估计结就不加分析地说长道短必须把参数估计结和具体济问题以及现实情况紧密结合这样才能保证回归模型济问题研究正确应用。

二 元线性回归  答()散图 ()x与致呈线性关系。

(3)设回归方程    ()。

(5)由 从由分布。

因而 也即 可得 即(95)  从由分布。

因而 即 可得 (6)x与定系数 (7) V x 平方和 方 显著性 组 (组合) 9000 500 9000 00 线性项 加权 867 867 6333 056 偏差 833 833 667 36 组 000 500  总数 0000  由,拒绝,说明回归方程显著x与有显著线性关系。

(8)  其 接受原假设认显著不0因变量变量x元线性回归成立。

(9)相关系数  表相应值表相应值x与有显著线性关系 (0) 序  0 6 0 3 3 3 3 0 0 0 0 7 7 5 5 0 3 6 残差图  从图上看残差是围绕0随机波动从而模型基假定是满足。

()当广告费万元销售收入 即(7397) 5 答 () 散图 ()x与致呈线性关系。

(3)设回归方程    () 0305 080 (5) 由 从由分布。

因而 也即 可得 即(0008000)  从由分布。

因而 即 可得 (6)x与定系数 0908 (7) V x 平方和 方 显著性 组 (组合) 397500 7 7598 530 68 线性项 加权 6873036 6873036 35 07 偏差 6786 6 06077 35 885 组 6636500 33850  总数 97860000 9 由,拒绝,说明回归方程显著x与有显著线性关系。

(8) 其 接受原假设认显著不0因变量变量x元线性回归成立。

(9) 相关系数  表相应值表相应值x与有显著线性关系 (0) 序  85 3.5 30768 03 5 08808 09 3 070 39588 00 550 0868 00868 5 80 838 0838 6 90 3 388 088 7 350 5 9688 0668 8 35 5 768 03 9 670 3 588 08 0 5 5 808 059 从图上看残差是围绕0随机波动从而模型基假定是满足。

() (), 即(77) 近似置信区即(766) (3)可得置信水平即(33307) 6 ()散图  可以用直线回归描述与x关系 ()回归方程 (3)  从图上可看出检验误差项从正态分布。

三 多元线性回归 3 ()用算出xx,x3相关系数矩阵  相关性  x x x3 r 相关性 000 556 73 7 x 556 000 3 398 x 73 3 000 57 x3 7 398 57 000  08 008 009 x 08 378 7 x 008 378 05 x3 009 7 05 0 0 0 0 x 0 0 0 0 x 0 0 0 0 x3 0 0 0 0 所以 系数 模型标准化系数 标准系数 g B 950% 置信区 相关性 共线性统计量 B 标准 误差 试用版 下限 上限 零阶 偏 部分 容差 V (常量) 3880 7659 97 096 780060 83500 x 375 933 385 9 00 977 885 556 6 350 85 x 70 880 535 65 09 053 9 73 709 687 55 x3 7 0569 77 78 8 35 3830 7 33 586 708 因变量  () 所以三元线性回归方程  模型汇总 模型 R R 方 调整 R 方 标准 估计误差 更改统计量 R 方更改 更改 g 更改 898 806 708 388 806 883 3 6 05 预测变量 (常量), x3, x, x。

(3) 由定系数R方0708 R0898较所以认拟合较高 () vb 模型 平方和 方 g 回归 3655370 3 55790 883 05 残差 39730 6 595  总计 695500 9  预测变量 (常量), x3, x, x。

b 因变量  因883  005005所以认回归方程整体上拟合 (5) 系数 模型标准化系数 标准系数 g B 950% 置信区 相关性 共线性统计量 B 标准 误差 试用版 下限 上限 零阶 偏 部分 容差 V (常量) 3880 7659 97 096 780060 83500 x 375 933 385 9 00 977 885 556 6 350 85 x 70 880 535 65 09 053 9 73 709 687 55 x3 7 0569 77 78 8 35 3830 7 33 586 708 因变量 (6)可以看到值是x308所以x3回归系数没有通显著检验应除。

除x3作检验得 vb 模型 平方和 方 g 回归 89399 66600 7 007 残差 05930 7 579900  总计 695500 9  预测变量 (常量), x, x。

b 因变量 由表知通检验 继续做回归系数检验 系数 模型标准化系数 标准系数 g B 950% 置信区 相关性 共线性统计量 B 标准 误差 试用版 下限 上限 零阶 偏 部分 容差 V (常量) 596 53058 3003 00 857 97700 x 676 86 79 575 037 38 8970 556 697 76 987 03 x 897 68 676 363 008 33 808 73 808 67 987 03 因变量 我们发现xx显著性提高。

(7)x(0997,885) x(0053,9)  x3(35,3830) (8) (9) 残差统计量 极值 极值 值 标准 偏差 预测值 7578 9555 35000 389506 0 标准 预测值 38 567 000 000 0 预测标准误差 066 09 56 37 0 调整预测值 88355 38067 0835 9839 0 残差 59759 3359 00000 90 0 标准 残差 075 7 000 86 0 化 残差 6 75 3 88 0 已删除残差 97653 50887 86838 330 0 化 已删除残差 383 9 55 658 0 l。

距离 89 5777 700 555 0 k 距离 000 36 86 976 0 居杠杆值 099 6 300 73 0 因变量 所以置信区(75789555) (0)由x3回归系数显著性检验通所以居民非商品支出对货运总量影响不但是回归方程整体对数据拟合较 3 固定二产业增加值考虑三产业增加值影响情况下产业每增加单位G就增加0607单位。

固定产业增加值考虑三产业增加值影响情况下二产业每增加单位G就增加709单位。

四 违背基假设情况 8 加权变化残差图上散步较前残差图没有明显趋势散步较随机因加权二乘估计效较二乘估计。

9  系数 模型标准化系数 标准系数 g B 标准 误差 试用版 (常量) 83  88 065 x 00 000 839 030 000 因变量 由计算得083+000x 残差散图  ()由残差散图可知存异方差性 再用等级相关系数分析 相关系数 x r r X 相关系数 000 38 g(双侧) 0 53 53 相关系数 38 000 g(双侧) 0 53 53 置信(双测) 005 相关性是显著。

00 所以方差与变量相关性是显著。

(3) 模型描述 因变量 变量 x 权重 x 幂值 500 模型 _ 5可以建立优权函数得到  V 平方和 方 g 回归 006 006 9860 000 残差 003 5 000  总计 009 5  系数 标准化系数 标准化系数 g B 标准误 试用版 标准误 (常数) 683 98  96 06 x 00 000 8 08 9930 000 所以0683+000x () 系数 模型标准化系数 标准系数 g B 标准 误差 试用版 (常量) 58 30 8 000 x 00 000 805 9699 000 因变量   0 济变量滞性会给序列带相关性。

如前期消费额对期消费额般会有明显影响有济变量这种滞性表现出种不规则循环运动当济情况处衰退低谷济扩张期随开始这多数济序列上升快些。

济扩张期济数列部有种动力受影响序列直上升到循环顶顶刻济收缩随开始。

因这样序列数据顺序观察值相关现象是恨然。

当线性回归模型随机误差项存序列相关就违背了线性回归方程基假设如仍然直接用普通二乘估计知参数将会产生严重般情况下序列相关性会带下列问题 ()参数估计值不再具有方差线性无偏性。

()方误差可能严重低估误差项方差。

(3)容易导致对值评价高常用检验和检验失效。

如忽视这可能导致得出回归参数统计检验显著但实际上并不显著严重错误结论。

()当存序列相关二乘估计量对抽样波动变得非常敏感。

(5)如不加处理地运用普通二乘法估计模型参数用模型进行预测和进行结构分析将会带较方差甚至错误释。

优检验有着广泛应用对很多模型能简单方便判断该模型有无序列相关性当值左右则无表即可放心认模型不存序列相关性。

缺检验有两不能确定区域,旦值落这两区域就无法判断这只有增样容量或选取其他方法;统计量上、下界表要5,这是因如样再利用残差就很难对相关存性作出比较正确判断;检验不适合随机项具有高阶序列相关检验。

3  () 系数 模型标准化系数 标准系数 g B 标准 误差 试用版 (常量) 35  5930 000 x 76 00 999 0798 000 因变量 35+076x () 模型汇总b 模型 R R 方 调整 R 方 标准 估计误差 rb 999 998 998 097 663 预测变量 (常量), x。

b 因变量 0663 分布表知095 所以,故误差项存正相关。

残差图  随变化逐次变化并不频繁改变说明误差项存正相关。

(3)0506685 计算得  ’ x’ 739 90 765 580 68 069 800 850 779 685 86 95 796 87 88 500 790 803 ’ X’ 89 57 788 76 877 533 893 569 93 595 99 555 98 5677 938 5583 967 5800 990 59 模型汇总b 模型 R R 方 调整 R 方 标准 估计误差 rb 996 993 993 07395 3 预测变量 (常量), xx。

b 因变量  系数 模型标准化系数 标准系数 g B 标准 误差 试用版 (常量) 303 80 68 0 xx 73 00 996 90 000 因变量回归方程 0303+073x’ 即0303+06685+073(—06685) () 模型汇总b 模型 R R 方 调整 R 方 标准 估计误差 rb 978 957 955 079 80 预测变量 (常量), x3。

b 因变量 3 系数 模型标准化系数 标准系数 g B 标准 误差 试用版 (常量) 033 06 73 0 x3 6 008 978 958 000 因变量 3 △0033+06△ 即0033++06() (5)差分法值8消除相关性彻底但是迭代法值007395拟合较。

() 模型汇总b 模型 R R 方 调整 R 方 标准 估计误差 rb 5 93 6 396930 75 预测变量 (常量), x, x。

b 因变量   系数 模型标准化系数 标准系数 g B 标准 误差 试用版 (常量) 5706 397 6 07 x 9098 73309 35 607 0 x 05 9 97 6 09 因变量 回归方程5706+9098x+05x 075l 所以误差项存正相关 残差图  ()050675 模型汇总b 模型 R R 方 调整 R 方 标准 估计误差 rb 688 7 5 576706 76 预测变量 (常量), x, x。

b 因变量  系数 模型标准化系数 标准系数 g B 标准 误差 试用版 (常量) 79668 90337 989 05 x 770 7778 5 3 000 x 3 68 69 83 07 因变量 得方程’79668+77x’+3x’ 所以回归方程 (3) 模型汇总b 模型 R R 方 调整 R 方 标准 估计误差 rb 75 5 90 83790 0 预测变量 (常量), x3, x3。

b 因变量 3 系数 模型标准化系数 标准系数 g B 标准 误差 试用版 (常量) 7698 3975 9 87 x3 0989 3 5 755 000 x3 399 583 7 00 00 因变量 3 得方程△ 所以回归方程  5  异常值原因 异常值消除方法 )数据登记误差存写或录入错误  重新核实数据  )数据测量误差  重新测量误差  3)数据随机误差  删除或重新观测异常值数据  )缺少重要变量  增加必要变量  5)缺少观测数据  增加观测数据适当扩变  量取值围  6)存异方差  采用加权线性回归  7)模型选用错误线性模型不适用  改用非线性回归模型 6 编 学生化残差 删除学生化残差 杠杆值  库克距离   089353  08760 0358  06609。

06767  05977 005  0035 3  0657  039 06079  00060  00033 000396 009935  000000 5  7500  9383 070  0087 6 566 383 0687  360 7 738 039 0977  0500 8 68 0606 0369  0896 9  00935  03790 06366  00500 0 066  079 033883  058  从上表看到绝对值学生化残差5663因而根据学生化残差诊断认数据不存异常值。

绝对值删除学生化残差3833因而根据学生化残差诊断6数据异常值是因变量异常值。

其心化杠杆值等0687 库克距离等360也是心化杠杆平值03006数据杠杆值等0687倍心化杠杆值因而从杠杆值看6数据是变量异常值6数据库克距离等360这样6数据异常值原因是由变量异常与因变量异常两原因共引起。

变量选择与逐步回归 59 退法输出结 系数 模型标准化系数 标准系数 g B 标准 误差 试用版 (常量) 380 57 638 533 农业x 66 68 098 370 00 工业x 38 07 35 587 35 建筑业x3 383 555 5 69 50 人口x 00 05 0 6 875 终消费x5 67 30 370 578 000 受灾面积x6 006 008 05 695 99 (常量) 07975 99759 360 003 农业x 6 30 6 95 000 工业x 303 3 9 3 035 建筑业x3 0 55 63 765 56 终消费x5 658 095 3636 6905 000 受灾面积x6 006 007 07 89 09 3 (常量) 08350 9586 366 00 农业x 6 7 095 93 000 工业x 373 093 535 3998 00 终消费x5 657 09 367 698 000 受灾面积x6 005 007 05 758 60 (常量) 8760 06869 88 000 农业x 6 073 936 000 工业x 353 088 5 399 00 终消费x5 637 089 356 7 000 因变量 财政收入 v 模型 平方和 方 g 回归 3658 6 77 607 000 残差 5879339 3777095  总计 3708 0  回归 3658 5 797 7773 000b 残差 5976785 5 3537857  总计 3708 0 3 回归 368 37 9968 000 残差 550003 6 30506  总计 3708 0  回归 368 3 577 355753 000 残差 5708093 7 3350055  总计 3708 0  预测变量 (常量), 受灾面积x6, 建筑业x3, 人口x, 农业x, 终消费x5, 工业x。

b 预测变量 (常量), 受灾面积x6, 建筑业x3, 农业x, 终消费x5, 工业x。

预测变量 (常量), 受灾面积x6, 农业x, 终消费x5, 工业x。

预测变量 (常量), 农业x, 终消费x5, 工业x。

变量 财政收入 模型汇总 模型 R R 方 调整 R 方 标准 估计误差 更改统计量 R 方更改 更改 g 更改 998 996 99 93750 996 607 6 000 998b 996 995 879306 000 06 875 3 998 996 995 85793 000 585 5 56 998 996 995 8339 000 57 6 60 预测变量 (常量), 受灾面积x6, 建筑业x3, 人口x, 农业x, 终消费x5, 工业x。

b 预测变量 (常量), 受灾面积x6, 建筑业x3, 农业x, 终消费x5, 工业x。

预测变量 (常量), 受灾面积x6, 农业x, 终消费x5, 工业x。

预测变量 (常量), 农业x, 终消费x5, 工业x。

回归方程  逐步回归法输出结 模型汇总 模型 R R 方 调整 R 方 标准 估计误差 更改统计量 R 方更改 更改 g 更改 99 989 988 8568373 989 659 9 000 996b 99 99 777768 003 758 8 05 3 998 996 995 8339 00 598 7 00 预测变量 (常量), 终消费x5。

b 预测变量 (常量), 终消费x5, 农业x。

预测变量 (常量), 终消费x5, 农业x, 工业x。

v 模型 平方和 方 g 回归 358 358 659 000 残差 55068865 9 8659  总计 3708 0  回归 3598 6797 06637 000b 残差 05088003 8 6393778  总计 3708 0 3 回归 368 3 577 355753 000 残差 5708093 7 3350055  总计 3708 0  预测变量 (常量), 终消费x5。

b 预测变量 (常量), 终消费x5, 农业x。

预测变量 (常量), 终消费x5, 农业x, 工业x。

变量 财政收入 系数 模型标准化系数 标准系数 g 相关性 B 标准 误差 试用版 零阶 偏 部分 (常量) 7037 9089 786 000 终消费x5 80 00 99 0736 000 99 99 99 (常量) 09 3690 739 000 终消费x5 3 09 78 637 000 99 83 35 农业x 5 76 69 05 987 536 057 3 (常量) 8760 06869 88 000 终消费x5 637 089 356 7 000 99 866 农业x 6 073 936 000 987 767 077 工业x 353 088 5 399 00 99 696 06 因变量 财政收入 回归方程 50 () 模型汇总 模型 R R 方 调整 R 方 标准 估计误差 908 8 736 658836 000b 000 000 7595 预测变量 (常量), x6, x3, x, x, x5。

b 预测变量 (常量) v 模型 平方和 方 g 回归 8307 5 366097683 936 00 残差 397985 0 397985  总计 7 5  回归 000 0 000 b 残差 7 5 8779  总计 7 5  预测变量 (常量), x6, x3, x, x, x5。

b 预测变量 (常量) 因变量  系数 模型标准化系数 标准系数 g B 标准 误差 试用版 (常量) 5987 5035 365 00 x 86 507 677 90 08 x3 37 8 78 88 08 x 8790 8779 56 367 00 x5 539 7078 050 099 93 x6 86867 963 899 90 06 (常量) 75938 3090 789 000 因变量 回归方程 ()退法输出结 模型汇总 模型 R R 方 调整 R 方 标准 估计误差 908 8 736 658836 907b 8 759 5970776 预测变量 (常量), x6, x3, x, x, x5。

b 预测变量 (常量), x6, x3, x, x。

v 模型 平方和 方 g 回归 8307 5 366097683 936 00 残差 397985 0 397985  总计 7 5  回归 8307 57557669 835 000b 残差 3966 356660  总计 7 5  预测变量 (常量), x6, x3, x, x, x5。

b 预测变量 (常量), x6, x3, x, x。

变量  系数 模型标准化系数 标准系数 g B 标准 误差 试用版 (常量) 5987 5035 365 00 x 86 507 677 90 08 x3 37 8 78 88 08 x 8790 8779 56 367 00 x5 539 7078 050 099 93 x6 86867 963 899 90 06 (常量) 600730 58 675 0 x 5068 360 706 377 003 x3 308 86 760 750 00 x 86 67776 65 93 000 x6 86699 389 96 37 003 因变量  (3)逐步回归 模型汇总 模型 R R 方 调整 R 方 标准 估计误差 98 8 9 098306 697b 85 06 93795038 3 8 657 57 79660909 预测变量 (常量), x3。

b 预测变量 (常量), x3, x5。

预测变量 (常量), x3, x5, x。

v 模型 平方和 方 g 回归 5500090 5500090 607 050 残差 677 9898  总计 7 5  回归 0797 53969755 630 03b 残差 7 3 87975090  总计 7 5 3 回归 67 3 8690506 7673 00 残差 765038 63586035  总计 7 5  预测变量 (常量), x3。

b 预测变量 (常量), x3, x5。

预测变量 (常量), x3, x5, x。

变量  系数 模型标准化系数 标准系数 g B 标准 误差 试用版 (常量) 5659 7 57 000 x3 5 70 98 6 050 (常量) 798 5038 0 830 x3 388 93 050 39 00 x5 35 8663 737 5 09 3 (常量) 807 8659 757 6 x3 30 78 33 398 00 x5 3879 90 0 378 003 x 536 6963 587 5 030 因变量  ()两种方法得到模型是不回退法剔除了x5保留了x6, x3, x, x作终模型

而逐步回归法只引入了x3。

说明了方法对变量重要性认可不这与变量相关性有关。

相比下退法首先做全模型回归变量都有机会展示己作用所得结更有说力 六 多重共线性情形及其处理 66 由下表我们可以看出 系数 模型标准化系数 标准系数 g 共线性统计量 B 标准 误差 试用版 容差 V (常量) 638575 736958 33 035  x 593 79 00 7 05 003 38536 x 59 99 60 753 06 00 89770 x3 756 9 95 830 0 00 795 x 080 03 8 590 0 06 5706 x5 006 006 038 98 37 3 305 x6 00 0 07 750 66 57 7 因变量 方差扩因子V89770故首先应剔除变量x将剩下变量继续进行回归得下表 系数 模型标准化系数 标准系数 g 共线性统计量 B 标准 误差 试用版 容差 V (常量) 677 85886 937 36  x 053 37 09 88 006 6060 x3 33 533 937 690 07 009 78 x 036 03 7 37 7 087 509 x5 006 008 0 8 3 303 x6 00 05 006 57 878 67 55 因变量 有方差扩因子V6060且x系数故x也应被剔除继续将剩下变量进行回归得 系数 模型标准化系数 标准系数 g 共线性统计量 B 标准 误差 试用版 容差 V (常量) 9 888503 7 58  x3 38 09 86 068 000 99 503 x 03 09 07 586 3 53 x5 006 007 0 8 3 30 x6 003 05 008 09 837 67 89 因变量 所有方差扩因子都0故回归方程如下 9+38x3+003x+0006x5+0003x6  七 岭回归  岭回归估计是什么情况下提出? 答当释变量出现严重多重共线性用普通二乘法估计模型参数往往参数估计方差太使普通二乘法效变得很不理想了这问题统计学从模型和数据角考虑采用回归诊断和变量选择克多重共线性影响这岭回归作种新回归方法被提出了。

回归估计定义及其统计思想是什么? 答种改进二乘估计方法叫做岭估计。

变量存多重共线性∣X'X∣≈0我们设想给X'X加上正常数矩阵k(k0),那么X'X+k 接近奇异程得多考虑到变量量纲问题先对数据作标准化了计算方便标准化设计阵仍然用X表示定义 称岭回归估计其k称岭参数。

3 选择岭参数k有哪几种主要方法? 答选择岭参数几种常用方法有岭迹法方差扩因子法3由残差平方和确定k值。

用岭回归方法选择变量应遵从哪些基原则? 答用岭回归方法选择变量应遵从原则有  岭回归计算我们假定设计矩阵X已心化和标准化了这样可以直接比较标准化回归系数我们可以剔除标准化回归系数比较稳定且绝对值很变量

当k值较标准化回归系数绝对值并不是很但是不稳定随着k增加迅速趋零。

像这样岭回归系数不稳定,震动趋零变量我们也可以予以删除。

3 标准化回归系数很不稳定变量如有若干岭回归系数不稳定究竟几哪几这并无般原则可循这根据某变量重新进行岭回归分析效确定。

5 对5习题9数据逐步回归结只保留了3变量xxx5用对这3变量做岭回归分析? 答  6 对习题3 问题分别用普通二乘和岭回归建立G对二产业增加值x和三产业增加值x3二元线性回归释所得到回归系数? 答 RQR B R VL K K RQ  x x3 ______ ______ ________ ________ 00000 9993  775  593 05000 99803  596  637 0000 9969  89067  6369 5000 99367  73860  5669 0000 9905  66  85 5000 9865  976  39303 30000 987  399  3076 35000 9768  933  8 0000 97067  998  300 5000 9670  0  05 50000 958  063  39735 55000 9589  39536  38973 60000 95  38678  38376 65000 938  3793  3757 70000 936  3700  3689 75000 9398  365330  36799 80000 967  35877  35505 85000 90939  3535  397 90000 900  360  3355 95000 896  307  33780 0000 8870  3355  3389  系数 模型标准化系数 标准系数 g B 标准 误差 试用版 (常量) 35859 679065 60 000 二产业增加值 38 5 775 95 000 三产业增加值 679 6 78 07 因变量 G  RQR B R VL K K RQ  x x3 ______ ______ ________ ________ 00000 9993  775  593 0000 99888  5878  0809 0000 99866  58878  659 03000 9987  5305  5593 0000 9987  500  6069 05000 99803  596  637 06000 99776  50676  6508 07000 9975  50080  6575 08000 9970  96653  65 09000 9967  969  6593 0000 9969  89067  6369 R RX rr  Rg Rgr k 00  l R  99939 Rqr 998878 Rq  99869   30955  V bl。

Rgr 000 8+00 90+009 Rl 000 03035 69336  vl  g  5333600  000000 Vrbl q B  (B) B  B(B) x 090606  0609  5878  8066 x3 6660  097506  0809  58035   3980786 738358  000000 539099  RX  结合表及图形可知用普通二乘法得到回归方程 显然回归系数0679明显不合理。

从岭参数图看岭参数k00到0岭参数已基稳定再参照复定系数,当k00复定系数099869,仍然很固用k00做回归得到标准化回归方程。

7 型商业银行有多分行近年该银行贷款额平稳增长但不良贷款额也有较比例提高弄清楚不良贷款形成原因希望利用银行业有关数据做些定量分析以便出控制不良贷款办法表75是该银行所属5分行00年有关业数据。

() 计算与其余四变量简单相关系数

() 建立不良贷款对变量线性回归方程所得回归系数是否合理? (3) 分析回归模型共线性。

() 采用退法和逐步回归法选择变量所得回归方程回归系数是否合理是否还存共线性? (5) 建立不良贷款对变量回归

(6) 对步剔除变量回归方程再做岭回归

(7) 某研究人员希望做对各项贷款余额年累计应收贷款贷款项目数这三变量回归你认这种做是否可行如可行应该如何做? 相关性  不良贷款 各项贷款余额x 年累计应收到款x 贷款项目数x3 年固定产投额x r 相关性 不良贷款 000 8 73 700 59 各项贷款余额x 8 000 679 88 780 年累计应收到款x 73 679 000 586 7 贷款项目数x3 700 88 586 000 77 年固定产投额x 59 780 7 77 000 g (单侧) 不良贷款 000 000 000 00 各项贷款余额x 000 000 000 000 年累计应收到款x 000 000 00 009 贷款项目数x3 000 000 00 000 年固定产投额x 00 000 009 000   不良贷款 5 5 5 5 5 各项贷款余额x 5 5 5 5 5 年累计应收到款x 5 5 5 5 5 贷款项目数x3 5 5 5 5 5 年固定产投额x 5 5 5 5 5  系数 模型标准化系数 标准系数 g 共线性统计量 B 标准 误差 试用版 容差 V (常量) 0 78 306 06  各项贷款余额x 00 00 89 3837 00 88 533 年累计应收到款x 8 079 60 879 075 59 890 贷款项目数x3 05 083 03 75 863 6 3835 年固定产投额x 09 05 35 937 067 360 78 因变量 不良贷款  共线性诊断 模型 维数 特征值 条件引 方差比例 (常量) 各项贷款余额x 年累计应收到款x 贷款项目数x3 年固定产投额x  538 000 0 00 0 00 00  03 733 68 03 0 0 09 3 57 5378 6 00 66 0 3  066 887 00 09 0 36 7 5 036 5 5 87 63 05  因变量 不良贷款  退法得 系数 模型标准化系数 标准系数 g B 标准 误差 试用版 (常量) 0 78 306 06 各项贷款余额x 00 00 89 3837 00 年累计应收到款x 8 079 60 879 075 贷款项目数x3 05 083 03 75 863 年固定产投额x 09 05 35 937 067 (常量) 97 7 366 86 各项贷款余额x 0 009 9 8 000 年累计应收到款x 9 077 6 938 066 年固定产投额x 09 0 37 006 058 3 (常量) 3 697 636 53 各项贷款余额x 050 007 0 673 000 年固定产投额x 03 05 355 33 0 因变量 不良贷款 逐步回归系数 模型标准化系数 标准系数 g B 标准 误差 试用版 (常量) 830 73 7 63 各项贷款余额x 038 005 8 753 000 (常量) 3 697 636 53 各项贷款余额x 050 007 0 673 000 年固定产投额x 03 05 355 33 0 因变量 不良贷款  RQR B R VL K K RQ  x x x3 x ______ ______ ________ ________ ________ ________ 00000 79760  8933  5987  037 39 05000 79088  73636  866  0966 33765 0000 78005  609886  9590  6776 7056 5000 7690  593  97596  3378 3389 0000 75958  9935  95607  5393 09933 5000 7506  5603  970  590 070 30000 737  53  869  695 05396 35000 737  03  869  6560 0378 0000 7755  38077  76  660 0379 5000 7077  36000  706  6699 079 50000 733  3909  65  6700 0097 55000 7086  336  59906  6669  00588 60000 703  3683  5757  663  03 65000 6969  3330  9777  6533  09387 70000 69093  30959  973  6397  0860 75000 6855  96  035  6336  0965 80000 680  8857  3589  607  033870 85000 67508  833  3605  6000  037587 90000 67003  76  780  5973  0087 95000 66508  68353  350  588  03787 0000 660  69  9687  577  06373  R RX rr  Rg Rgr k 0   l R 80353780 Rqr  6377588 Rq 638787   999955  V bl。

Rgr 000  075  00638 Rl 000  375  506  vl  g  9879067  00007 Vrbl q B  (B) B  B(B) x 05805860 003933689 576395  65608798 x 005336 007867533 0503658 5759538  3570876 7566536 000000000 85356  RX 对x x x3 做岭回归 R RX rr  Rg Rgr k 0   l R 8503738 Rqr  7335635 Rq 683583583   03068037  V bl。

Rgr 3000  6089 75363 Rl 000 8656    vl  g  88338  0000056 Vrbl q B  (B) B  B(B) x 06739073 00335956 376736  9838685 x 56806656 0755003 753878  397790 x3 067093 03703990 59005  0507673   898677 75566 000000000 0869566  RX   由图及表可知() 与x x x3 x 相关系数分别08,073,0700,059 () 对其余四变量线性回归方程  由系数说明存共线性固所得回归系数是不合理。

(3) 由条件数50说明存较强共线性。

() 由上表可知由退法和逐步回归法所得到线性回归方程 由系数说明仍然存共线性。

(5) 对其余四变量回归如上表所示。

(6) 选取岭参数k0,得岭回归方程回归系数都能有合理释。

(7) 用对x x x3 做岭回归选取岭参数k0岭回归方程回归系数都能有合理释由 B (B) 得近似值可知x x x3 都是显著所以对x x x3岭回归是可行。

欢迎我R档可编辑修改也可以直接打印。

希望提出保贵见或建议。

和学习是种非常习惯坚持下让我们共进步。

欢迎我R档可编辑修改也可以直接打印。

希望提出保贵见或建议。

和学习是种非常习惯坚持下让我们共进步。

3 次访问