《 多元統計分析分析 》實驗報告
2012 年
月
日 學院 經貿學院 姓名
學號
實驗 名稱
實驗成績
一、實驗目的 (一)利用 SPSS 對主成分回歸進行計算機實現. (二)要求熟練軟件操作步驟,重點 掌握對軟件處理結果的解釋. 二、 實驗內容
以教材例題 7.2 為實驗對象,應用軟件對例題進行操作練習,以掌握多元統計分析方法的應用 三、實驗步驟(以文字列出軟件操作過程并附上操作截圖)
1、數據文件的輸入或建立:( 文件名以學號或姓名命名)
將表 7.2 數據輸入 spss:點擊“文件”下“新建”——“數據”見圖 1:
圖 1
點擊左下角“變量視圖”首先定義變量名稱及類型:見圖 2:
圖 2:
然后點擊“數據視圖”進行數據輸入(圖 3):
圖 3
完成數據輸入 2、具體操作分析過程 :
(1)首先做因變量 Y 與自變量 X1-X3 的普通線性回歸:
在變量視圖下點擊“分析”菜單,選擇“回歸”-“線性”(圖 4):
圖 4
將因變量 Y 調入“因變量”欄,將 x1-x3 調入“自變量”欄(圖 5):
然后選擇相關要輸出的結果:①點擊右上角“統計量(s)”:“回歸系數”下選擇“估計”;“殘差”下選擇“D.W”;在右上角選擇輸出“模型擬合度”、“部分相關和偏相關”“共線性診斷”(后兩項是做多重共線性檢驗)。選完后點擊“繼續”(見圖 6)②如果需要對因變量與殘差進行圖形分析則需要在“繪制”下選擇相關項目(圖 7),一般不需要則繼續③如果需要將相關結果如因變量預測值、殘差等保存則點擊“保存”(圖 8),選擇要保存的項目④如果是逐步回歸法或者設置不帶常數項的回歸模型則點擊“選項”(圖 9)
其他選項按軟件默認。最后點擊“確定”,運行線性回歸,輸出相關結果(見表 1-3)
圖 5 圖 圖 6 6 圖 7
圖 8 圖 9 回歸分析輸出結果:
表1 模型匯總b b
模型 R R 方 調整 R 方 標準 估計的誤差 Durbin-Watson 1 .996a
.992 .988 .48887 2.740 a. 預測變量: (常量), x3, x2, x1。
b. 因變量: y
表2 Anovab b
模型 平方和 df 均方 F Sig. 1 回歸 204.776 3 68.259 285.610 .000a
殘差 1.673 7 .239
總計 206.449 10
a. 預測變量: (常量), x3, x2, x1。
b. 因變量: y
表3 系數a a
模型 非標準化系數 標準系數 t Sig. 相關性 共線性統計量 B 標準 誤差 試用版 零階 偏 部分 容差 VIF 1 (常量) -10.128 1.212
-8.355 .000
x1 -.051 .070 -.339 -.731 .488 .965 -.266 -.025 .005 185.997 x2 .587 .095 .213 6.203 .000 .251 .920 .211 .981 1.019 x3 .287 .102 1.303 2.807 .026 .972 .728 .095 .005 186.110 a. 因變量: y 由表可知,回歸模型擬合優度達到99.2%,方差分析也顯示線性回歸方程整體顯著(F=285.61,Sig.=0.000)但是回歸系數估計結果中,x1的系數為-0.051與一般經濟理論矛盾且不顯著(t檢驗值-0.731,檢驗的p值0.488),經多重共線性診斷(x1與x3的VIF值高達180以上)表明自變量存在共線性。運用主成分分析做多重共線性處理:
(2)自變量x1-x3的主成分分析:
由于spss沒有獨立的主成分分析模塊,需要在因子分析里完成,因此需要特別注意:
在數據窗口下選擇“分析”—“降維”—“因子分析”(見圖10); 在彈出的窗口中將x1-x3調入“變量”(見圖11); 然后①點擊“描述”,選擇要輸出的統計量(見圖12):選中“統計量”下的兩個項目(輸出變量描述統計和初始分析結果);在“相關矩陣”一般要選擇輸出“系數”、“顯著性水平”、“KMO”(做主成分分析和因子分析的適用性檢驗,也就是檢驗變量之間的相關系數是否足夠大可以做因子分析)選完后點擊“繼續”進行下一步;②點擊“抽取”(見圖13):在“方法”下默認“主成分”;“分析”下,默認“相關性矩陣”(含義是要對變量做標準化處理,然后基于標準化后的協差陣也就是相關陣進行分解做因子分析或主成分分析),如果不需要對變量做標準化處理就選“協方差矩陣”;“輸出”中的兩項都選,要求輸出沒有旋轉的因子解(主成分分析必選項)和碎石圖(用圖形決定提取的主成分或因子的個數);“抽取“下,默認的是基于特征值(大于
1表示提取的因子或主成分至少代表1個單位標準差的變量信息,因為標準化后的變量方差為1,因子或者主成分作為提取的綜合變量應該至少代表1個變量的信息),也可以自選提取的因子個數(即第二項),本例中做主成分回歸,選擇提取全部可能的3個主成分,所以自選個數填3。選完后點擊 “繼續”進行下一步;③點擊“旋轉”(圖14),按默認的“方法”下不旋轉(注意,主成分分析不能旋轉!)其他不用選,點擊“繼續”進行下一步;④點擊“得分”,計算不旋轉的初始因子得分(圖15),選中“保存為變量”,“方法”下按默認,其他不修改,點擊“繼續”進行下一步。⑤“選項”下可以不選按默認(選項里主要針對缺失值和系數顯示格式,不影響分析結果)
最后點擊“確定”,運行因子分析。
圖10 圖11
圖 12 圖 圖 13
圖 圖 14
圖 圖 15
由運行結果計算主成分:
表4 4 、 描述統計量
均值 標準差 分析 N x1 194.5909 29.99952 11 x2 3.3000 1.64924 11 x3 139.7364 20.63440 11
表5 5 、 相關矩陣
x1 x2 x3 相關 x1 1.000 .026 .997 x2 .026 1.000 .036 x3 .997 .036 1.000 Sig.(單側)
x1
.470 .000 x2 .470
.459 x3 .000 .459
表6 6 、 KMO 和
Bartlett 的檢驗 取樣足夠度的 Kaiser-Meyer-Olkin 度量。
.492 Bartlett 的球形度檢驗 近似卡方 42.687 df 3 Sig. .000
表7 7 、 解釋的總方差 成份 初始特征值 提取平方和載入 合計 方差的 % 累積 % 合計 方差的 % 累積 % 1 1.999 66.638 66.638 1.999 66.638 66.638 2 .998 33.272 99.910 .998 33.272 99.910 3 .003 .090 100.000 .003 .090 100.000 提取方法:主成份分析。
表8 8 、 成份矩陣a a
成份 1 2 3 x1 .999 -.036 .037 x2 .062 .998 .000 x3 .999 -.026 -.037 提取方法 :主成份。
a. 已提取了 3 個成份。
由表5、6可知適合做主成分或因子分析(KMO檢驗通過),表7知前兩個主成分(初始因子)貢獻率已達99.91%,提取前兩個主成分用于分析。由表8(初始因子載荷陣)和表7可計算前兩個特征向量,用表8前兩列分別除以前兩個特征值的平方根得前兩個主成分表達式:
F1=0.7066X1*+0.0439X2*+0.7066X3*(式1)
F2=-0.0360X1*+0.9990X2*-0.0260X3*(式2)
其中X1*-X3*表示為標準化變量(這是因為在進行主成分分析時是以標準化變量進行分析的,是從相關陣出發分析的,見圖13的選項)。
由于主成分互不相關,可以用提取的主成分代替自變量進行回歸分析,因此需要計算主成分得分來代替自變量X1-X3。主成分的計算:依據式1和2中兩個主成分的表達式,對各自變量標準化后帶入就可以計算出每個樣品的主成分得分。但是在spss中,由因子分析提取時是用主成分法提取的,根據初始因子與主成分的關系,未旋轉的初始因子等于主成分除以特征根的平方根,因此主成分得分等于因子得分乘以特征根的平方根,因此可以由因子得分計算主成分得分。前面在因子分析選項中保存了因子得分(見圖15),因此計算兩個主成分得分:點擊“轉換”—“計算變量”(圖16):在彈出的窗口分別定義主成分F1=第一因子得分*第一特征根的平方根(圖17)和F2=第二因子得分*第二特征根的平方根。
(3)主成分回歸過程:
要做主成分回歸,需要用標準化的因變量(因為自變量經過標準化處理做主成分分析,因變量需要對應做標準化)與主成分做回歸,對因變量Y做標準化處理,點擊“分析”—“描述統計”—“描述”(見圖18),在彈出窗口中將Y調入變量,并選中“將標準化得分另存為變量”(圖19)后確定完成Y的標準化。
點擊“分析”---“回歸”---“線性”(圖20)在彈出窗口(圖21)中將Zscore(y)調入因變量,F1和F2調入自變量,其他選項同前面圖6-9,然后點擊“確定”運行主成分回歸,相關輸出結果見表9
圖16
圖17
圖18 圖 圖 19
圖 圖 20
圖 圖 21
主成分回歸結果:
表9 9 、 模型匯總 模型 R R 方 調整 R 方 標準 估計的誤差 1 .994a
.988 .985 .12104901 a. 預測變量: (常量), F1, F2。
表 10 、 Anovab b
模型 平方和 df 均方 F Sig. 1 回歸 9.883 2 4.941 337.230 .000a
殘差 .117 8 .015
總計 10.000 10
a. 預測變量: (常量), F1, F2。
b. 因變量: Zscore(y)
表 11 、 系數a a
模型 非標準化系數 標準系數 t Sig. 共線性統計量 B 標準 誤差 試用版 容差 VIF 1 (常量) -3.043E-16 .036
.000 1.000
F2 .191 .038 .191 4.993 .001 1.000 1.000 F1 .690 .027 .976 25.486 .000 1.000 1.000 a. 因變量: Zscore(y)
由表9-11可知,標準化Y對兩個主成分的線性回歸通過顯著性檢驗,也沒有多重共線性,回歸系數合理,即Y*=0.690F1+0.191F2,將前面F1、F2的表達式(式1和二)帶入可得標準化Y關于標準化自變量的回歸方程:
Y*=0.4806X1*+0.2211X2*+0.4826X3*,還原為原始變量:
1 2 33 3 1 1 2 20.4806* 0.2211* 0.4826*y X X XX X X X X X y yS S S S? ? ? ?? ? ?
整理得最終回歸結果:
Y=-9.13+0.072X1+0.60X2+0.1062X3
推薦訪問: 成分 回歸 實驗上一篇:黨員先進個人事跡(5則)
下一篇:發展林地經濟考察調研報告
在偉大祖國73華誕之際,我參加了單位組織的“光影鑄魂”主題黨日活動,集中觀看了抗美援朝題材影片《長津湖》,再一次重溫這段悲壯歷史,再一次深刻感悟偉大抗美援朝精神。1950年10月,新中國剛剛成立一年,
根據省局黨組《關于舉辦習近平談治國理政(第四卷)讀書班的通知》要求,我中心通過專題學習、專題研討以及交流分享等形式,系統的對《習近平談治國理政》(第四卷)進行了深入的學習與交流,下面我就來談一談我個人
《習近平談治國理政》(第四卷)是在百年變局和世紀疫情相互疊加的大背景下,對以習近平同志為核心的黨中央治國理政重大戰略部署、重大理論創造、重大思想引領的系統呈現。它生動記錄了新一代黨中央領導集體統籌兩個
《真抓實干做好新發展階段“三農工作”》是《習近平談治國理政》第四卷中的文章,這是習近平總書記在2020年12月28日中央農村工作會議上的集體學習時的講話。文章指出,我常講,領導干部要胸懷黨和國家工作大
在《習近平談治國理政》第四卷中,習近平總書記強調,江山就是人民,人民就是江山,打江山、守江山,守的是人民的心。從嘉興南湖中駛出的小小紅船,到世界上最大的執政黨,在中國共產黨的字典里,“人民”一詞從來都
黨的十八大以來,習近平總書記以馬克思主義戰略家的博大胸襟和深謀遠慮,在治國理政和推動全球治理中牢固樹立戰略意識,在不同場合多次圍繞戰略策略的重要性,戰略和策略的關系,提高戰略思維、堅定戰略自信、強化戰
《習近平談治國理政》第四卷集中展示了以習近平同志為核心的黨中央在百年變局和世紀疫情相互疊加背景下,如何更好地堅持和發展中國特色社會主義而進行的生動實踐與理論探索;對于新時代堅持和發展什么樣的中國特色社
在黨組織的關懷下,我有幸參加了區委組織部組織的入黨積極分子培訓班。為期一周的學習,學習形式多樣,課程內容豐富,各位專家的講解細致精彩,對于我加深對黨的創新理論的認識、對黨的歷史的深入了解、對中共黨員的
《習近平談治國理政》第四卷《共建網上美好精神家園》一文中指出:網絡玩命是新形勢下社會文明的重要內容,是建設網絡強國的重要領域。截至2021年12月,我國網民規模達10 32億,較2020年12月增長4
剛剛召開的中國共產黨第十九屆中央委員會第七次全體會議上討論并通過了黨的十九屆中央委員會向中國共產黨第二十次全國代表大會的報告、黨的十九屆中央紀律檢查委員會向中國共產黨第二十次全國代表大會的工作報告和《