实验七、相关与线性回归分析
一、实验性质
上机实验
二、实验目的与要求
使学生熟练掌握应用SPSS软件绘制散点图,并利用散点图和相关性检验对变量之间的关系进行分析,并能建立简单的线性回归模型。
三、实验内容
1.散点图的绘制
散点图是相关分析过程中极为常用且非常直观的分析方式。它将数据以点的形式画在直角平面上。通过散点图能够直观地发现变量间的统计关系以及它们的强弱程度和数据对的可能走向。
绘制直方图的具体步骤如下:
1、选择Graphs ==> Scatter;
2、选择散点图的类型;
3、根据所选择的散点图类型,单击Define按钮对散点图作具体定义;
不同类型的散点图具体的定义选项略有差别。
简单散点图是表示一对变量间统计关系的散点图。
指定某个变量为散点图的纵轴变量,选入Y Axis框中;
指定某个变量为散点图的横轴变量,选入X Axis框中;
可把作为分组的变量指定到Set Markers by框中,表示按该变量的不同取值将样本数据
分成若干组,并在一张图上分别以不同颜色绘制散点图。(该项可省略);
把标记变量指定到Lable Cases by框中,表示将标记变量的各变量值标记在散点图相应
点的旁边。(该项可省略);
重叠散点图是表示多对变量间统计关系的散点图。
两个变量为一对,指定绘制哪些变量间的散点图。其中前一个作为图的纵轴变量,后一
个变量作为图的横轴变量,并可通过单击Swap Pair按钮进行横纵轴变量的调换;
把标记变量指定到Lable Cases by框中。含义同简单散点图;
矩阵散点图以方形矩阵的形式在多个坐标轴上分别显示多对变量间的统计关系。
把参与绘图的若干个变量指定到Matrix Variables框中。选择变量的先后顺序决定了矩
阵对角线上变量的排列顺序
把分组变量指定到Set Markers by框中。同简单散点图;
把标记变量指定到Lable Cases by框中。同简单散点图。
矩阵散点图的关键是弄清各矩阵单元中的横纵变量。
以3×3的矩阵散点图为例,变量分别为x1,x2,x3
矩阵散点图坐标变量示意图
括号中前一个变量作为横轴变量,后一个变量作为纵轴变量。
2、相关性检验
两大内容:
第一、计算样本相关系数;
第二、对样本来自的两总体是否存在显著的线性关系进行推断。
相关系数r的取值在-1~+1
之间;
r>0表示两变量存在正的线性相关关系;
r<0表示两变量存在负的线性相关关系。
r=1表示两变量存在完全正相关;
r=-1表示两变量存在完全负相关;
r=0表示两变量不存在线性相关关系;
︱r ︱ >0.8表示两变量之间具有较强的线性关系;
︱r ︱ <0.3表示两变量之间的线性相关关系较弱。
零假设H0:两总体不存在线性相关关系,即 r=0;
计算相关系数的基本操作:
1、选择:分析Analyze==>相关分析Correlate ==>两变量Bivariate;
2、将参加计算相关系数的变量选择到 Variable 框;
3、在相关系数(Correlation Coefficents)框中选择计算哪种相关系数。
4、在Test of Significance框中选择输出相关系数检验的双尾(Two-Tailed)概率p值
或单尾(One-Tailed)概率p值。
5、选中Flag significance correlations选项表示分析结果中除显示统计检验的概率p值以
外,还输出星号标记,以标明变量间的相关性是否显著;不选中则不输出星号标记。 6、在Options按钮中的Statistics选项中,选中Cross-product deviations and covariances
表示输出各变量的离差平方和、样本方差、两变量的叉积离差和协方差。
3、线性回归分析
线性回归用来检测一个非独立变量(因变量)与一组独立变量(自变量)之间的关系。 回归分析一般步骤:
确定回归方程中的解释变量( x ) 和被解释变量( y );
确定回归模型;
建立回归方程;
对回归方程进行各种检验;
利用回归方程进行预测。
应重点关注上述过程中第一步和最后一步,至于中间各个步骤,SPSS会自动完成,并给出最合理的模型。
一元线性回归分析线性回归模型 多元线性回归分析
一元线性回归模型基本问题
一般形式:y=b0+b1x+ε
多元线性回归模型基本问题
一般形式:y=b0+b1x1+b2x2+...bpxp+ ε
各种统计检验包括;回归方程的拟合优度检验、回归方程的显著性检验、回归系数的显著性检验、残差分析
回归方程的拟合优度检验
检验样本数据点聚集在回归线周围的密集程度,从而评价回归方程对样本数据的代表程度。
一元线性回归方程——使用R2统计量(判定系数或决定系数)
R2取值在0到1之间;
R2越接近于1,说明回归方程对样本数据点的拟合优度越高;
反之, R2越接近于0,说明回归方程对样本数据点的拟合优度越低。
多元线性回归方程——使用调整后的R2统计量(调整的判定系数或调整的决定系数) 回归方程的显著性检验
检验被解释变量与所有解释变量之间的线性关系是否显著,用线性模型来描述它们之间的关系是否恰当。 …… 此处隐藏:3249字,全部文档内容请下载后查看。喜欢就下载吧 ……