回归分析是统计分析的一项重要内容,可以帮助我们了解变量之间的数量关系。
线性回归分析
1、线性回归的假设理论
(1)正态性假设:即所研究的变量均服从正态分布;
(2)等方差假设:即各变量总体的方差是相等的;
(3)独立性假设, 即各变量之间是相互独立的;
(4)残差项无自相关性,即误差项之间互不相关,Cov(ei,ej=0
2、线性回归模型的检验项目
(1)回归系数的检验(t检验)
(2)回归方程的检验(F检验)
(3)拟合程度判定(可决系数R2)
(4)D.W检验(残差项是否自相关)
(5)共线性检验(多元线性回归)
(6)残差图示分析(判断异方差性和残差序列自相关)
SAS过程
SAS提供的回归过程比较多,包含REG(回归)过程、rsreg(二次响应面回归)过程、orthoreg(病态数据回归)过程、nlin(非线性回归)过程、transreg(变换回归)过程、calis(线性机构方程和路径分析)过程、glm(一般线性回归)过程、genmod(广义线性回归)过程等
reg的一般格式:
PROC REG DATA=数据集 选项;
VAR 变量列表;
MODEL 因变量=自变量列表/selection=回归模型;
PRINT 输出结果;
PLOT 诊断图形;
RUN;
使用不同的线性回归模型
selection=forward为顺向选择法,将全模型中的自变项逐一加入至最佳模型
selction=backward为反向排除法,将全模型中的自变项逐一去除至最佳模型
selection=stepwise为逐步排除法,为前二者之合并
例如:
PROC REG DATA=SASUSER.SCORE;
VAR MATH ENGLISH CHINESE;
MODEL MATH=ENGLISH CHINESE;
RUN;
解释:回归结果为第三部分,可以看到P都大于0.05,则English、Chinese的作用不显著。
作者:郑来轶,如若转载,转载请注明出处:https://www.zhenglaiyi.com/988.html