项目描述:
前期是将91份研究生调查问卷的信息录入到Excel表格中,每个问卷有35个选择题,在Excel表格里整理成91行35列的形式。然后将表格导入到SAS软件进行数据预处理,将选项答案的ABCD转化成1234,将缺失值找出,并重新赋值。然后通过单因素方差分析将性别与上网时间、遵守道德、是否有瘾;专业类别与解决学习问题;上网玩游戏时间比例与居住地;游戏类型与网络言论等等。将这些关系依次计算频率、排序、单因素方差分析,观察P值是否大于0.05来判断两者之间是否有显著性差异,有显著性差异就说明这两个因素之间没有潜在的联系,没有显著性差异就说明这两个因素之间存在联系。接着通过逐步回归的方法找出下面这5个相关性将强的变量:1、一个分类型输出变量study(1代表积极学习型上网,0代表不积极学习型上网)2、sex(性别,分类型,0表示男性,1表示女性)3、residence(居住地,分类型,0表示农村,1表示城镇)4、income(家庭收入,数值型)5、nage(网龄,数值型)构建一个多元logistic回归模型。计算输出的Intercept和residence的比值来判断学生网上遵守道德的标准的概率的值。具体说明如下:回归方程的形式是log(odds)=log(p/(1-p))=0.1110+1.7137*Nsex-1.5000*residenc。知道odds=p/(1-p),有p=odds/(1+