上机任务一:
空气质量指数 (air quality index,AQI是定量描述空气质量状况的指数。为了更好地了解和人们身体健康息息相关的天气状况,本书模拟生成500条某地区天气数据,一行样本对应一天的天气。因变量为空气质量指数:数值型变量。解释变量包括:星期:分类变量,包括星期一、星期二等;最低气温:文本型变量,比如-5C;最高气温:文本型变量,比如5°C;天气:分类变量,包括晴天、多云一晴、阴一多云、阴小雨等,其中“”表示转,比如“晴一多云”表示晴转多云;风向:分类变量,包括东风、西风、南风、北风、东南风、东北风、西南风、西北风等;风力:数值型变量,1~5级。
作业要求:以AQI为因变量,其他指标为解释变量,建立线性回归模型,分析影响空气质量指数的因素。
具体步骤要求:
1、读入数据,并对每一列赋予新的变量名
2、做适当的数据处理:
比如最高(低)温度是文本型变量,使用gsub()函数和as.numeric()函数将其转化为数值型变量;风力为数值型变量,使用as.factor()函数将其转化为分类型变量等等
3、做适当的描述性分析
分别对数值型变量和分类型变量做适当的单变量描述性分析,检查数据质量
分别对各个解释变量与因变量做适当的双变量描述性分析:初步判断两者之间的关系
4、以AQI为因变量,其他指标为解释变量,建立线性回归模型,并分析结果
5、模型诊断
6、模型选择及分析
实验结果