实验
算法
python
线性回归实验
【实验名称】
Python
线性回归实验
【实验要求】
掌握
Python
线性回归模型应用过程,根据模型要求进行数据预处理,建模,评价与应用;
【背景描述】
线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一
种统计分析方法,运用十分广泛。其表达形式为
y = w'x+e
,
e
为误差服从均值为
0
的正态分布。
【知识准备】
了解线性回归模型的使用场景,
数据标准。
了解
Python/Spark
数据处理一般方法。
了解
spark
模型调用,训练以及应用方法
【实验设备】
Windows
或
Linux
操作系统的计算机。部署
Python
,本实验提供
centos6.8
环境。
【实验说明】
采用成绩数据集作为算法数据,对模型进行训练和回归。
【实验环境】
Pyrhon3.X
,实验在命令行
python
中进行,或者把代码写在
py
脚本,由于本次为实验,以学
习模型为主,所以在命令行中逐步执行代码,以便更加清晰地了解整个建模流程。
【实验步骤】
第一步:启动
python
: