1、波士顿房价预测
波士顿房价数据集包括506个样本,每个样本包括12个特征变量和该地区的平均房价。房价(单价)显然和多个特征变量相关,不是单变量线性回归(一元线性回归)问题,选择多个特征变量来建立线性方程,这就是多变量线性回归(多元线性回归)问题。
2、机器学习步骤
(1)准备数据
(2)构建模型
(3)训练模型
(4)进行预测
3、数据读取
(1)数据集解读
CRIM:城镇人均犯罪率
ZN:住宅用地超过25000sq.ft.的比例
INDUS:城镇非零售商用土地的比例
CHAS:边界是河流为1,否则为0
NOX:一氧化氮浓度
RM:住宅平均房间数
AGE:1940年之前建成的自用房屋比例
DIS:到波士顿5个中心区域的加权距离
RAD:辐射性公路的靠近指数
TAX:每10000美元的全值财产税率
PTRATIO:城镇师生比例
LSTAT:人口中地位低下者的比例
MEDV:自住房的平均房价,单位:千美元
(2)多元线性回归模型
Y = x1w1+x2w2+x3w3+...+x12w12 + b
结果可以由不同特征的输入值和对应的权重相乘求和,加上偏置项计算求解