目录
1. 准备实验数据
这里先使用一个入门级数据集,有条件可以使用 ModelArts 的官方数据集。
我们用 UCI 大学公开的机器学习数据来跑线性回归。
数据的下载地址在这里:http://archive.ics.uci.edu/ml/machine-learning-databases/00294/ 下载后的数据可以发现是一个压缩文件,解压后有一个 xlsx 文件,用 excel 打开,另存为 ccpp.csv,之后用这个 csv 格式的文件来运行线性回归。
一定要先打开原文件再另存为 csv 格式!直接改扩展名会导致字符集不一致!
这是一个循环发电场数据,共有9568个样本数据,每个数据有5列:AT(温度)、V(压力)、AP(湿度)、RH(压强)、PE(输出电力)。我们不用纠结于每项的具体意义。
我们的问题是得到一个线性的关系,对应 PE 是样本输出,而 AT、V、AP、RH 这四个是样本特征,机器学习的目的是得到一个线性回归模型,即:
而需要学习的就是 这5个参数。