本文通过预测汽车一加仑油能跑多少公里来熟悉python中线性回归模型。数据集可在该网址进行下载:http://archive.ics.uci.edu/ml/datasets/Auto+MPG,数据是网页版的,先复制到文本文档中再保存成data格式。
一、读入数据集
import pandas as pd
import matplotlib.pyplot as plt
columns = ['mpg','cylinders','displacement','horsepower','weight','acceleration',
'model year','origin','car name']
#mpg(miles per gallon)为每加仑可以行驶多少公里,一加仑约等于3.79升
#我们的数据不是csv格式的,所以这里用read_table,第二个参数指数据是不是以空格符间隔的,第三个参数加上每列的特征名
data = pd.read_table('auto_mpg.data',delim_whitespace=True,names=columns)
data.head()
读入的数据如下所示&