Topic:
尝试加载一个真实数据集,并使用 scikit-learn 构建预测模型,实现多项式回归预测
以世界麻疹疫苗接种率
基础篇详看:多项式回归
步骤:
- 加载数据集
- 定义训练和测试使用的自变量和因变量
- 建立线性回归模型
- 线性回归误差计算
- 多项式回归预测次数选择
MSE
# 1. 下载数据集
# !wget http://labfile.oss.aliyuncs.com/courses/1081/course-6-vaccine.csv
# 2. 用 Pandas 加载数据集
import pandas as pd
df = pd.read_csv("course-6-vaccine.csv", header=0)
df
# 3. 绘制图像
from matplotlib import pyplot as plt
# 从原数据集中分离出需要的数据集(DataFrame)
x = df['Year']
y = df['Values']
# 绘图
plt.plot(x, y, 'r')
plt.scatter(x, y)