模型实现需要四步:
1.将数据划分为训练集和测试数据集,解决过度拟合的问题
2.利用训练数据集训练模型,估计模型参数
3.利用测试数据集评价模型,计算对应的均方差和决定系数
4.用图像化的方式,展示模型效果
实现代码如下:
import os
import sys
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn import linear_model
#建立线性回归模型
def linearModel(data):
"""
线性回归模型建模步骤展示
参数
---
data:DataFrame,建模数据
"""
features = ["x"]
labels = ["y"]
#划分训练集和测试集
trainData = data[:15]
testData = data[15:]
#产生并训练模型
model = trainModel(trainData,features,labels)
#评价模型效果
error,score = evaluateModel(model,testData,features,labels)
#图形化模型结果
visualizeModel(model,data,features,labels,error,score)
#使用第三方开源算法库scikit-learn来搭建和训练线性回归模型
def trainModel(trainData,features,labels):
"""
利用训练数据,估计模型参数
参数
-