来自于邹博机器学习第七期第九课中的内容:简单介绍就是一个产品的销量sales与TV、radio、newspaper三个投入量之间的关系。
直接上代码:
import numpy as np import matplotlib as mpl import matplotlib.pyplot as plt import pandas as pd from sklearn.model_selection import train_test_split,GridSearchCV from sklearn.linear_model import Lasso, Ridge
其中train_test_split是将数据进行分割为训练集和测试集,GridSearchCV它存在的意义就是自动调参,只要把参数输进去,就能给出最优化的结果和参数。但是这个方法适合于小数据集,一旦数据的量级上去了,很难得出结果。
if __name__ == "__main__": # pandas读入 data = pd.read_csv('E:\\code\\Advertising.csv') # print(data) x = data[['TV', 'Radio', 'Newspaper']] # x = data[['TV', 'Radio']]