模型原理:
使用单一特征来预测响应值
这是一种基于自变量值(X)来预测因变量(Y)的方法。
假设这两个变量是线性相关的,因此我们尝试寻找一种根据特征或自变量(x)的线性函数来准确预测响应值(y)
找到最佳的拟合线
在这个回归任务中,我们将通过找到“最佳拟合线”来最小化预测误差----回归线的误差将是最小的。
试图最小化观测值和模型预测值之间的长度
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from pandas import DataFrame, Series
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
import pymysql
#连接数据库获取数据集
db = pymysql.connect(
user="root",
password="root",
host="localhost",
database="store_data",
port=3306,
charset="utf8")
# 创建游标
cursor = db.cursor()
print('连接数据库成功')
sql = "SELECT visiter,pay from allstore_data_smt WHERE store = '888store'"
cursor.execute(sql)
results = list(cursor.fetchall())
print(results)
#准备原始数据集
uv=