线性回归分析
一元线性回归:
代码
城市用水预测
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from pandas import DataFrame, Series
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
# 读取文件
datafile = u'C:\\Users\\ASUS\\Desktop\\dhdhdh.xlsx' # 文件所在位置,u为防止路径中有中文名称,此处没有,可以省略
data = pd.read_excel(datafile) # datafile是excel文件,所以用read_excel,如果是csv文件则用read_csv
examDf = DataFrame(data)
examDf.head()
# 绘制散点图,examDf.jt为X轴,examDf.hk为Y轴
plt.scatter(examDf.Connect, examDf.Return, color='darkgreen', label="Exam Data")
# 添加图的标签(x轴,y轴)
plt.xlabel("tempture") # 设置X轴标签
plt.ylabel("waterconsumptuton") # 设置Y轴标签
plt.show() # 显示图像
rDf = examDf.corr()
# 查看数据间的相关系数
print(rDf)
# 拆分训练集和测试集(train_test_split是存在与sklearn中的函数)