import numpy as np
import matplotlib.pyplot as plt
from sklearn import linear_model
#设置中文字体
plt.rcParams['font.sans-serif']='SimHei'
plt.rcParams['axes.unicode_minus']=False
#设置自变量和因变量
data_x=[]
data_y=[]
#读取数据
f=open('E:\Desktop\python_code\sklearn\课程数据\回归\prices.txt','r') #自己存放的数据位置
lines=f.readlines()
for line in lines:
items=line.strip().split(',') #line.去掉(空格).分割(',')
data_x.append(int(items[0]))
data_y.append(int(items[1]))
length=len(data_x)
data_x=np.array(data_x).reshape(length,1)
data_y=np.array(data_y)
minX=min(data_x)
maxX=max(data_x)
x=np.arange(minX,maxX).reshape([-1,1])
linear=linear_model.LinearRegression()
linear.fit(data_x,data_y)
print('Coefficients:',linear.coef_) #线性系数
print('intercept:',linear.intercept_) #与y轴的交点坐标
plt.scatter(data_x,data_y,color='green')
plt.plot(x,linear.predict(x),color='blue')
plt.xlabel('Area')
plt.ylabel('Price')
plt.title('房价与房屋尺寸关系的线性关系图')
plt.show()