sklearn 线性回归_sklearn学习之简单线性回归

读取csv文件数据集,然后进行学习

数据集散点图如下:(横坐标为玩偶个数,纵坐标为生产成本)

987d4c10e4ed4cadd460b5fccc747ef9.png
# 参见GitUploading/ML/linear regression
from sklearn import linear_model
import pandas as pd
import matplotlib.pyplot as plt
reg = linear_model.LinearRegression()
reg.fit([[0, 0], [1, 1], [2, 2]], [0, 1, 2])
print(reg.coef_)
print(reg.intercept_)

import numpy as np
# dataset = pd.loadtxt('simple_example.csv')
dataset= pd.read_csv('simple_example.csv')
# X = dataset[list(dataset.columns)[:-1]]
X = dataset['x']
print(type(X))

#  X = dataset[1:2]
y = dataset['y']
# print("size:",len(dataset))
print(X)
print(y)
print('===============')

print(dataset)

plt.plot(X, y, 'k.')

from sklearn.cross_validation import train_test_split
X_train,X_test,y_train,y_test = train_test_split(X,y,random_state =33,test_size=0.25)  #对训练样本进行划分
from sklearn.linear_model import LinearRegression
model = LinearRegression()
X_train = np.array(X_train).reshape(-1, 1)
# y = [7, 9, 13, 17.5, 18]
# Fit the model on the training data
model.fit(X_train, y_train)  #开始进行迭代
print('Coefficients: n', model.coef_)
print('Coefficients: n', model.intercept_)#显示回归系数

X = np.array(X).reshape(-1, 1)
y_pred = model.predict(X)
plt.plot(X, y_pred, color='blue', linewidth=3)
plt.show()


print(X_train)

from sklearn.metrics import mean_squared_error, r2_score
print('========评估结果,均方差=======')
X_test = np.array(X_test).reshape(-1, 1)
diabetes_y_pred = model.predict(X_test)
print("Mean squared error: %.2f"
      % mean_squared_error(y_test, diabetes_y_pred))
print('Variance score(决定系数): %.2f' % r2_score(y_test, diabetes_y_pred))

运行结果:(注意原始数据集,以及对原始数据集的区别X,y进行读取)

c9f2224fe1e0e596cc06a4168e05cae2.png

Coefficients:
[ 1.03705579]
intercept:
-1.19837809917

0bbecfbb0f45c200348dacaa3b4ac4d1.png

均方差的定义:

表示用此模型估计生产成本,平均误差为

决定系数:(注意,决定系数要用测试数据)

,

表示92%的成本变化可由模型解释

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值