sklearn的datasets数据库

最新推荐文章于 2024-05-22 17:12:34 发布

班花i

最新推荐文章于 2024-05-22 17:12:34 发布

阅读量836

点赞数

分类专栏： python 机器学习文章标签：机器学习 python

本文链接：https://blog.csdn.net/weixin_51944426/article/details/119886264

版权

python 同时被 2 个专栏收录

23 篇文章 0 订阅

订阅专栏

机器学习

4 篇文章 0 订阅

订阅专栏

（一）利用datasets的数据集进行训练和预测

先引入

from __future__ import print_function
from sklearn import datasets
from sklearn.linear_model import LinearRegression

下一步

#加载数据
loaded_data = datasets.load_boston()#datasets里boston房价的数据集
#形式：datasets.xxx()   #datasets.make_xxx()

data_X = loaded_data.data
data_y = loaded_data.target#这也是固定的形式

#定义模型
model = LinearRegression()# 线性回归的模型

model.fit(data_X, data_y)#用这个模型去学习！

#训练完毕
print(model.predict(data_X[:4, :]))#预测值
print(data_y[:4])#真实值

这个就是最终的训练结果，对比起来看
为了提高准确度，可以通过尝试不同的 model，不同的参数，不同的预处理等方法，入门的话可以直接用默认值。

# [ 30.00821269  25.0298606   30.5702317   28.60814055]
# [ 24.   21.6  34.7  33.4]

（二）
创建虚拟数据－可视化（创建数据）

#先引入模块
import matplotlib.pyplot as plt

X, y = datasets.make_regression(n_samples=100, n_features=1, n_targets=1, noise=10)
#可以观察noise的数值来体会噪声的影响
plt.scatter(X, y)#散点图
plt.show()

班花i

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
sklearn的datasets数据库

（一）利用datasets的数据集进行训练和预测先引入from __future__ import print_functionfrom sklearn import datasetsfrom sklearn.linear_model import LinearRegression下一步#加载数据loaded_data = datasets.load_boston()#datasets里boston房价的数据集#形式：datasets.xxx() #datasets.make_xxx(
复制链接

扫一扫