Python:分类模型数据集找不到怎么办？自己动手，丰衣足食！

云梦泽kk

已于 2022-10-29 15:12:42 修改

阅读量1.2k

点赞数

文章标签： 1024程序员节

于 2022-10-24 15:21:35 首次发布

本文链接：https://blog.csdn.net/weixin_56529327/article/details/127493081

版权

小伙伴们在用机器学习模型进行分类的时候，可能会遇到这样的问题：明明我都把模型建立起来了，代码也写好了，但是，数据集上哪儿找去？

巧妇难为无米之炊，今儿我就告诉大伙儿一个方法，来自己嗯造数据集

#导入sklearn库
from sklearn.datasets import make_blobs


#导入画图的包
import matplotlib.pyplot as plt

#导入数据集拆分工具
from sklearn.model_selection import train_test_split

#生成样本数为400，分类为3的数据集
data = make_blobs(n_samples=400,centers = 3,random_state=8)
X,y = data

#数据集进行可视化
plt.scatter(X[:,0],X[:,1],c=y,cmap=plt.cm.spring,edgecolor='k')
plt.show()

解释：引入sklearn库的make_blobs函数和画图的matplotlib库，导入数据集拆分的函数，然后就可以生成想要的数据集了（样本数自定，分类数自定）。

效果：