小伙伴们在用机器学习模型进行分类的时候,可能会遇到这样的问题:明明我都把模型建立起来了,代码也写好了,但是,数据集上哪儿找去?
巧妇难为无米之炊,今儿我就告诉大伙儿一个方法,来自己嗯造数据集
#导入sklearn库
from sklearn.datasets import make_blobs
#导入画图的包
import matplotlib.pyplot as plt
#导入数据集拆分工具
from sklearn.model_selection import train_test_split
#生成样本数为400,分类为3的数据集
data = make_blobs(n_samples=400,centers = 3,random_state=8)
X,y = data
#数据集进行可视化
plt.scatter(X[:,0],X[:,1],c=y,cmap=plt.cm.spring,edgecolor='k')
plt.show()
解释:引入sklearn库的make_blobs函数和画图的matplotlib库,导入数据集拆分的函数,然后就可以生成想要的数据集了(样本数自定,分类数自定)。
效果: