批量生成数据集_使用Python+sklearn实现绘制随机生成的多标签数据集

最新推荐文章于 2022-12-23 13:09:37 发布

维权骑士

最新推荐文章于 2022-12-23 13:09:37 发布

阅读量828

点赞数

文章标签：批量生成数据集

本文链接：https://blog.csdn.net/weixin_29105429/article/details/112693994

版权

本示例描述了 make_multilabel_classification 数据集生成器的使用过程，该函数生成的数据中每个样本都包含两个特征的计数(总共最多50个)，这两个特征在两个类中的分布不同。样本点标记如下，其中Y表示类存在：

1 2 3 Color

Y N N Red

N Y N Blue

N N Y Yellow

Y Y N Purple

Y N Y Orange

Y Y N Green

Y Y Y Brown

星号标记每个类的预测样本；其大小反映选择该标签的概率。左右示例强调 n_labels 参数：右图中的很多示例具有2或3个标签。注意，这个二维示例是非常简陋的，一般来说，特征数量要远远大于“文档长度”，而这里我们有比词汇表大得多的文档。同样地ÿ

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注