本示例描述了
make_multilabel_classification
数据集生成器的使用过程,该函数生成的数据中每个样本都包含两个特征的计数(总共最多50个),这两个特征在两个类中的分布不同。 样本点标记如下,其中Y表示类存在:
1 2 3 Color星号标记每个类的预测样本;其大小反映选择该标签的概率。 左右示例强调
Y N N Red N Y N Blue N N Y Yellow Y Y N Purple Y N Y Orange Y Y N Green Y Y Y Brown
n_labels
参数:右图中的很多示例具有2或3个标签。 注意,这个二维示例是非常简陋的,一般来说,特征数量要远远大于“文档长度”,而这里我们有比词汇表大得多的文档。同样地ÿ