【Python实例第6讲】多标签分类

最新推荐文章于 2024-06-17 13:51:56 发布

Goodsta

最新推荐文章于 2024-06-17 13:51:56 发布

阅读量6.7k

点赞数 3

文章标签： pyton

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wong2016/article/details/82838922

版权

机器学习训练营——机器学习爱好者的自由交流空间（入群联系qq：2279055353）

分类原理

本例模拟一个多标签文档分类问题。数据集根据下面的过程随机产生。

选择标签数 n: 来自泊松分布。
选择一个类别 c: 来自多项分布。
选择文档长度 k: 来自泊松分布。
选择一个单词 w: 来自多项分布。

在上述过程里，使用拒绝采样(rejection sampling)确保n>2, 文档长度不是0. 同样地，我们也拒绝已经被选择的类。被分配两个类的文档，在图上用两种颜色圈出。

通过投射到PCA的前两个主成分做分类，然后使用sklearn.multiclass.OneVsRestClassifier分类器学习一个两类的判别模型。请注意，PCA是用来作一个无监督的降维，而CCA(典型关联分析)是用作有监督的降维。不同情况下的样本分类结果见下图。

注意：在下图中，无标签的样本并不意味着我们不能预测它们的标签，而是样本没有标签。
在这里插入图片描述

代码详解

首先，在Python环境加载必须的函数库。

print(__doc__)

import numpy as np

最低0.47元/天解锁文章

关注

3
点赞
踩
19

收藏

觉得还不错? 一键收藏
1
评论
【Python实例第6讲】多标签分类

机器学习训练营——机器学习爱好者的自由交流空间（qq 群号：696721295）分类原理本例模拟一个多标签文档分类问题。数据集根据下面的过程随机产生。选择标签数 n: 来自泊松分布。选择一个类别 c: 来自多项分布。选择文档长度 k: 来自泊松分布。选择一个单词 w: 来自多项分布。在上述过程里，使用拒绝采样(rejection sampling)确保n&amp;gt...
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。