自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

rouge_eradiction的博客

sklearn

关注

关注数：文章数：1 文章阅读量：597 文章收藏量：2

作者: Rouge-Eradiction

这个作者很懒，什么都没留下…

展开

机器学习分类问题实践——sklearn.preprocessing.MultiLabelBinarizer在中文one-hot编码中的应用

MultiLabelBinarizer 在机器学习自然语言处理的分类问题中，我们经常需要处理大量的中文字符，我们希望知道每一条数据中的某个数据项的出现中文字符的种类，并且进行标注从而进行下一步的处理。这样描述比较抽象，举个例子，在处理党员干部的违规违纪通报时，对不同违纪的干部有不同的处分，如开除党籍，警告等，现在我们有100条党员干部的违纪通报，希望将每一个干部的处分转化为由0和1组成的序列。 from sklearn.preprocessing import MultiLabelBinarizer as

原创 2020-09-09 10:07:33 · 597 阅读 · 0 评论