scikit-multilearn 笔记 第一节

英文原文: 点我.
声明:此博文为对原英文文章的翻译加个人的理解,一方面为自己学习所用,另一方面为需要中文scikit-multilearn文档的小伙伴提供便利。

侵删

第一节 一起开始使用scikit-multilearn吧

Scikit-multilearn是一个BSD许可的多标记分类库,建立在众所周知的scikit-learn库之上。

1 安装

在命令行,安装Scikit-multilearn,运行一下代码:

$ pip install scikit-multilearn

2 使用

Scikit-multilearn可以在Windows,Linux和OSX操作平台的python2或者3上面运行,使用其模块时,只需要如下的声明代码。

import skmultilearn

3 试着在emotions数据上跑一下

(1)下面使用emotions数据,来运行一下。
from skmultilearn.dataset import load_dataset

在我运行这一行代码时,报错,显示没有arff模块,如下图。
在这里插入图片描述
这时,只需要在命令行运行以下代码安装arff模块即可,安装之后,即可正常运行。

$ pip install arff
(2)加载数据,加载数据时会显示

emotions:train - does not exists downloading
Downloaded emotions-train
不用管它。

X_train,  Y_train, feature_names, label_names = load_dataset('emotions', 'train')
X_test, Y_test, _, _ = load_dataset('emotions', 'test')

可以打印下X_train, Y_train, feature_names, label_names,用如下代码。

print('X_train       is {}'.format(X_train))
print('Y_train       is {}'.format(Y_train))
print('feature_names is {}'.format(feature_names))
print('label_names   is {}'.format(label_names ))
(3)训练模型
from skmultilearn.problem_transform import BinaryRelevance
from sklearn.svm import SVC
clf = BinaryRelevance(
    classifier=SVC(),
    require_dense=[False, True]
)
clf.fit(X_train, Y_train)

打印训练结果,原文中使用的是clf.classifiers,但是在我的电脑上运行,显示错误,应该是版本的问题,经过查找资料,发现应该使用如下代码。

clf.classifiers_
(4)获得预测结果,并打印有关评价指标。
import sklearn.metrics as M
prediction = clf.predict(X_test)
hamming_loss_emotions = M.hamming_loss(Y_test, pred)
ACC_emotions = M.accuracy_score(Y_test, pred)
print('hamming_loss_emotions is {}'.format(hamming_loss_emotions))
print('ACC_emotions is {}'.format(ACC_emotions))

(5)完整程序如下:
#!/usr/bin/env python3
# -*- coding: utf-8 -*-

from skmultilearn.dataset import load_dataset
from skmultilearn.problem_transform import BinaryRelevance as BRl
from sklearn.svm import SVC
import sklearn.metrics as M

X_train, Y_train, feature_names, label_names = load_dataset('emotions', 'train')
X_test, Y_test, _, _ = load_dataset('emotions', 'test')

# print('X_train       is {}'.format(X_train))
# print('Y_train       is {}'.format(Y_train))
# print('feature_names is {}'.format(feature_names))
# print('label_names   is {}'.format(label_names ))

clf = BRl(classifier=SVC(), require_dense=[False, True])
clf.fit(X_train, Y_train)
pred = clf.predict(X_test)

print(clf.classifiers_)
hamming_loss_emotions = M.hamming_loss(Y_test, pred)
ACC_emotions = M.accuracy_score(Y_test, pred)
print('hamming_loss_emotions is {}'.format(hamming_loss_emotions))
print('ACC_emotions is {}'.format(ACC_emotions))

程序运行结果如下:
在这里插入图片描述
个人能力有限,望各位批评指正。

  • 4
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值