sklearn模块常用功能总结(20200915)

视频学习:

https://www.bilibili.com/video/BV1xW411Y7Qd?p=4 系列

 

1、MultiLabelBinarizer 多标签编码

多标签二值化:sklearn.preprocessing.MultiLabelBinarizer(classes=None, spare_output=False)

classes属性,若设置classes参数时,其值等于classes参数值,否则从训练集统计标签值

例一 y为标签id的list

from sklearn.preprocessing import MultiLabelBinarizer

def main():
	y = [[2,3,4],[2],[0,1,3],[0,1,2,3,4],[0,1,2]] # 同时含有单标签和多标签
	m = MultiLabelBinarizer()
	print(m.fit_transform(y))
	print(m.classes_)

if __name__ == '__main__':
    main()

'''
[[0 0 1 1 1]
 [0 0 1 0 0]
 [1 1 0 1 0]
 [1 1 1 1 1]
 [1 1 1 0 0]]
[0 1 2 3 4]
'''

例二 y为标签本身的list

from sklearn.preprocessing import MultiLabelBinarizer

def main():
	y = [['2','3','4'],['2'],['0','1','3'],['0','1','2','3','4'],['0','1','2']]
	m = MultiLabelBinarizer()
	print(m.fit_transform(y))
	print(m.classes_)


if __name__ == '__main__':
    main()

'''
[[0 0 1 1 1]
 [0 0 1 0 0]
 [1 1 0 1 0]
 [1 1 1 1 1]
 [1 1 1 0 0]]
['0' '1' '2' '3' '4']
'''

例三 设置classes即规定了标签(非classes中的标签不被记录)

classes是设置label位置的,若classes=[2,3,4,5,6,1],则2值索引为0,3索引为1

def main():
	y = [['2','3','4'],['2'],['0','1','3'],['0','1','2','3','4'],['0','1','2']]
	m = MultiLabelBinarizer(classes=['2','3','4','5','6','1'])
	print(m.fit_transform(y))
	print(m.classes_)
'''
[[1 1 1 0 0 0]
 [1 0 0 0 0 0]
 [0 1 0 0 0 1]
 [1 1 1 0 0 1]
 [1 0 0 0 0 1]]
['2' '3' '4' '5' '6' '1']
'''

例四 m.transform()使用

对不同情况的总结,数据y完成了fit,而后直接用transform对新的数据a进行transform。数据a只有标签'3','4',因此对应为[[0 0 0 1 1]]

def main():
	y = [['2','3','4'],['2'],['0','1','3'],['0','1','2','3','4'],['0','1','2']]
	m = MultiLabelBinarizer()
	m.fit(y)
	a = [['3','4']]
	print(m.transform(a))

'''
[[0 0 0 1 1]]
'''

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值