【机器学习】快速贴标签和找标签对应的数据

快速贴标签和找标签对应的数据

手动反爬虫:原博地址

 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息

如若转载,请标明出处,谢谢!

前言需求

在进行机器学习的过程中,模型创建之前,需要进行标签的处理,比如将文本数据转化为数值,而在最后的预测时候,又想检验一下预测的标签结果是否对应的文本数据一致,因此就有了快速贴标签和找标签对应数据的要求。

一、贴标签

这里就使用10个文本数据进行举例

ls = ["汽车", "财经", "科技", "健康", "体育", "教育","文化","军事","娱乐","时尚"]

贴标签的过程就相当于是让列表中的数据一一对应上数值,那么使用python自带的enumerate函数就可以实现,但是输出的结果却是反的,也就是需要将键值对的顺序调换一下,因此贴标签只要解决字典中键值对顺序的替换就可以了

print({v:k for k,v in dict(enumerate(ls)).items()})

输出的结果为:(贴标签的要求就完成了)

{'汽车': 0, '财经': 1, '科技': 2, '健康': 3, '体育': 4, '教育': 5, '文化': 6, '军事': 7, '娱乐': 8, '时尚': 9}

二、找标签对应的数据

在最后的预测部分,想知道输出的结果对应原来的文本数据,只需要遍历字典进行满足条件的结果输出即可

label_mapping = {v:k for k,v in dict(enumerate(ls)).items()}
print({'{}:{}'.format(key,value) for key,value in filter(lambda x:x[1] == 7, label_mapping.items())})

输出结果为:(这里的代码只需要修改x[1]后面等于的值即可,就可以完成目标要求,进行结果输出)

{'军事:7'}

总结

所有的代码就是简单地四行

ls = ["汽车", "财经", "科技", "健康", "体育", "教育","文化","军事","娱乐","时尚"]  #文本数据
print({v:k for k,v in dict(enumerate(ls)).items()})  #贴标签


label_mapping = {v:k for k,v in dict(enumerate(ls)).items()}  #贴标签后进行赋值
print({'{}:{}'.format(key,value) for key,value in filter(lambda x: x[1] == 7, label_mapping.items())})  #查找文本数据
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lys_828

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值