数据清洗小记(10):清洗字典数据把“A1B1C1”翻译成对应中文字段

原创作品,出自 “深蓝的blog” 博客,欢迎转载,转载时请务必注明出处,否则追究版权法律责任。
[深蓝的blog]:http://blog.csdn.net/huangyanlong/article/details/49318855

【背景】
某部委项目,获取到某采集端某类数据,需配合开发完成数据的抽取、清洗工作。其中有一类字典类字段,由于采集端数据问题,对于字典类的数据内容出现大量问题数据需要清洗,把字典值翻译成中文名称提供给开发使用,举个例子如下:
这里写图片描述
假设字典列表如下:
这里写图片描述
遇到问题1:如何进行翻译?
把A1翻译成“消防车”,把B1翻译成“警车”,把C1翻译成“大货车”。

遇到问题2:如何将翻译后结果更美观易读?
将翻译后结果由“消防车,警车,大货车,”转换成“消防车,警车,大货车”,即去掉翻译后的最后一个逗号。

【解决】
解决1:利用笨方法:replace翻译;
由于本次需翻译字典项不多,考虑到编写函数的繁琐性,于是想利用一个replace的笨方法来解决,起初担心效率问题,但

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值