python怎么清洗数据_用python 清理数据

展开全部

简单来说,比如这样:def clear_line(ln):

if not ln.startsWith('W:'): return None

if ln=='W:': return None

# parse this line

# replace char

ln = ln.replace('"', '')

# other replace

# ...

return ln

filename = 'xxx.txt'

lines = open(filename).readlines()

cleared = []

for line in lines:

nl = clear_line(line)

if nl is not None: cleared.append(nl)

open('cleared-'+filename, 'w').write('\n'.join(cleared))

假设需要转换的文件是xxx.txt。

类似替换双引号为空白字符那里,后32313133353236313431303231363533e58685e5aeb931333361303630边再继续增加替换的规则,就可以简单的处理这个文本了。

程序会最终输出一个cleared-xxx.txt。

如果对代码还是不太懂,建议最好学一下Python学习手册,这个还是很简单的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值