Python处理数据的记录

一、问题描述

原数据如图:
在这里插入图片描述
处理后的数据如图:
在这里插入图片描述
去掉没有值的标签,并变成一对一的格式。

二、解决

按行读取文本,将带有"-"的行忽略,其他的写入新的文件。按行读取处理后的数据,使用循环进行切分,组合,再写入新的文件。

代码1:去掉多余行

out = "out.txt"
f = open("annotation.txt", encoding='utf-8')
while True:
    line = f.readline()
    if line:
        if '-' in line:
            continue
        else:
            with open(out, "a") as o:
                o.write(line + "\n")
                o.close()
            print(line)
    else:
        break
f.close()

这里的写法很憨,每次打开,关闭,速度慢,可以看后面的处理改一改。

代码2:处理文件

import re
f = open("out.txt", encoding='utf-8')
o = open("out2.txt", encoding="utf-8", mode="a")
while True:
    line = f.readline()
    if line:
        line = re.sub('''"''', "", line)
        # print(line)
        head = line.split("\t")
        key = head[0]
        for i in range(1, len(head)):
            value = head[i]
            me = key + ":" + value + "\n"
            o.write(me)
        # print(head)
    else:
        break
f.close()
o.close()

三、总结

一些简单的字符串操作,记录下日常。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值