关于数据整理部分

目标:按照自己的mapping表设置标签
步骤:
1.将文本信息中的“|”转换为“ ”
for s in lines:
fp.write(s.replace(’|’,’ ‘).rstrip()+’\n’)
#.rstrip()是去掉字符串中末尾的空格 .lstrip()是去掉字符串中首位的空格

在这里插入图片描述在这里插入图片描述

2.将每行的有效字符分割
for ss in line0:
fp.write(ss[0:15]+’ ‘.join(ss[15:len(ss)-1])+’\n’)
在这里插入图片描述

3.按照自己的mapping表替换字符
fo = open(‘text.txt’,‘w’)
for s1 in line:
fo.write(s1[0:15]+s1[15:150].replace(‘a’,‘1’).replace(‘b’,‘2’).replace(‘c’,‘3’).replace(‘d’,‘4’).replace(‘e’,‘5’).replace(‘f’,‘6’).replace(‘g’,‘7’).replace(‘h’,‘8’).replace(‘i’,‘9’).replace(‘j’,‘10’).replace(‘k’,‘11’).replace(‘l’,‘12’).replace(‘m’,‘13’).replace(‘n’,‘14’).replace(‘o’,‘15’).replace(‘p’,‘16’).replace(‘q’,‘17’).replace(‘r’,‘18’).replace(‘s’,‘19’).replace(‘t’,‘20’).replace(‘u’,‘21’).replace(‘v’,‘22’).replace(‘w’,‘23’).replace(‘x’,‘24’).replace(‘y’,‘25’).replace(‘z’,‘26’).replace(‘A’,‘27’).replace(‘B’,‘28’).replace(‘C’,‘29’).replace(‘D’,‘30’).replace(‘E’,‘31’).replace(‘F’,‘32’).replace(‘G’,‘33’).replace(‘H’,‘34’).replace(‘I’,‘35’).replace(‘J’,‘36’).replace(‘K’,‘37’).replace(‘L’,‘38’).replace(‘M’,‘39’).replace(‘N’,‘40’).replace(‘O’,‘41’).replace(‘P’,‘42’).replace(‘Q’,‘43’).replace(‘R’,‘44’).replace(‘S’,‘45’).replace(‘T’,‘46’).replace(‘U’,‘47’).replace(‘V’,‘48’).replace(‘W’,‘49’).replace(‘X’,‘50’).replace(‘Y’,‘51’).replace(‘Z’,‘52’).replace(’[’,‘53’).replace(’]’,‘54’).replace(’_’,‘55’).replace(’`’,‘56’).replace(’|’,‘57’).replace(’~’,‘58’).replace(’<<’,‘59’).replace(’>>’,‘60’).replace(’!’,‘61’).replace(’’’,‘62’).replace(’"’,‘63’).replace(’#’,‘64’).replace(’$’,‘65’).replace(’%’,‘66’).replace(’&’,‘67’).replace(’(’,‘68’).replace(’)’,‘69’).replace(’*’,‘70’).replace(’+’,‘71’).replace(’,’,‘72’).replace(’-’,‘73’).replace(’.’,‘74’).replace(’/’,‘75’).replace(’:76’,’’).replace(’;’,‘77’).replace(’=’,‘78’).replace(’<’,‘79’).replace(’>’,‘80’).replace(’?’,‘81’)) # replace是替换,write是写入

在这里插入图片描述

4.给每行有效字符的首尾添加字符‘0’,如果首位本身就是‘0’,不做添加操作
for s in lines:
if s[15] == ‘0’:
fp.write(s[0:14]+’ ‘+s[15:len(s)-1]+’ 0’+’\n’)
else:
fp.write(s[0:14]+’ 0 ‘+s[15:len(s)-1]+’ 0’+’\n’)
在这里插入图片描述

5.将每一行的前15个字符命名为文件名,后边字符写进新的文件中
f1=f.readlines()
for i in f1:
p=‘E:\data\lable\%s.tru’%(i[0:14])
with open(p,‘w’)as a:
a.write(i[15:150])
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值