部分处理文件格式代码

  • 1.转换编码:

原编码\xe7\x97\x85\xe7\x90\x86\xe5\x8f\x8d\xe5\xb0\x84

转换为中文编码:”引出”

import re

def unicodetostr( s ):
    strTobytes = []
    for i in s.split('\\x'):
        if i != '':
            num = int(i,16)
            strTobytes.append(num)
    a = bytes(strTobytes).decode()
    return a
def ti(m):
    s = str(m.group())
    a = unicodetostr(s)
    return a
pat = re.compile(r'(\\x[0-9a-fA-F][0-9a-fA-F])+')
with open('file_path') as file:
    for line in file:
        '''for m in re.finditer(pat,line):
            print(m.group())'''
        print(re.sub(pat,ti,line))
  • 2.读.pl文件
import joblib
file = 'word.txt'
pkl_load = joblib.load('file_path')
print(pkl_load)
with open(file,'w', encoding='UTF-8') as f:
    f.write(str(pkl_load))
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值