Python读取Unicode编码格式的文件（转换为UTF-8）

最新推荐文章于 2024-03-04 11:43:41 发布

_BigBen

最新推荐文章于 2024-03-04 11:43:41 发布

阅读量1.5w

点赞数 3

分类专栏： Python 文章标签： python unicode utf-8 filter 编码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_31502513/article/details/51995038

版权

Python 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

我不说话，只写代码。

import re

def filter_null(c):
if not re.match('[\\x00\\xff\\xfe]', c):
return True

if __name__ == '__main__':
save = open('save.txt', 'w') # save.txt是转换之后的utf-8文件
try:
with open('sec.txt', 'rb') as f: # sec.txt是以Unicode编码的文件，不限于txt格式
for line in open('sec.txt'):
line = f.readline()
line = filter(filter_null, line)
line = line[:-1] # 去掉多余的换行符
line = line.encode('utf-8')
print line
save.writelines(line)
finally:
save.close()

with open('save.txt', 'r') as f_utf8:
print f_utf8.read()
pass

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
Python读取Unicode编码格式的文件（转换为UTF-8）

我不说话，只写代码import redef filter_null(c): if not re.match('[\\x00]', c): return True if __name__ == '__main__': save = open('save.txt', 'w') try: with open(
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。