python处理不同编码格式的文件

1. 使用python处理utf-16le编码格式的文件

使用codecs模块打开文件

file = codecs.open(newfile, 'r', 'utf-16le')

对文件内容按行进行处理时,发现第一行的编码老是有问题。使用MadEdit编辑器以16进制查看文件时,发现如下图编码:

从图中可以看出,文件中的内容【以前】是从第2位编码开始的,同时“以”对应2,3字节,所以在处理文件的第一行时需要过滤前两个字节的编码FFFE。

            if i == 0:
                key = lines_expect[i][1:]
            else:
                key = lines_expect[i]

这样就可以正常读取文件内容了!

转载于:https://www.cnblogs.com/qi09/archive/2013/02/25/2931744.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值