Python 3.4中文编码

1. 电脑txt 文件ANSI编码格式:

针对ANSI,不同的国家和地区制定了不同的标准,由此产生了 GB2312、GBK、GB18030、Big5、Shift_JIS 等各自的编码标准。这些使用多个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。在简体中文Windows操作系统中,ANSI 编码代表 GBK 编码;在繁体中文Windows操作系统中,ANSI编码代表Big5;在日文Windows操作系统中,ANSI 编码代表 Shift_JIS 编码。


2. python 3.4 对ANSI格式的中文已经支持了,所以txt文件如果用ANSI编码,python直接可以读入,如以下代码:

f1 = open(r'test_ANSI.txt','r')
content1 = f1.read()
print(content1)
f1.close()


3. 如果txt文件使用utf8编码格式,可使用如下代码解码:

import codecs
f2 = codecs.open(r'test_utf8.txt', encoding='utf8')
content2 = f2.read()
print(content2)
f2.close()


4. 中文编码博客参考

http://www.wklken.me/posts/2013/08/31/python-extra-coding-intro.html


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值