1. 电脑txt 文件ANSI编码格式:
针对ANSI,不同的国家和地区制定了不同的标准,由此产生了 GB2312、GBK、GB18030、Big5、Shift_JIS 等各自的编码标准。这些使用多个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。在简体中文Windows操作系统中,ANSI 编码代表 GBK 编码;在繁体中文Windows操作系统中,ANSI编码代表Big5;在日文Windows操作系统中,ANSI 编码代表 Shift_JIS 编码。
2. python 3.4 对ANSI格式的中文已经支持了,所以txt文件如果用ANSI编码,python直接可以读入,如以下代码:
f1 = open(r'test_ANSI.txt','r')
content1 = f1.read()
print(content1)
f1.close()
3. 如果txt文件使用utf8编码格式,可使用如下代码解码:
import codecs
f2 = codecs.open(r'test_utf8.txt', encoding='utf8')
content2 = f2.read()
print(content2)
f2.close()
4. 中文编码博客参考
http://www.wklken.me/posts/2013/08/31/python-extra-coding-intro.html