关闭

Python 读入windows 的记事本内容 编码 类别(ANSI,utf-8,Unicode)

1189人阅读 评论(0) 收藏 举报
分类:

1.ANSI  

这里的 ANSI 指 ANSI code pages(注意复数),是整个非 Unicode 字符集的集合。

ANSI code pages 这个名字是微软的历史遗留问题,正式名称是 Windows code pages……

所以实际上是以当前系统的编码为准的,简体中文系统用的 code page 是 936(GBK 字符集),

所以Python中读入 记事本 .txt

f = open ( ' test.txt ' , ' r ' )

content = f . read()

dcontent = content . decode ( ' gbk ' ) 


2.utf-8

f = open ( ' test.txt ' , ' r ' )

content = f . read()

dcontent = content . decode ( ' utf-8 ' ) 



0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:41302次
    • 积分:929
    • 等级:
    • 排名:千里之外
    • 原创:48篇
    • 转载:28篇
    • 译文:1篇
    • 评论:5条
    最新评论