Python 读入windows 的记事本内容 编码 类别(ANSI,utf-8,Unicode)

原创 2015年11月20日 11:18:32

1.ANSI  

这里的 ANSI 指 ANSI code pages(注意复数),是整个非 Unicode 字符集的集合。

ANSI code pages 这个名字是微软的历史遗留问题,正式名称是 Windows code pages……

所以实际上是以当前系统的编码为准的,简体中文系统用的 code page 是 936(GBK 字符集),

所以Python中读入 记事本 .txt

f = open ( ' test.txt ' , ' r ' )

content = f . read()

dcontent = content . decode ( ' gbk ' ) 


2.utf-8

f = open ( ' test.txt ' , ' r ' )

content = f . read()

dcontent = content . decode ( ' utf-8 ' ) 




python读取Unicode和ANSI编码的文件

最近需要操作inf格式文档,用原本的文本读取方式不成功,于是搜索了一下找到原因。需要读取的目录下的文件有两种编码方式,一种是ANSI,另外一种是Unicode,但是Unicode的存储方式有UTF-8...

001_021 Python 在Unicode和普通如ANSI编码之间转化

代码如下: #encoding=utf-8 print '中国' #在Unicode和普通如ANSI编码之间转化 ustr=u'abc' ustr2=u'abc中国' #一 unicode 转...

python读写不同编码txt文件

以后整理规范 import os import codecs filenames=os.listdir(os.getcwd()) out=file("name.txt","w") for...
  • zm2714
  • zm2714
  • 2012年09月24日 13:35
  • 57905

python3 文件读写

文件路径可以写成 D:\test\b.txt”,或者写成d:/test/b.txt。如果路径没写到最后一层,竟然也是报permisson denied的错误。让我傻傻的用管理员权限去运行pycharm...

软件渲染第一步,利用SDL搭建软件渲染

偶然间突然对计算机图形学有了兴趣,最后找到了《3D游戏编程大师》,试着照着书上所写的一步步实现软件渲染算法 但是这本书的年代比较久远了,使用的是早已经淘汰了的DirectDraw,于是软件渲染算法的学...

sklearn——20newsgroups

因为实验要用到20newsgroups,所以决定好好看一下sklearn关于20newsgroups的官方文档 文档网址:http://scikit-learn.org/stable/dataset...

Windows 记事本的 ANSI、Unicode、UTF-8 这三种编码模式有什么区别?

Windows 记事本的 ANSI、Unicode、UTF-8 这三种编码模式有什么区别? Windows 的记事本默认存储文本文档编码是 ANSI,想问一下为了最大跨平台兼容性,应该采用哪种编码...
  • kaoa000
  • kaoa000
  • 2013年04月03日 10:31
  • 1178

Windows 记事本的 ANSI、Unicode、UTF-8 这三种编码模式有什么区别?

简答。一些细节暂无精力查证,如果说错了还请指出。一句话建议:涉及兼容性考量时,不要用记事本,用专业的文本编辑器保存为不带 BOM 的 UTF-8如果是为了跨平台兼容性,只需要知道,在 Windows ...

Windows下字符编码转换(ANSI <--> Unicode <--> UTF-8)

摘自https://github.com/JoyLeeSoft/StringConverter,感谢JoyLeeSoft的分享。 主要实现windows平台下ANSI、Unicode、UTF-8编...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Python 读入windows 的记事本内容 编码 类别(ANSI,utf-8,Unicode)
举报原因:
原因补充:

(最多只允许输入30个字)