Python 读入windows 的记事本内容 编码 类别(ANSI,utf-8,Unicode)

原创 2015年11月20日 11:18:32

1.ANSI  

这里的 ANSI 指 ANSI code pages(注意复数),是整个非 Unicode 字符集的集合。

ANSI code pages 这个名字是微软的历史遗留问题,正式名称是 Windows code pages……

所以实际上是以当前系统的编码为准的,简体中文系统用的 code page 是 936(GBK 字符集),

所以Python中读入 记事本 .txt

f = open ( ' test.txt ' , ' r ' )

content = f . read()

dcontent = content . decode ( ' gbk ' ) 


2.utf-8

f = open ( ' test.txt ' , ' r ' )

content = f . read()

dcontent = content . decode ( ' utf-8 ' ) 



版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

python读取Unicode和ANSI编码的文件

最近需要操作inf格式文档,用原本的文本读取方式不成功,于是搜索了一下找到原因。需要读取的目录下的文件有两种编码方式,一种是ANSI,另外一种是Unicode,但是Unicode的存储方式有UTF-8...

TCP网络通讯如何解决分包粘包问题

TCP数据传输是以无边界的数据流传输形式,所谓无边界是指数据发送端发送的字节数,在数据接收端接受时并不一定等于发送的字节数,可能会出现粘包情况。 TCP粘包情况: 1. 发送端发送了数量比较的数据,接...

python 利用time模块获取当前 日期时间

 取得时间相关的信息的话,要用到python time模块,python time模块里面有很多非常好用的功能,你可以去官方 文档了解下,要取的当前时间的话,要取得当前时间的时间戳,时...

ADO.NET非连接模式

ADO.Net类可以分为以下两大类: 1 非连接类:DataSet/DataTableCollection/DataTable/DataRowCollection/DataC...

随机森林(Random Forest)

 阅读目录 •1 什么是随机森林? •2 随机森林的特点 •3 随机森林的相关基础知识 •4 随机森林的生成 •5 袋外错误率(oob error) •6 随机森林工作原理解...

python datetime 和time模块方法汇总

首先是    Python提供了多个内置模块用于操作日期时间,像calendar,time,datetime。time模块我在之前的文章已经有所介绍,它提供的接口与C标准库time....

python读写不同编码txt文件

以后整理规范 import os import codecs filenames=os.listdir(os.getcwd()) out=file("name.txt","w") for...
  • zm2714
  • zm2714
  • 2012-09-24 13:35
  • 52678

Windows下字符编码转换(ANSI <--> Unicode <--> UTF-8)

摘自https://github.com/JoyLeeSoft/StringConverter,感谢JoyLeeSoft的分享。 主要实现windows平台下ANSI、Unicode、UTF-8编...

各种字符编码方式详解及由来(ANSI,UNICODE,UTF-8,GB2312,GBK)

各种字符编码方式详解及由来(ANSI,UNICODE,UTF-8,GB2312,GBK)       一直对字符的各种编码方式懵懵懂懂,什么ANSI、UNICODE、UTF-8、...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)