Python编码处理

 

Python编码处理

Luo Weifeng 2011-4-21

 

 转载请保留:http://blog.csdn.net/luoweifeng1989/archive/2011/04/21/6338287.aspx

默认编码

Python 默认编码是ASCII编码。可通过在Python脚本中第一行或第二行添加coding指示行来改变。

 

处理字节

Function unichr()

Python内建的Unicode字符构造函数,它将一个Integer数据转换成相对应的长度为1Unicode string。例:

 

Function ord()

正好与unichr()相反,它将一个长度为1Unicode String转换成相应的Integer.例:

 

 

字符串处理

Function unicode():

所有的Unicode字符串都是unicode 类的实例,这个类与 str 都是 basestring的子类。Unicode类的构造函数:unicode(string[, encoding, errors])。这里string是一个ascii字符串,encoding说明解码方式(对于第一个参数),Errors说明处理出错规则。例:

或者在代码里直接编码:

 

Function .encode()

函数签名:.encode([encoding], [errors='strict']) 。 python内部是是使用 unicode处理编码的,所以要使用特定编码转换前先将他转换成unicode编码,再使用encoding转化成相应编码。encoding指定编码规则。例:

 

注意:如果字符串不是unicode编码的会出错。可以预先判定一下:

 


Function .decode():

函数签名:.decode([encoding], [errors])将字符串本身。 将encoding指定的编码转换成unicode编码字符串。例:

 

Function :

repr函数用来取得对象的规范字符串表示。

 

文件处理

模块 Codec

使用codec模块提供了对应于标准文件库的一系列操作。例:

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值