python 编码问题

详解 python 中文编码与处理

源代码文件中,如果有用到非ASCII字符,则需要在文件头部进行字符编码的声明
# -- coding: utf-8 --

str和unicode介绍

str和unicode都是basestring的子类 str其实是字节串 unicode才是真正的字符串
这里写图片描述

编码转换详解

可以将unicode理解为普通话, 其他编码理解为方言. 大家都理解听懂普通话,不一定听懂方言. 因此unicode必然成为中间编码. 即先将其他编码的字符串解码 (decode)成unicode,再从unicode编码(encode)成另一种编码
decode的作用是将其他编码的字符串转换成unicode编码,如 str1.decode(‘gb2312’),表示将gb2312编码的字符串转换成unicode编码
encode的作用是将unicode编码转换成其他编码的字符串,如 str2.encode(‘gb2312’),表示将unicode编码的字符串转换成gb2312编码。

博客来源: http://blog.csdn.net/juanjuel

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值