python 中文编码问题

最新推荐文章于 2024-04-02 13:34:14 发布

13vickey

最新推荐文章于 2024-04-02 13:34:14 发布

阅读量419

点赞数

分类专栏：操作系统

操作系统专栏收录该内容

6 篇文章 0 订阅

订阅专栏

转载

http://my.oschina.net/leejun2005/blog/74430

总结：

1）

前缀“u”表示“后面这个字符串“是一个Unicode字符串”，这仅仅是一个声明，并不表示这个字符串就真的是Unicode了；就好比某正太声称自己已满18岁，但实际上他的真实年龄并不确定，现在体育界年龄造假可不稀罕幺!
那么声明成u有什么作用呢？对于Python来说，只要你声明某字符串是Unicode，它就会用Unicode的一套机制对它进行处理。比方说，做字符串操作的时候会动用到内部的Unicode处理函数，保存的时候以Unicode字符（双字节）进行保存。等等。显而易见，对于一个实际上并不是Unicode的字符串，做Unicode动作的处理，是有可能会出问题的。 u前缀只适用于你的字符串常量真的是Unicode的情况

2）

用python处理在处理中文的时候需要注意一些问题。比如：

>>> a = "我是一个中国人"
>>> print a[0:2]
我
>>> print a[0];
Î （只能输出“我”字的前半部分）

。像这样：
c = unicode(a, "gb2312")
print c[0]
这个时候c的下标对应的就是每一个字符，不再是字节，并且通过len(c)就可以获得字符数！还可以很方便的转换为其他编码，比如转换为utf-8：

d = c.encode("utf-8")

未完

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 中文编码问题

转载http://my.oschina.net/leejun2005/blog/74430总结：1）前缀“u”表示“后面这个字符串“是一个Unicode字符串”，这仅仅是一个声明，并不表示这个字符串就真的是Unicode了；就好比某正太声称自己已满18岁，但实际上他的真实年龄并不确定，现在体育界年龄造假可不稀罕幺! 那么声明成u有什么作用呢？对于Python来说，只要你
复制链接

扫一扫

专栏目录

13vickey CSDN认证博客专家 CSDN认证企业博客

码龄11年

129: 原创

76万+: 周排名

180万+: 总排名

13万+: 访问

: 等级

2346: 积分

8: 粉丝

5: 获赞

15: 评论

32: 收藏

私信

关注

热门文章

分类专栏

unix 命令 3篇
操作系统 6篇
搜索 11篇
DP 27篇
贪心 6篇
二分法 8篇
数学 28篇
CF题解报告 8篇
STL 9篇
KMP 6篇
图论 11篇
并查集 4篇
线段树 4篇
博弈论 3篇
Android开发 2篇
python学习 2篇

最新评论

python 网络编程 openurl [errno 10060]
2014乘风破浪2014: 博主你好，请问proxy具体值如何设置？新手，问题比较低级，望回复。
CF contest/382/B. Number Busters
dy51842518: 好吧当b'等于0时有最小值谢谢神解
CF contest/382/B. Number Busters
dy51842518: 还是不懂，为什么b' = b-tx+nw; a' = a-n; 使得b' = 0时解出n，代入 a ' = a - (tx-b)/w呢？为什么要使得b‘ == 0呢？
CF contest/382/B. Number Busters
dy51842518: 还是不懂，为什么b' = b-tx+nw; a' = a-n; 使得b' = 0时解出n，代入 a ' = a - (tx-b)/w呢？为什么要使得b‘ == 0呢？
POJ 3254 Corn Fields
13vickey 回复 foreverlxm: 嘻嘻，前天已更正~~当时写注释的时候按了一下 enter

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。