python逐个遍历字符串(含汉字)

最新推荐文章于 2024-10-04 22:50:02 发布

曹显顺

最新推荐文章于 2024-10-04 22:50:02 发布

阅读量2.2w

点赞数 3

分类专栏：编程相关文章标签： json 遍历

编程相关专栏收录该内容

10 篇文章 0 订阅

订阅专栏

s = "中国china"
for j in s:
    print j

首先一个，你这个’a’是什么编码？可能不是你所想的gbk

>>> a='中国'
>>> a

这样试试看，如果出来是6个字（word)，说明是utf-8，如果是4个字，说明gbk。
另外，不管是utf-8还是gbk，都不能这样遍历，因为这里它会一个字一个字拿出来。虚拟机把a当成一个长度为len(a)的字符串了。
接下来是遍历问题。
linux的shell大都默认是utf-8，所以一个中文字符是三个字，所以要三个三个地读，你可以试下：

>>> a[:3]

出来就是个”中”字
windows的command的默认是cp936，也就是gbk，一个中文字符是两个字，所以两个字两个字地读(a[:2])。

还有另一种遍历的方法，把字符串转换成unicode，这样中文英文都是一个字，就可以用你的for i in a的方法遍历了。这个的好处是中文英文字符都是一个字，而utf-8和gbk里，英文字母只占一个字。

s = u"中国china"
for j in s:
    print j

输出如下：

中
国
c
h
i
n
a

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。