Python split 分割中文

str8="中国 和 韩国 的区别"
# a=str8.find("Python")
# print a
b=str8.find("")
print b
word=str8.split(" ")         #Python3 和Spark 这里可以直接正确分割中文
print word
for i in word:               #python 2.x 需要这样输出
    print i

#这是关于编码的问题
# print "-"*50
# data=str8.decode("utf-8").encode("gb2312")
# print type(data)
# data2=data.decode("gb2312")
# print type(data2)
# print data2.split(u" ")
# data3=data2.encode("utf-8").split(" ")
# print data3
# for i in data3:
#     print i

结果:

7

['\xe4\xb8\xad\xe5\x9b\xbd', '\xe5\x92\x8c', '\xe9\x9f\xa9\xe5\x9b\xbd', '\xe7\x9a\x84\xe5\x8c\xba\xe5\x88\xab']
中国

韩国
的区别
--------------------------------------------------
<type 'str'>
<type 'unicode'>
[u'\u4e2d\u56fd', u'\u548c', u'\u97e9\u56fd', u'\u7684\u533a\u522b']
['\xe4\xb8\xad\xe5\x9b\xbd', '\xe5\x92\x8c', '\xe9\x9f\xa9\xe5\x9b\xbd', '\xe7\x9a\x84\xe5\x8c\xba\xe5\x88\xab']
中国

韩国
的区别


转载于:https://www.cnblogs.com/soyo/p/8157505.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值