python中字符串中文乱码_Stephen的SEM博客

如果一个中文数组

keys=[“武汉酒店”,”上海酒店”,”北京酒店”,”广州酒店”,”海南酒店”,”三亚酒店”]

打印单个元素的时候还可以

print keys[0]

武汉

但要打印整个数组的时候

print keys

[‘\xce\xe4\xba\xba\xbe\xc6\xb5\xea’, ‘\xc9\xcf\xba\xa3\xbe\xc6\xb5\xea’, ‘\xb1\xb1\xbe\xa9\xbe\xc6\xb5\xea’, ‘\xb9\xe3\xd6\xdd\xbe\xc6\xb5\xea’, ‘\xba\xa3\xc4\xcf\xbe\xc6\xb5\xea’, ‘\xc8\xfd\xd1\xc7\xbe\xc6\xb5\xea’]

就是乱码了

如果我像打印出 中文的数组这个是没法的

又因为decode只能作用在string字符串上

所以把在python中把数组转为字符串 然后再每个数据元素加一个换行符

通过split的逆方法就可以了

也就是join

“SperateCode”.join(listarray) 可以得到一个字符串

图中就是”\n”.join(keys) 就可以得到一个每个城市一行的数组

武汉酒店

上海酒店

北京酒店

广州酒店

海南酒店

三亚酒店

如果打印数组中元素的时候也是乱码

print keys[0]

一共3中

指定解码

beautifulsoup html参数后加from_encoding=””

如果要知道网站编码就用html.original_encoding 就可以知道

然后再strings.encode(“”)

就可以

beautifuouspu(html,from_encoding=”gbk”

code=soup.original_encoding

print  soup.title.get_text().encode(code)

如果一个中文数组

keys=[“武汉酒店”,”上海酒店”,”北京酒店”,”广州酒店”,”海南酒店”,”三亚酒店”]

打印单个元素的时候还可以

print keys[0]

武汉

但要打印整个数组的时候

print keys

[‘\xce\xe4\xba\xba\xbe\xc6\xb5\xea’, ‘\xc9\xcf\xba\xa3\xbe\xc6\xb5\xea’, ‘\xb1\xb1\xbe\xa9\xbe\xc6\xb5\xea’, ‘\xb9\xe3\xd6\xdd\xbe\xc6\xb5\xea’, ‘\xba\xa3\xc4\xcf\xbe\xc6\xb5\xea’, ‘\xc8\xfd\xd1\xc7\xbe\xc6\xb5\xea’]

就是乱码了

如果我像打印出 中文的数组这个是没法的

又因为decode只能作用在string字符串上

所以把在python中把数组转为字符串 然后再每个数据元素加一个换行符

通过split的逆方法就可以了

也就是join

“SperateCode”.join(listarray) 可以得到一个字符串

图中就是”\n”.join(keys) 就可以得到一个每个城市一行的数组

武汉酒店

上海酒店

北京酒店

广州酒店

海南酒店

三亚酒店

如果打印数组中元素的时候也是乱码

print keys[0]

一共3中

指定解码

beautifulsoup html参数后加from_encoding=””

如果要知道网站编码就用html.original_encoding 就可以知道

然后再strings.encode(“”)

就可以

beautifuouspu(html,from_encoding=”gbk”

code=soup.original_encoding

print  soup.title.get_text().encode(code)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值