python爬虫脚本ie=utf-8_菜鸟Python网络爬虫网页编码utf-8十六进制问题不解

最新推荐文章于 2024-02-25 23:30:39 发布

一起来读英文原版

最新推荐文章于 2024-02-25 23:30:39 发布

阅读量271

点赞数

文章标签： python爬虫脚本ie=utf-8

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_30191159/article/details/113672763

版权

学习python网络爬虫，爬豆瓣网(网页编码我看了，是utf-8)的时候，出现爬下来的是十六进制

对python内部的编码感觉有点凌乱啊...

我之后发现了问题的所在：

当我创建一个s=["逢坂大河","新垣结衣"]

print s

得到的是ascii编码["ascii值","ascci值"]

我要输出其中的内容，只能用print s[0]，或者for i in s: print i 么？

coding:utf-8

变量声明下就好了

Python2 里面好像要在脚本最前面加上 #coding:utf-8 才能 print 出来汉字吧～

这不是乱码啊。

require.read().decode('gbk')或者require.read().decode('utf-8')

这不是中文乱码，而是最基本的字符编码方式的一种。搞懂基本的字符编码吧

仔细看这个字符编码

我用的beautifulsoup，soup.title.string.encode('ISO-8859-1').decode('gbk')

用codecs可以解决吧

class AAAAA(object):def __init__(self):

self.file = codecs.open('result.json','w',encoding = 'utf-8')

差不多这样的思路

玩蛇网文章，转载请注明出处和文章网址：https://www.iplaypy.com/wenda/wd19504.html

相关文章 Recommend

一起来读英文原版

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python爬虫脚本ie=utf-8_菜鸟Python网络爬虫网页编码utf-8十六进制问题不解

学习python网络爬虫，爬豆瓣网(网页编码我看了，是utf-8)的时候，出现爬下来的是十六进制对python内部的编码感觉有点凌乱啊...我之后发现了问题的所在：当我创建一个s=["逢坂大河","新垣结衣"]print s得到的是ascii编码["ascii值","ascci值"]我要输出其中的内容，只能用print s[0]，或者for i in s: print i 么？coding:utf...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。