![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python爬虫
five_east_west
这个作者很懒,什么都没留下…
展开
-
爬虫爬取微博文字内容——Ajax动态渲染文件的抓取
Ajax动态分析待抓取的微博内容:准备工作:安装好 requests 库、lxml 库在cmd 中输入pip install requestspip install lxml因为我之前已经安装好这两个库,所以在此安装的时候是显示的下图的内容:分析网页 打开Chrome浏览器,我们进入这个网站:。按 F12 打开开发者模式。...原创 2020-09-22 11:44:42 · 1343 阅读 · 0 评论 -
解决python爬虫中返回的html中“\u6559”的问题
这个网站返回的html代码中都是这样以“\u"开头解决办法:python3的解决办法:字符串.encode(‘utf-8’).decode(‘unicode_escape’)python2:字符串.decode(‘unicode_escape’)原创 2020-09-16 16:54:34 · 1066 阅读 · 0 评论