爬虫
惊醒幡然1
这个作者很懒,什么都没留下…
展开
-
豆瓣电影爬虫
python豆瓣电影爬虫爬取网址:https://movie.douban.com/tag/#/?sort=U&range=0,10&tags=美国我们爬取的内容为文本,爬取前我们需要进行网页的分析如图所示:我们可以看到我们的主要爬取数据存储在响应的其中一个页面中具体怎么查看和分析目前不做介绍了。# coding=utf-8from parse import pars...原创 2019-04-14 09:59:39 · 1006 阅读 · 0 评论 -
糗事百科爬虫
python糗事百科爬虫爬取url:https://www.qiushibaike.com/hot/此网页爬取分析时选取网页特定元素进行爬取,需了解xpath的用法和lxml库的用法# coding=utf-8from lxml import etreeimport requestsimport jsonclass QiubaiSpider: def __init__...原创 2019-04-14 10:39:04 · 352 阅读 · 0 评论