爬虫
文章平均质量分 79
Emperor_Dandy
烧锅炉
展开
-
Python爬虫练习之二:抓取游民星空搞笑动态图文章链接
一、分析网站 游民星空的趣图网站为:http://www.gamersky.com/ent/qw/ 点击下一页可以拉取到数据,但是网址未发生变化,查看Network标签,可以看到实际上进行了ajax请求, 可以看到url地址是另外一个,而且get方法传递了参数: 其中jsondata中的page参数就是跳转的页数,改变它,就可原创 2017-12-27 13:57:34 · 6731 阅读 · 0 评论 -
Python爬虫:最正确的入门姿势
前言 一提到Python爬虫,人人都想使用知名框架Beautiful Soup或是Scrapy,新手贸然进入,必是学的云里雾里,即使能够爬到数据,也根本不知其所以然! 想学习爬虫,html5 tag , ajax,get,post是绕不过的,但是并不需要一开始就完全掌握。当你需要使用到时去网上学习即可! 开始 爬虫的第一步,必须要根据一个明确的url从目标服务器,把html页面代码下载原创 2018-01-16 17:25:55 · 16594 阅读 · 0 评论 -
Python爬虫练习之三:抓取游民星空搞笑动态图
一、分析页码 在http://www.gamersky.com/ent/201712/995687.shtml ,中点击下一页,可以发现页面url地址发生了变化: 为http://www.gamersky.com/ent/201712/995687_2.shtml,多了一个下划线加页面数字。 尝试将2改为1:http://www.gamersky.com/ent/201712/995687_原创 2017-12-27 14:50:24 · 4691 阅读 · 0 评论