- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 python爬取返利网(完善)
哈哈,要做勤劳的小蜜蜂~上一篇返利网并没有爬好 http://blog.csdn.net/tt_258/article/details/50300643在高人的指点下,我又回来了,下面是改后的代码:#coding=utf-8import urllib2from bs4 import BeautifulSoupimport timeclass FLW(): def __i
2015-12-17 21:39:14 1052
原创 python爬取返利网
最近一段时间试着爬取了返利网的【今日值得买网页】http://zhide.fanli.com/p1?spm=global.pc.buid-todayworth1、找到源代码:首先返利网的网页是动态的,一个网页共有50个商品,平均每次加载5个,因为之前有爬过网易,所以以为它网页与网易一样是json加载,然而当用一样的方法找时并没有找到,无奈只好把每个类型都试一下,最后发现了是XHR类型的,如
2015-12-14 21:17:23 1228
原创 python爬取网易评论
最近学习了json模块,并用它爬取了网易的评论。1、首先获取json格式的文件,我用的是360浏览器(貌似用谷歌比较好,但我谷歌出了点问题所以用的360,不过没啥影响)打开评论的网页
2015-12-09 20:08:16 1274 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人