2015年12月_小刀砸儿

12月 11月

原创 python爬取返利网（完善）

哈哈，要做勤劳的小蜜蜂~上一篇返利网并没有爬好 http://blog.csdn.net/tt_258/article/details/50300643在高人的指点下，我又回来了，下面是改后的代码：#coding=utf-8import urllib2from bs4 import BeautifulSoupimport timeclass FLW(): def __i

2015-12-17 21:39:14 1052

原创 python爬取返利网

最近一段时间试着爬取了返利网的【今日值得买网页】http://zhide.fanli.com/p1?spm=global.pc.buid-todayworth1、找到源代码：首先返利网的网页是动态的，一个网页共有50个商品，平均每次加载5个，因为之前有爬过网易，所以以为它网页与网易一样是json加载，然而当用一样的方法找时并没有找到，无奈只好把每个类型都试一下，最后发现了是XHR类型的，如

2015-12-14 21:17:23 1228

原创 python爬取网易评论

最近学习了json模块，并用它爬取了网易的评论。1、首先获取json格式的文件，我用的是360浏览器（貌似用谷歌比较好，但我谷歌出了点问题所以用的360，不过没啥影响）打开评论的网页

2015-12-09 20:08:16 1274 1

数据预处理简单认识

对数据预处理的大概认识

2017-05-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人