自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

一只小菜鸟在学飞︿( ̄︶ ̄)︿

欢迎各位批评指教、投食引导O(∩_∩)O~~

  • 博客(3)
  • 资源 (1)
  • 收藏
  • 关注

原创 python爬取返利网(完善)

哈哈,要做勤劳的小蜜蜂~ 上一篇返利网并没有爬好 http://blog.csdn.net/tt_258/article/details/50300643 在高人的指点下,我又回来了,下面是改后的代码: #coding=utf-8 import urllib2 from bs4 import BeautifulSoup import time class FLW(): def __i

2015-12-17 21:39:14 1050

原创 python爬取返利网

最近一段时间试着爬取了返利网的【今日值得买网页】http://zhide.fanli.com/p1?spm=global.pc.buid-todayworth 1、找到源代码: 首先返利网的网页是动态的,一个网页共有50个商品,平均每次加载5个,因为之前有爬过网易,所以以为它网页与网易一样是json加载,然而当用一样的方法找时并没有找到,无奈只好把每个类型都试一下,最后发现了是XHR类型的,如

2015-12-14 21:17:23 1225

原创 python爬取网易评论

最近学习了json模块,并用它爬取了网易的评论。 1、首先获取json格式的文件,我用的是360浏览器(貌似用谷歌比较好,但我谷歌出了点问题所以用的360,不过没啥影响) 打开评论的网页

2015-12-09 20:08:16 1272 1

数据预处理简单认识

对数据预处理的大概认识

2017-05-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除