- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 Re:从零开始的程序猿生活
2016年农历新年的晚上,窗外的比往日更加浓重的雾霾给春节增添了更多的祥和气氛。在这美好的氛围里,我在自己的小屋里研究一个困扰了我很多天的问题——为啥我的POST表单提交不了数据!?讲解资料看了一篇又一篇,Apache配置文件检查了一遍又一遍,最后甚至把极客学院老师的Demo下载下来,仍然传不了。那是我大二的寒假,在对网站开发毫无经验、数据库知识一知半解的情况下,强行接了俱乐部老师安排的开发学院实验
2016-12-29 19:50:46 2147 3
原创 Python爬虫爬取动态页面思路+实例(二)
注意:Selenium+PhantomJS已成历史,看官看完本文后不妨再浏览一下震惊!Selenium分手PhantomJS简介上篇Python爬虫爬取动态页面思路+实例(一)提到,爬取动态页面有两种方法分析页面请求selenium模拟浏览器行为(这篇介绍这个)理论上来讲,这种方法可以应对各种动态加载,因为模拟人的行为嘛,如果人自己用浏览器来看网页都加载不出数据来,这...
2016-12-29 11:07:39 31339 6
原创 Python爬虫爬取动态页面思路+实例(一)
简介有时候,我们天真无邪的使用urllib库或Scrapy下载HTML网页时会发现,我们要提取的网页元素并不在我们下载到的HTML之中,尽管它们在浏览器里看起来唾手可得。这说明我们想要的元素是在我们的某些操作下通过js事件动态生成的。举个例子,我们在刷QQ空间或者微博评论的时候,一直往下刷,网页越来越长,内容越来越多,就是这个让人又爱又恨的动态加载。爬取动态页面目前来说有两种方法分析页面请求(这篇
2016-12-21 17:48:06 130244 48
基于Redis的布隆过滤器
2017-04-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人