爬虫
BinaryCSharp
这个作者很懒,什么都没留下…
展开
-
ubuntu 安装 pyspider
说明 pyspider 是 python 语言的一个爬虫工具,提供有GUI界面,可以在web界面中制定任务、爬取数据和导出结果。由于刚开始接触,无法介绍太多,以上是根据安装过程中看到的一些资料的整体印象。 如果你用的是 ubuntu 14.0.4 等低版本的 Linux 系统,系统自带的 python 可能不是最新版(如 2.7.6 ),这时,一定不要更换国内源,否则安装过程中会有一堆原创 2017-03-18 10:40:18 · 2684 阅读 · 0 评论 -
解决 pyspider的 css_selector_helper 无法使用
说明 本文针对正常安装 pyspider 后无法使用 css_selector_helper 的问题进行解决,可能不适合所有情况,但大部分情况是如此的。问题分析无法使用 css_selector_helper打开浏览器开发者工具,发现网络标签中存在ERR_TIME_OUT …… css_selector_helper.js的问题,说明css_selector_helper.js加载超时;原创 2017-03-18 12:05:24 · 2941 阅读 · 0 评论 -
pyspider 爬虫教程(一):HTML 和 CSS 选择器
原文链接: https://binux.blog/2015/01/pyspider-tutorial-level-1-html-and-css-selector/虽然以前写过 如何抓取WEB页面 和 如何从 WEB 页面中提取信息。但是感觉还是需要一篇 step by step 的教程,不然没有一个总体的认识。不过,没想到这个教程居然会变成一篇译文,在这个爬虫教程系列文章中转载 2017-03-18 22:01:12 · 1577 阅读 · 0 评论