一起学习集搜客网络爬
文章平均质量分 52
fullerhua
网络爬虫GooSeeker.com创始人,数据挖掘和数据获取社区经营
展开
-
【00】why集搜客网络爬虫?
与各种大企业相比,大数据对于没有数据资源的个体而言是奢侈品。然而在“互联网思维”、“互联网+”引领下,我们应当勇于实践和颠覆传统,将数据平民化。原创 2016-09-09 11:44:48 · 715 阅读 · 0 评论 -
【01】基础:集搜客爬虫软件安装
前言漫漫网页数据大海洋,有一种数据搬运工的生物存在,他可能是数据分析师、也可能是爬虫工程师、也可能是业务员…等等。原创 2016-09-09 11:51:49 · 1947 阅读 · 0 评论 -
【02】基础:单页采集(以微博博主主页采集为例)
请先安装爬虫软件。爬虫软件安装前言今天讲讲微博博主主页的采集。 目标是采集博主名称、微博内容、发博日期、微博内容、转发数、评论数和点赞数。原创 2016-09-09 12:07:09 · 1031 阅读 · 0 评论 -
【03】基础:同种网页结构套用采集规则
爬虫软件安装经过上个教程小试牛刀之后就可以尝到获得数据的喜悦了。如果要采集其他博主主页的微博,是要重新做过规则吗?非也~原创 2016-09-22 17:04:05 · 850 阅读 · 0 评论 -
【04】基础:将采集结果转成Excel
前面的教程说了,数据抓取完毕之后,数据以xml格式的形式存储在本地文件夹中。下面简单地说一下如何将保存在本地的XML文件转成Excel格式原创 2016-09-22 17:13:41 · 1844 阅读 · 0 评论