各位小伙伴们大家好~欢迎大家进入正式的后羿采集器使用教程。今天是第一天,主要的任务是帮助大家认识后羿采集器的一些功能,介绍一些和爬虫有关的知识,同时小小的实战一下爬虫。
还没有下载后羿的小伙伴可以“http://www.houyicaiji.com/?type=download”在这个网站下载~
接下来教程正式开始!多图预警!!!
下载安装好之后大家的界面应该就是这样的~首先呢第一件事和平时使用所有软件一样,先注册登录一下,否则我们将无法进行后续操作。注册登录的流程很简单,相信大家都会。
![e0a62b83db0df4d095835d109df68952.png](https://i-blog.csdnimg.cn/blog_migrate/da39ae7e3f052a4cb944265129768045.jpeg)
当我们注册、登录好了之后,这里会显示我们的账户和套餐,因为咱们没有付费购买会员,所以大家都是免费套餐。不过大家不用怕,咱们普通人确实不用买会员!!!直接用就完事儿了~下面有两个分类标签栏,类似于手机QQ分组一样,用来存储你所设计的任务。
当然还可以新建别的标签栏,起别的名字。这个我们就不详细介绍了,相信大家随便摸索一下,就能懂~
![604bc4cd3933846a7d52f939577053c6.png](https://i-blog.csdnimg.cn/blog_migrate/e24fb848ab8e18a579bc7d57eb6f36d6.jpeg)
需要注意的是这个示例这里他给出了一些采集的模板,大家也可以看看参考一下。如果有想采集的类似的需求,只需要稍稍改动一下就可以用啦~
![83fa609236a191d7ddf5183bd4a328fd.png](https://i-blog.csdnimg.cn/blog_migrate/c495452eda745285a11b9d543b479eb5.jpeg)
比如说我现在想采集豆瓣上面《蜘蛛侠之英雄远征》的影评来决定我要不要去电影院看这部电影,但是现在刚好有一个复仇者联盟的影评采集模板,我就可以直接拿来用。
首先呢我们双击一下这个左侧采集复仇者联盟的这个任务,会发现右侧这里展示了豆瓣影评的页面,大家点击的时候右侧可能会稍微加载一会,大家不要着急,稍等一下就好。
![f2d5e851443c34688d638c377ac3c986.png](https://i-blog.csdnimg.cn/blog_migrate/824506e5aeebe59f787dc9f28608b611.jpeg)
等他加载好之后我们可以看到,这个页面就和我们自己在豆瓣上浏览的影评页面一模一样(这是当然啦~因为采集就是把固定的页面数据拿下来嘛。)
所以接下来我们需要做的就是,把这个页面替换成《蜘蛛侠:英雄远征》的页面,也就是更改采集任务的url地址为《蜘蛛侠:英雄远征》的url地址。
这个是我们去豆瓣上自己搜索到的页面,大家对比一下可以发现,和上面复仇者联盟的采集页面几乎完全一致。(只有页面布局一致时才可以替换url,也就是说只有目标需求一致时才能替换)
![c8f17322c20dd72ca96dfdf3eb28aefb.png](https://i-blog.csdnimg.cn/blog_migrate/67a8b6190ebaf6a059660dc2de200f8e.jpeg)
然后我们复制地址栏的url https://movie.douban.com/subject/26931786/comments?status=P ,接下来的任务就是修改目标地址啦~
![ef0ab4fecf1652e729d7931b67a4b990.png](https://i-blog.csdnimg.cn/blog_migrate/33782b56ad32b0c324bffbfba6077c12.jpeg)
大家只需要点击这个 导航栏右侧的“笔”,在弹出的新的页面里更改地址,点击确定地址就修改好啦~
![10d8a6a85b8d4b5731137db1222da775.png](https://i-blog.csdnimg.cn/blog_migrate/8d464a04cd1f2ebe018c9b1b31215fa5.jpeg)
大家可以看到,我们右侧的区域也已经改变了,变成我们要采集的《蜘蛛侠:英雄远征》的页面了。此时呢,我们只需要点击右下角的“开始采集”按钮,就可以自动采集啦~
![a5dd67654e19985d6a735e04be18cec8.png](https://i-blog.csdnimg.cn/blog_migrate/c5c49f22ec1ba4cb1ef53e3fa89e6beb.jpeg)
刚启动没3秒就采集了49条数据啦!是不是很强大呢?
![3cca736cbc2c89e587d030bb5d63abfa.png](https://i-blog.csdnimg.cn/blog_migrate/129991584275f529eca4d446f0bb5332.jpeg)
由于只是给大家测试,我就不多采集了,167条就够啦,点击一下停止按钮,就出出现这个弹窗,大家想导出就直接导出,不想导出,点击稍后就好。
![780385790a24df144f5a0d3de22874a6.png](https://i-blog.csdnimg.cn/blog_migrate/222fc1aa429c32bbdbc36f7df9455349.jpeg)
这个就是我刚刚不到一分钟采集到的数据,哈哈哈根据网友们的评价看来《蜘蛛侠:英雄远征》是一个值得去电影院看的片子。哈哈哈哈下午就去看!
![1bbd14b49bd3f000a7ecab3b193348fa.png](https://i-blog.csdnimg.cn/blog_migrate/09a8bdde5298064e46fcac1f480f9967.jpeg)
好啦~今天的教程就到此结束啦,感谢大家的阅读,采集实例模板除了可以快速帮大家采集需求类似的项目外, 还可以用来学习如何制作自己的模板哦~更多更有趣的教程明天再给大家介绍啦~希望大家能一直关注后羿和我哦!每日一更,大家觉得有帮助的话点个赞哦~使用后羿不懂的地方可以加我QQ/微信:1161678627 哦~
![ac2e3f1c6939b7fd27f51c01dd2ba551.png](https://i-blog.csdnimg.cn/blog_migrate/1c8017e33c699c700a60751020b413cd.jpeg)