八爪鱼采集器是一款全网通用的互联网数据采集器,模拟人浏览网页的行为,通过简单的页面点选,生成自动化的采集流程,从而将网页数据转化为结构化数据,存储于EXCEL或数据库等多种形式。
1 Window端安装教程
下载链接:https://www.bazhuayu.com/download/windows
- 双击文件夹下Octopus Setup 8.6.4.exe文件,开始安装
- 安装完成后,在开始菜单或桌面上找到八爪鱼采集器快捷方式
- 启动八爪鱼采集器,使用您的账号登录(还没有账号?点击免费注册)
2新闻文本数据采集
网址:北青网https://www.toutiao.com/c/user/token/MS4wLjABAAAAkBInTefEXGPcS0avMIcyzcyDIb8T8hL6gUlrrWDJxIw/?source=profile&tab=article
![](https://i-blog.csdnimg.cn/blog_migrate/5b6d0de8e2369184de21969d4baa7e2c.png)
![](https://i-blog.csdnimg.cn/blog_migrate/80fb184eeaec15da2f401e924e26ce04.png)
![](https://i-blog.csdnimg.cn/blog_migrate/b9712ce6c882451c86c19759c9b2e0a9.png)
![](https://i-blog.csdnimg.cn/blog_migrate/487e0ca78353300d42b55fef6882d838.png)
![](https://i-blog.csdnimg.cn/blog_migrate/edf3f0f7131baf6472bdb92bd9bbf757.png)
![](https://i-blog.csdnimg.cn/blog_migrate/713876512b771c56a2d396c40b54caf7.png)
![](https://i-blog.csdnimg.cn/blog_migrate/6602737f9c016787ce6988288377427b.png)
![](https://i-blog.csdnimg.cn/blog_migrate/13726c9fd9f05416ad12f27df7373019.png)
![](https://i-blog.csdnimg.cn/blog_migrate/272fac25bbc3b47441327b59a3a5f8c4.png)
![](https://i-blog.csdnimg.cn/blog_migrate/4e8d1304621206f6359a1ea14dd73785.png)
![](https://i-blog.csdnimg.cn/blog_migrate/c2bcfc28f3274dc80f1fcbc496414ade.png)
![](https://i-blog.csdnimg.cn/blog_migrate/cbac58e03565a40fcc979bb0d62b2879.png)
![](https://i-blog.csdnimg.cn/blog_migrate/4c4e70ae15c52c9ac7383415db502cb0.png)
![](https://i-blog.csdnimg.cn/blog_migrate/6e58c8f382cfd93defcdf15d2b1a8b6a.png)
![](https://i-blog.csdnimg.cn/blog_migrate/07207b0c8c3d2a99a16c33aa382a3107.png)
注:全班一起用八爪鱼进行数据采集,会导致IP地址被封,因为实训室的出口是同一个IP。