spider
rico_zhou
个人博客:https://www.rzspider.top/rzblog
展开
-
使用爬虫框架htmlunit整合springboot不兼容的一个问题
使用爬虫框架htmlunit整合springboot不兼容的一个问题本来使用htmlunit爬虫爬取数据非常正常好用,之前一直是直接java程序或者整合Javaswing界面,都没有问题,但是后来整合springboot变成BS架构之后,同样的代码却报错,报错信息如下:这个错误很常见,网上搜索得到的答案也千篇一律,就是解决动态网页的获取问题,添加对js的支持,但是我的代码单独运...原创 2018-07-30 14:04:01 · 1724 阅读 · 0 评论 -
博客搬家系列(八)-总结
博客搬家系列(八)-总结原创 2018-11-01 14:12:41 · 302 阅读 · 0 评论 -
博客搬家系列(七)-本地WORD文档转HTML
博客搬家系列(七)-本地WORD文档转HTML原创 2018-11-01 14:11:25 · 298 阅读 · 0 评论 -
博客搬家系列(六)-爬取今日头条文章
博客搬家系列(六)-爬取今日头条文章一.前情回顾 博客搬家系列(一)-简介:https://blog.csdn.net/rico_zhou/article/details/83619152 博客搬家系列(二)-爬取CSDN博客:https://blog.csdn.net/rico_zhou/article/details/83619509 博客搬家系列(三)-爬取博客园博客:htt...原创 2018-11-01 14:10:58 · 4228 阅读 · 0 评论 -
博客搬家系列(五)-爬取开源中国博客
博客搬家系列(五)-爬取开源中国博客一.前情回顾 博客搬家系列(一)-简介:https://blog.csdn.net/rico_zhou/article/details/83619152 博客搬家系列(二)-爬取CSDN博客:https://blog.csdn.net/rico_zhou/article/details/83619509 博客搬家系列(三)-爬取博客园博客:ht...原创 2018-11-01 14:10:30 · 530 阅读 · 1 评论 -
博客搬家系列(四)-爬取简书文章
博客搬家系列(四)-爬取简书文章一.前情回顾 博客搬家系列(一)-简介:https://blog.csdn.net/rico_zhou/article/details/83619152 博客搬家系列(二)-爬取CSDN博客:https://blog.csdn.net/rico_zhou/article/details/83619509 博客搬家系列(三)-爬取博客园博客:http...原创 2018-11-01 14:09:19 · 531 阅读 · 0 评论 -
博客搬家系列(三)-爬取博客园博客
博客搬家系列(三)-爬取博客园博客一.前情回顾 博客搬家系列(一)-简介:https://blog.csdn.net/rico_zhou/article/details/83619152 博客搬家系列(二)-爬取CSDN博客:https://blog.csdn.net/rico_zhou/article/details/83619509 博客搬家系列(四)-爬取简书文章:https...原创 2018-11-01 14:08:50 · 705 阅读 · 4 评论 -
博客搬家系列(二)-爬取CSDN博客
博客搬家系列(二)-爬取CSDN博客一.前情回顾 博客搬家系列(一)-简介:https://blog.csdn.net/rico_zhou/article/details/83619152 博客搬家系列(三)-爬取博客园博客:https://blog.csdn.net/rico_zhou/article/details/83619525 博客搬家系列(四)-爬取简书文章:https...原创 2018-11-01 14:08:07 · 686 阅读 · 0 评论 -
博客搬家系列(一)-简介
这个功能思来想去想了很久,终于实现了基本功能,自己基于别人的后台权限管理系统写了一个博客系统,其实博客系统只是一小部分,但今天只讲博客部分,其他详见:RZSpider详见:https://blog.csdn.net/rico_zhou/article/details/83618255 https://www.rzspider.top U:testadmin P:testad...原创 2018-11-01 14:13:01 · 2023 阅读 · 2 评论 -
Springboot项目RZSpider3.3.8版本发布-网页爬虫后台管理
一.项目介绍此项目建立在开源项目bootdo和若依系统基础上,如有侵权请及时与我联系,其详情请见:https://gitee.com/lcg0124/bootdo.git,https://gitee.com/y_project/RuoYi Springboot作为基础框架,使用mybatis作为持久层框架,使用官方推荐的thymeleaf做为模板引擎,shiro作为安全框架详情请见:htt...原创 2018-11-01 12:13:09 · 1010 阅读 · 1 评论 -
(终于找到了获取有效_signature的方法)博客搬家系列(六)-爬取今日头条文章(二)
(终于找到了获取有效_signature的方法)博客搬家系列(六)-爬取今日头条文章(二)一.前情回顾博客搬家系列(六)-爬取今日头条文章:https://blog.csdn.net/rico_zhou/article/details/83619564上回我们说到了使用java htmlunit爬取今日头条的文章列表难度很大,关键在于_signature这个参数的加密算法,经过百度查询...原创 2018-11-02 14:14:31 · 14973 阅读 · 1 评论