- 博客(3)
- 收藏
- 关注
原创 使用Thymeleaf模板生成静态页面
引入gradle依赖build.gradle文件中,添加dependencies { compile('org.springframework.boot:spring-boot-starter-thymeleaf') compile('net.sourceforge.nekohtml:nekohtml:1.9.22')}如果能保证网页完全是复合html5规范,nekohtml可以不使...
2018-07-11 09:32:21 7131 2
原创 Cannot find class [] for bean with name '' defined in class path resource
[ERROR] [12:32:01] org.springframework.web.servlet.DispatcherServlet - Context initialization failedorg.springframework.beans.factory.BeanCreationException: Error creating bean with name 'shiroFilter'...
2018-06-05 13:19:58 5964 1
原创 赶工情况下的爬虫业务逻辑
最近在实现爬虫抓取新闻网站。使用Spring Batch来管理定时和跑批任务。从《自己动手写网络爬虫》学习了大量的理论和实践知识。1、目前痛点1)客户给定了16个网址,我们还只支持到7个。2)客户对每个网址,要求抓取的内容栏目有多个,而我们只抓取了一个。3)新闻发布时间未抓取到,反而将抓取时间作为了新闻发布时间,导致客户几乎找不到指定的新闻。4)新闻内容只能抓取正文,无法控制表格、图片、视频、音频...
2018-06-05 10:04:13 354
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人