- 博客(4)
- 收藏
- 关注
![](https://csdnimg.cn/release/blogv2/dist/pc/img/listFixedTop.png)
原创 JAVA——优雅的制定一个爬虫api
背景相信大家都对爬虫或多或少对有一个概念,百度百科描述为:爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。网上大部分的爬虫框架,都很好都整合了制定规则和自动抓取都两个功能。但也因为其整合性高,上手难度也随之提升。目前github上面星比较高的爬虫框架有:Apache NutchwebmagicWebCollectorgecco…但是我最想为大家介绍的是下面这个。retrofit-crawlerretrofit-crawler简介代码地址:https://git
2020-11-27 14:03:33
573
原创 【Kafka笔记】一、磁盘顺序写
简介对于大部分中间件,都会使用磁盘顺序写的方案对数据落库环节进行优化。比如kafkaElastic Search…那么磁盘顺序写到底如何操作呢,这里记录一下关键词MappedByteBuffer相关文章: https://blog.csdn.net/qq_41969879/article/details/81629469...
2021-07-25 14:58:32
404
原创 easyExcel设置style
背景最近做的一个系统,我们发现无论我们做的多么好,外国友人还是更愿意使用Excel进行数据分析。因此我不得不将系统中的数据与Excel进行来回转换。这就涉及到java的excel处理api——POI。但是这玩意就是个粪坑。POI简单介绍通常网上博客教我们操作一次数据是这样的try { //获取系统文档 POIFSFileSystem fspoi=new POIFSFileSystem(new FileInputStream("/path/file.xls")); //创建
2021-05-29 17:41:14
2432
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人