![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
文件统计
文章平均质量分 53
米修斯的橘子
java,python,vue.web
展开
-
文件倒叙读取行内容识别文件编码多线程
文件倒叙读取行内容识别文件编码多线程1.文件倒叙读取的方式文件倒叙读取行内容参考了许多博客,大体是一种采用RandomAccessFile进行读取,考虑到有线程的开源解决方案,先采用ReversedLinesFileReader类来进行操作,再apache的commons-io依赖中。emm,考虑到编码问题,推荐采用2.7版本来操作,因为看2.4的源码是不支持gbk编码的。依赖: <dependency> <groupId>commons-io</groupId原创 2021-03-02 17:12:51 · 663 阅读 · 0 评论 -
lucene全文检索过程
lucene全文检索过程1.需求,读取文件的内容,行读取方式,按照行内容进行分词匹配检索。2.引入lucene的maven依赖<!-- https://mvnrepository.com/artifact/org.apache.lucene/lucene-core --> <dependency> <groupId>org.apache.lucene</groupId> <artifactId>lucene-core</原创 2021-02-25 11:03:14 · 283 阅读 · 1 评论 -
遍历一个指定的目录下的所有文件及该文件所对应的指定目录下的对应层数,可指定遍历的层数
1.采用递归进行统计,确定需求不会有很多层的情况下使用,可以维护一个层数控制放入,控制遍历的次数(在不确定目录的深度的情况下) /** * 获取目录下所有的文件路径和对应文件的层数 * * @param homePath * @return */ public List<Map<String, Integer>> mapFiles(String homePath) { List<Map<Stri原创 2020-11-04 14:58:33 · 252 阅读 · 2 评论