公司需要一个统计一下一个txt文本中 黑体字部分不同数据出现的次数 ,把结果做成excel文件交上去。txt内容就像下面的:
想了一下大概涉及这几个方面:1.黑体字的提取 2.黑体字的去重 3.出现次数的统计
涌入脑中的方案有三个:
a.直接上java代码,用IO流处理文本,逐行获取后截取字符串,在进行重复的逻辑判断,同时记录下来出现了多少次------太麻烦
b.截取字符串后,存到数据库中,使用distinct和count函数处理-----也麻烦
c.直接逐行写入excel,再进行excel方面的处理-----这个还不错,因为a和b最后还是需要记录到excel中
决定后考虑了下总体的逻辑,如下:
第一部分:txt到xls
/*
* 需求:把txt文件按照每行内容写入excel文件
* 步骤:
* 1.读取txt文件----getTxt方法
* 2.创建excel文件,创建sheet----getFactory方法
* 3.创建row,循环创建cell,并把内容写入---writeTxtToExcel方法
*/
第二部分:xls操作
/*
* 需求:统计不同数据的出现次数
* 步骤:
* 1.分裂出黑体字部分
* 2.去除重复
* 3.统计出现次数
*/
过程下来还是挺快的,就是有些小坑