作者 | nikifang(方书豪)
导读
小巧但不简单的的CSV读写工具,究竟怎样做到小而美呢?
csv简介
相信大家在进行后台开发时,或多或少都接触过数据的导入导出,数据载体大部分为excel或者是csv文件,excel文件的导入导出存在各个版本之间的差异,并且excel文件操作时对内存占用比较大,很容易出现内存泄漏的问题.(阿里的easyExcel一定程度上避免了此类问题)所以大家越来越多的采用CSV这种格式的文件来进行数据的导入导出操作。
什么是CSV
CSV全程为:Comma-Separated Values,逗号分隔的一种纯文本形式存储表格数据的一种文本。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段 间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。
csv主要的工具类
由于CSV文件是纯文本,我们完全可以通过Java的FileInputStream,以及FileOutputStream来操作CSV文件,当然也有很多已经建好的轮子,避免我们处理繁琐的文件流的操作,以及处理相应的CSV文件规则。目前大家选择比较多的CSV处理工具有:
superCSV
openCSV
Apache Commons CSV
选择superCSV的理由
lexin_common组件中实现的csv处理功能依赖的是superCSV。使用superCSV主要有一下几个优点
面向对象支持
superCSV支持使用JavaBean来进行读写,并且也支持之前的List, Map方式进行读写。在不同的应用场景中灵活变换。
分隔符配置
superCSV支持自定义文件中的分隔符。允许扩展特有的CSV文件格式。
数据转换
类似文件中的日期, 金额等数据,superCSV提供转换器(CellProcessor)进行转换。
数据校验
对于文件中的参数,支持丰富的校验规则:非空、数值大小,正则表达式
如何接入
读取CSV文件
应用工具类:CSVReadUtil,获取CSV读取器Reader(根据不同的返回参数类型获取不同的读取器);最后调用read方法读取csv文件内容。相应代码如下:
/**
* 将csv文件中的信息读取成map
*/
写入CSV文件
应用工具类CSVWriteUtil, 获取相应的写入器(同样根据不同的入参类型,生成不同的写入器)。最后调用write方法,将数据写入到定义的csv文件中。相应的操作代码如下:
/**
* map中的数据写入到目标CSV文件中
* @throws IOException
*/
后续计划
虽然我们已经有了CSV读写的轮子,但是,仍然有很多csv操作的代码侵入到业务代码中,后续我们计划提供csv读写注解功能,让csv工具类使用更加方便。有兴趣的小伙伴可以接入使用。
end
在看点这里