本文参考链接地址:https://blog.csdn.net/wangjun5159/article/details/51655806
java读取csv的类库主要有两种,opencsv和javacsv,javacsv很久不维护了。opencsv是apache的项目,并且至今仍在维护。
csv文件,全名 comma separated values,默认以逗号分隔,是纯文本文件。虽然用excel打开后格式排版了,但是那是excel对他进行了处理。用notepad或者sublime text打开能看到最原始的文本。
csv文件根据写入方式的不同而稍有不同,大体上说,都是行和列按一定的规律排列,首行可能是标题信息,也可能直接是数据,每一列用逗号分开,普通的csv文件一般格式如下:
header1,header2,header3
1,a,10
2,b,20
3,c,30
4,d,40
5,e,50
6,f,60
或者 每一列的值都带"",格式如下
header1,header2,header3
"1","a","10"
"2","b","20"
"3","c","30"
"4","d","40"
读取方式:
接口
- MappingStrategy
- 映射的顶层接口
- HeaderColumnNameMappingStrategy
- 列名映射策略,读取csv文件第一行作为header,比如header1,header2,header3,然后调用bean的setHeader1方法,setHeader2方法,setHeader3方法分别设置值,所以这种策略要求,列名与bean中的属性名完全一致,如果不一致,则值为空,不会出错。使用注解时,注解名字必须与csv中列名一致。
- ColumnPositionMappingStrategy
- 列位置映射策略,他没有header的概念,所以会输出取所有行。在columnMapping数组中指定bean的属性,第一个值对应csv的第一列,第二个值对应csv的第二类……
- HeaderColumnNameTranslateMappingStrategy
- 列头名字翻译映射策略,与HeaderColumnNameMappintStrategy相比,bean的属性名可以与csv列头不一样。通过指定map来映射。
读取CSV文件转换为bean的代码示例
/**
* 解析csv文件并转成bean
* @param file csv文件
* @param clazz 类,bean的每一个属性要进行列注解(@CsvBindByPosition(position=0),position为对应csv文件的第几列),对应csv文件的某一列
* @param <T> 泛型
* @return 泛型bean集合
*/
public static <T> List<T> getCsvData(MultipartFile file, Class<T> clazz) {
InputStreamReader in;
try {
//这里如果不用utf8,用gbk,解析中文会出现乱码
in = new InputStreamReader(file.getInputStream(), "utf8");
} catch (Exception e) {
logger.error(
e.getMessage());
throw new BusinessException(e.getMessage());
}
ColumnPositionMappingStrategy<T> mapper = new ColumnPositionMappingStrategy<T>();
mapper.setType(clazz);
//解析列的时候忽略,"和',跳过第一行(标题)
CsvToBean<T> csvToBean = new CsvToBeanBuilder<T>(in)
.withSeparator(',')
.withQuoteChar('\'')
.withQuoteChar('\"')
.withSkipLines(1)
.withMappingStrategy(mapper).build();
return csvToBean.parse();
}