问题原因:
项目中,要在excel中存储这几列内容:
biz_id | 查询时间 | 状态 | 失败编码 | 失败原因 | 查询结果 |
查询结果中的内容是查接口获取到的一个大json串,测试发现太大了存不下,于是考虑分隔开来,存不下时往后面的单元格存储。
解析时,需要将这些分隔存储的数据再拼接起来,存储到odps中。
解决方法:
解析用的是easyExcel框架,通过这篇文章了解了easyExcel的源码:
https://blog.csdn.net/baidu_21349635/article/details/106158100
然后发现 ModelBuildEventListener 中的invoke方法中,如果刚开始传了解析映射的class,就会只解析class字段个数的单元格,后面的单元格会被丢掉:
而使用 EasyExcel.read 方法时,如果不传解析映射结果的class,这时返回的结果数据是一个LinkedHashMap,key是单元格编号,value是单元格数据。
解决步骤:
使用不传 class 的 EasyExcel.read 方法代码如下:
EasyExcel.read(file.getAbsolutePath(), new PageReadListener<LinkedHashMap<Integer, Object>>(dataList -> {
if (CollectionUtils.isEmpty(dataList)) {
return;
}
Map<String, Boolean> bizIdStatusMap = Maps.newHashMap();
for (LinkedHashMap<Integer, Object> data : dataList) {
if (data.get(0) == null || data.get(2) == null) {
continue;
}
QueryResult queryResult = new QueryResult();
queryResult.setBizId((String) data.get(0));
if (data.get(1) != null) {
LocalDateTime localDateTime = LocalDateTime.parse((String) data.get(1), FORMATTER);
queryResult.setQueryTime(Date.from(localDateTime.atZone(ZoneId.systemDefault()).toInstant()));
}
queryResult.setStatus((String) data.get(2));
if (data.get(3) != null) {
queryResult.setErrCode((String) data.get(3));
}
if (data.get(4) != null) {
queryResult.setFailReason((String) data.get(4));
}
// 拼接 bizData(数据过多,一个单元格放不下)
if (data.get(5) != null) {
StringBuilder bizData = new StringBuilder((String) data.get(5));
int i = 6;
Object mergeBizData;
while ((mergeBizData = data.get(i)) != null) {
bizData.append((String) mergeBizData);
i++;
}
queryResult.setBizData(bizData.toString());
}
//save to odps
...
}
})).sheet().doRead();