背景:做一个excel导出功能,1W条数据耗时5分钟以上。
导出的数据是一个List<User>,每个user对象对应多个组(List<Group>)。将数据写入表格前需要做些额外处理,遍历List<User>。
遇到这个问题时第一感觉是数据库操作耗时,加日志却发现实际上是遍历List<User>特别耗时,因为遍历循环内处理简单,有点不合逻辑。
更诧异的是最终发现耗时的代码是循环内的user.getGroup()取属性值。
在循环外前一行代码断点,查看List<User>,发现User是cglib动态生成的子类(class名:User$$EnhancerByCGLIB$$*),并且user.group 的值为 null,就判断mybatis使用了懒加载。遍历1w次,user.getGroup()取值时都执行了一条查询sql,导致的原因。取消懒加载反而更快,10s内。
就一般业务场景来说,List<User>20条分页,遍历也需要400ms左右,懒加载也会影响性能,查询List<User>稍快只是假象。还没理解它的好处。
需要注意的是,懒加载数据是在取值的时候动态加载的,如果未遍历的情况下使用反射直接取值得到的是空。
mybatis配置:lazyLoadingEnabled的值改成false解决。
<settings>
<setting name="lazyLoadingEnabled" value="true"/>
</settings>
问题代码结构:
for (User user : userList) {
List<Group> groups = user.getGroup();
for (Group group : groups) {
//其他处理
}
}