Java操作es7实现1亿单元格数据记录及查询
1.es基本知识不做过多介绍,使用场景多用于模糊搜索,但是此次用于大数据量多字段精确搜素
2.使用场景是Excel数据导入记录大约1亿单元格数据
3.设计思路如下
4.es所有字段设置为关键字-keyword类型
5.每条数据包含三个关键数据,原始值,新值,和这一行数据的所有值的json数据
6.要实现对字段的过滤以及搜索的关键在于字段是keyword类型,可以实现多条件多字段的大数据量搜索
7.具体API见之前的文章记录
8.虽然没有用到es模糊搜索的精髓,但是作为大数据量的数据记录也不错,速度快,准确,可靠
9.es学习过程中容易遇到API理解使用偏差,因为每个大版本之间的API相差甚远,一定要找对应版本的资料学习
10.目前测试性能,100w行,1亿单元格数据量数据,在数据结构设置合理的情况下,数据入库查询大约是100秒,略慢于关系型数据库,未考虑代码本身的业务逻辑。
11.千万级别数据搜索速度是毫秒级别