1.在应用到复杂的企业级业务时,出现了无法实现的问题,需要根据数据检索字段构建针对各个字段的索引。构建索引有两种办法,一种基于行,一种基于列。
基于行的不可避免的出现了效率和事物的问题。基于列的本身只能应对比较特殊的业务,必须要有特别精巧的设计才可达到目的。
2.hbase本身对数据的遍历效率并不高,目前我用的是14台pc,每台内存8G,4核。遍历5000万,40GB大小左右的数据需要14分多钟。
3.在线业务中对复杂的连接查询并不能高效的设计和运行。
4.对于给定rowkey的查询速度很快,但是如果使用filter则出现了查询时间和记录排列前后成正比的现象。