infobright是开源的MySQL数据仓库解决方案,它基于在MySQL上二次开发,infobright主要实现的就是一个存储引擎,但因为它自身存储逻辑跟关系型数据库根本不同,所以,它不能像InnoDB那样直接作为插件挂接到mysql,它的逻辑层是mysql的逻辑 层加上它自身的优化器。
infobright有以下几个特点:
1、高强度的数据压缩在普通10:1, 在极限情况下可以达到40:1 甚至更高,自己在使用infobright过程中曾把5.1G的数据可以压缩成152M左右;
2、优化的统计计算(使用sum/avg/group by/count等),特别适用于统计函数生成的报表数据;
3、不需要建索引,就避免了维护索引及索引随着数据膨胀的问题。把每列数据分块压缩存放,每块有知识网格节点记录块内的统计信息,代替索引,加速搜索;
4、列式存储,在没有索引的情况下同理也没有主键、自动递增字段、无符号。
infobright产品分为社区版ICE和企业版IEE,其使用的引擎是BRIGHTHOUSE,在使用IEE版本是没有限制的,但是使用ICE版本则有3个限制:
1、不支持DML,因此在导入数据的时候只能用“LOAD DATA INFILE”的方式导入数据,此外一旦入库后就不能在仓库中用UPDATE、INSERT等方式写入;
2、不支持对CPU多核的使用,使得性能极低,要知道入数据仓库的数据都是极大的数据,没有多核支持查询大量的数据极慢;
3、只能单机使用,不具备任何的复制以及扩展,这样就限制了大规模集群的可能性。</