10亿数据量的即席查询 spark 和 kylin的对比
数据量大约在10亿+,需要做一个即席查询,用户可以主动输入搜索条件,如时间。可提供一定的预处理时间。每天还有新数据加入。10亿+的数据对于普通的rdbms还是有些压力的,而且数据每天还在不停的增长,所以我们运用了我们的spark技术来做一个计算加速。关于增量更新的相关,我会在后续的博客中介绍。语句如下select count(*) a,b from table_a wher...
虚拟机
优化和排错
hadoop
hive数据仓库
Hbase
flink实时计算
Scala编程
大数据仓库
云计算
软件测试
开发杂说
C#--I/O操作
数据库
Java
html
android
Jquery
web
开发工具
大数据
架构
程序人生
hadoop
zookeeper
hbase
flume
linux
sqoop
javascript
mysql
scala
spark
推荐系统
hive
网络
口琴
机器学习
nginx
JVM
Oracle
mybatis
shell
shell编程
ambari
shuffle 
