山水佳音
来自千古龙飞地,关注互联网,大数据、数据仓库及创新应用。
展开
-
ElasticSearch 2 - 深入搜索系列
对ElasticSearch 2的详细中文介绍,想深入研究ES的值得收藏。感谢作者:Richaaaard转自:http://www.cnblogs.com/richaaaard/default.html?page=1转载 2016-03-06 11:32:10 · 1147 阅读 · 0 评论 -
融合了大数据、搜索引擎及SQL的敏捷大数据方案bigdata 3.0:Presto+Elasticsearch
在bigdata 1.0时代,以hadoop为代表的大数据技术在企业数据仓库架构中起到的只是配角作用,只是完成数据批处理,处理好的数据还是放入传统的RDBMS中,由BI完成展示。这称为混合架构。对即时的数据流,提供了kafka+Storm的解决方案。既无法实现BI和bigdata的无缝对接,也无法进行流数据和大数据关联分析。这应该是一种不得已而为之的方案。 当很多用户刚开始对bigdata 1.0有所了解的时候,bigdata 2.0已经迅速到来。bigdata 2.0主要就是实现了SQL on bi原创 2016-02-11 21:08:58 · 10818 阅读 · 1 评论 -
Bigdata 3.0:Presto+Elasticsearch研发进展
Bigdata 3.0:Presto+Elasticsearch研发进展原创 2016-03-06 11:20:27 · 3927 阅读 · 3 评论 -
论big data 3.0取代SAP HANA的可行性
论big data 3.0取代SAP HANA的可行性 简言之,big data 3.0就是要实现SQL on big data,而且要兼顾性能、易用性和可扩展性。目前是“搜索引擎+大数据+SQL“这样一个融合为一体的趋势。本人参加过HANA培训,了解过SAP HANA实施项目,目睹了企业所经历的一个个坑,也很不认同SAP惟利是图的商业模式。但HANA的确是个好东西,就易用性来说就需要开源的大数据好好学习。HANA虽好,但太贵,开放性不好,扩展性是个大问题,不适合处理大数据;开源大数据,覆盖了80%HA原创 2016-06-14 14:05:47 · 1695 阅读 · 0 评论 -
基于Calcite Elasticsearch实现的SQL ON ES方案设想
Elasticsearch是搜索的王者,其强大的DSL不让SQL,但缺少SQL的关键特性,如Join。ES的策略是紧紧拥抱Hadoop/Hive,Spark,有个ES-hadoop方案。Hadoop本身就很笨重,这和轻快的ES是背道而驰的。ES的主要方向目前还在搜索上,SQL也不是它的主要关注点。所以,可预见的一段时间内,SQL on ES只能通过开发或集成第三方软件来完成,如通过Presto或Drill的插件来实现。我们已经测试了Presto Elasticsearch Connector。我们认为,基于原创 2016-04-13 10:48:35 · 10669 阅读 · 5 评论 -
闭关一年的干货与朋友们分享 先预告一下
闭关一年,即将出关,到时与朋友分享 先预告一下一、Pivotal HDB实战二、BI展示工具Metabase与Superset对比三、Elasticsearch在高速公路收费稽查中的应用四、Grafana在高速公路收费稽查中的应用五、OD分析的地图展示六、NoFS图片系统在高速行业中的应用前景分析原创 2017-08-16 20:55:24 · 2359 阅读 · 5 评论