闭关一年的干货与朋友们分享 先预告一下

闭关一年,即将出关,到时与朋友分享 先预告一下 一、Pivotal HDB实战 二、BI展示工具Metabase与Superset对比 三、Elasticsearch在高速公路收费稽查中的应用 四、Grafana在高速公路收费稽查中的应用 五、OD分析的地图展示 六、NoFS图片系统在...

2017-08-16 20:55:24

阅读数 1802

评论数 3

彪悍开源的分析数据库-ClickHouse

Yandex在2016年6月15日开源了一个数据分析的数据库,名字叫做ClickHouse,这对保守俄罗斯人来说是个特大事。更让人惊讶的是,这个列式存储数据库的跑分要超过很多流行的商业MPP数据库软件,例如Vertica。如果你没有听过Vertica,那你一定听过 Michael Stonebra...

2016-09-28 09:25:34

阅读数 17414

评论数 3

论big data 3.0取代SAP HANA的可行性

论big data 3.0取代SAP HANA的可行性 简言之,big data 3.0就是要实现SQL on big data,而且要兼顾性能、易用性和可扩展性。目前是“搜索引擎+大数据+SQL“这样一个融合为一体的趋势。 本人参加过HANA培训,了解过SAP HANA实施项目,目睹了企业所经...

2016-06-14 14:05:47

阅读数 1115

评论数 0

基于Calcite Elasticsearch实现的SQL ON ES方案设想

Elasticsearch是搜索的王者,其强大的DSL不让SQL,但缺少SQL的关键特性,如Join。ES的策略是紧紧拥抱Hadoop/Hive,Spark,有个ES-hadoop方案。Hadoop本身就很笨重,这和轻快的ES是背道而驰的。ES的主要方向目前还在搜索上,SQL也不是它的主要关注点。...

2016-04-13 10:48:35

阅读数 5190

评论数 0

ElasticSearch 2 - 深入搜索系列

对ElasticSearch 2的详细中文介绍,想深入研究ES的值得收藏。感谢作者:Richaaaard 转自:http://www.cnblogs.com/richaaaard/default.html?page=1

2016-03-06 11:32:10

阅读数 980

评论数 0

Bigdata 3.0:Presto+Elasticsearch研发进展

Bigdata 3.0:Presto+Elasticsearch研发进展

2016-03-06 11:20:27

阅读数 2856

评论数 3

Spark的下一代引擎-Project Tungsten启示录:兼Presto、impala、spark性能根本比较

在过去的一年之中,我们一直在利用Spark做实时交互式分析系统方面的尝试,有兴趣的同学可以看一下我们之前分享的博客《基于Spark的用户分析系统》。我们在不断受到Spark启发的同时,也不得不忍受尚处于青春期的Spark性格中的叛逆。特别是在不断优化系统性能过程中,发现我们实际上是在做与Proje...

2016-02-25 13:23:45

阅读数 5077

评论数 0

融合了大数据、搜索引擎及SQL的敏捷大数据方案bigdata 3.0:Presto+Elasticsearch

在bigdata 1.0时代,以hadoop为代表的大数据技术在企业数据仓库架构中起到的只是配角作用,只是完成数据批处理,处理好的数据还是放入传统的RDBMS中,由BI完成展示。这称为混合架构。对即时的数据流,提供了kafka+Storm的解决方案。既无法实现BI和bigdata的无缝对接,也无法...

2016-02-11 21:08:58

阅读数 5053

评论数 1

2015年大数据年终工作总结

2015年大数据年终工作总结 今天是2016年第7天,现在来回顾下过去的2015年在大数据研发上的点点滴滴,总结如下三个方面: 一、大数据研发技术路线 2015年大数据技术依旧是乱花渐欲迷人眼。笨重的hadoop依旧是主力,以性能著称的Elasticsearch依旧没顾得...

2016-01-07 14:03:53

阅读数 4101

评论数 0

中小企业的大数据技术路线选择(二)-Cassandra+Presto方案

我前面曾经写过:中小企业的大数据技术路线选择 和 低调、奢华、有内涵的敏捷式大数据方案:Flume+Cassandra+Presto+SpagoBI 。前面用两个月的时间验证了Presto JDBC驱动、Prestogres和SHIB三种方案。Prestogres,可以使用PostgreSQL 客...

2015-03-16 14:21:49

阅读数 3011

评论数 2

盘点SQL on Hadoop中用到的主要技术

盘点SQL on Hadoop中用到的主要技术 发表于1小时前|165次阅读| 来源github|0 条评论| 作者肥男爱肉 转载自:http://www.csdn.net/article/2015-01-06/2823450 HadoopSQL大数据架构 摘要:自打Hive出现之后,SQL...

2015-01-07 12:46:59

阅读数 1854

评论数 0

Presto实现原理和美团的使用实践

Presto实现原理和美团的使用实践      转载自:http://tech.meituan.com/presto.html 木叶丸 本文已发表在《程序员》2014.6月刊2014-06-16 10:45 Facebook的数据仓库存储在少量大型Hadoop/HDFS集群。Hive是F...

2015-01-05 14:09:32

阅读数 1427

评论数 0

一次惊心动魄的Percona XTRADB Cluster数据修复过程【MySQL】

一次惊心动魄的Percona XTRA Cluster DB数据修复过程 看后,让你不再担心MySQL难以修复。当然,最好提前做好MySQL HA方案。

2014-12-31 16:24:42

阅读数 3123

评论数 0

2014年大数据年终工作总结

今天是圣诞节,2014年马上要过去了。回顾这一年在大数据研发上的点点滴滴,总结如下三个方面: 一、大数据研发技术路线 目前,存在太多的大数据技术,商业软件,如Teradata、Oracle、SAP、IBM等。开源的,如Hadoop、Spark、MPP DB、NewSQL等。在大数据...

2014-12-25 10:20:35

阅读数 6313

评论数 0

Spark发布1.2.0 - 支持Netty NIO / SQL增强

Spark 1.2.0是在1.X线的第三个版本。此版本带来了Spark的核心引擎性能和可用性方面的改进,一个重要的MLlib新API,Python的扩展ML支持,一个完全高可用的Spark流模式,等等。 GraphX已经看到主要性能和API改进,已经从alpha组件毕业。Spark 1.2代表来自...

2014-12-20 13:57:36

阅读数 2347

评论数 0

星环科技CTO孙元浩:统一、廉价、实时、融合,2015大数据趋势

星环科技CTO孙元浩:统一、廉价、实时、融合,2015大数据趋势 摘要:星环科技CTO孙元浩的演讲主题是“2015年大数据基础技术的演进趋势”。期间,他分享了Spark的一个数据:全球已有近50家企业围绕Spark提供产品和服务,11家提供商业Spark版本。 【CSD...

2014-12-15 12:56:28

阅读数 1660

评论数 0

重大新闻:Hadoop 2.6.0发布 - 支持硬盘、SSD、内存分层存储

发布Apache Hadoop 2.6.0 ——异构存储,长时间运行的服务与滚动升级支持 我很高兴地宣布,在Apache的Hadoop社区已经发布的Apache Hadoop的2.6.0:http://markmail.org/message/gv75qf3orlimn6kt! 特别...

2014-12-15 11:45:06

阅读数 3822

评论数 0

Facebook Bigdata - Presto 0.82 版本说明

Facebook Bigdata - Presto 0.82 版本说明

2014-11-10 13:33:50

阅读数 881

评论数 0

Facebook Bigdata - Presto 0.81 版本说明

Facebook Bigdata - Presto 0.81 版本说明 http://prestodb.io/docs/current/release/release-0.81.html

2014-11-10 13:21:45

阅读数 926

评论数 0

基于PostgreSQL的可扩展的开源大数据集群数据库:Postgres-XL

Postgres的-XL是一个基于PostgreSQL数据库的横向扩展开源SQL数据库集群,具有足够的灵活性来处理不同的数据库工作负载: OLTP 写频繁的业务 需要MPP并行性商业智能 操作数据存储 Key-value 存储 GIS的地理空间 ...

2014-11-07 13:56:38

阅读数 9039

评论数 1

提示
确定要删除当前文章?
取消 删除
关闭
关闭