开源大数据周刊-第28期

最新推荐文章于 2024-07-30 07:55:41 发布

aliyun32183

最新推荐文章于 2024-07-30 07:55:41 发布

阅读量213

点赞数

分类专栏：云栖社区开源大数据周刊

本文链接：https://blog.csdn.net/aliyun32183/article/details/79241746

版权

云栖社区开源大数据周刊专栏收录该内容

61 篇文章 1 订阅

订阅专栏

摘要：大数据在医疗行业应用，Hive/ElasticSearch新版本特性，Spark欧洲峰会

阿里云E-Mapreduce动态

E-Mapreduce产品即将发布的版本信息如下：

1.5.2版本

增加预定制配置，如试用型/入门配置/高计算配置/高存储配置等

1.6.0版本

交互式查询（支持Hive、Spark）

资讯

干货报告丨医疗大数据的行业应用研究

报告从医疗大数据的概念、政策财政支持、发展背景以及现状，到相关具体的应用场景进行了详细介绍，该领域具有广阔的前景。

大数据的价值：找到别人的“集体智慧”

作者为数据咨询师车品觉，文章主要内容：①大数据行业正在发生三大颠覆性变化；②大数据变成企业的洞察力、行动力；③大数据的创新依靠集体智慧；④考量“好数据”的六把标尺。

八个国家级的大数据中心已经或即将启动建设

为了响应号召，国家部委、地方政府、基础电信运营商、互联网巨头、信息通信设备制造商纷纷投资建设自己的大数据中心帝国。目前，八个国家级的大数据中心已经或即将启动建设，包括国家化学品数据中心、国家化学品数据中心、全国精准扶贫精准脱贫大数据平台、全国精准扶贫精准脱贫大数据平台、生态环境大数据平台、国土资源大数据平台、国家政务信息共享交换平台、国家交通运输物流公共信息平台。

Spark Submit Europe 2016

Spark 2016欧洲峰会10月25~27在布鲁塞尔召开，议题包括工业界的Spark开发者的分享(FaceBook/Microsoft等)、Spark实践(TensorFlow on Spark/Struct Streaming等)、学术界的研究(AMP Lab UC Berkeley/Purdue University等)，可以下载一些ppt。

（技术）Apache Hive走向内存计算，性能提升26倍

Apache Hive 2.1已于几个月前发布，它引入了内存计算，这使得Hive计算性能得到极大提升，这将会影响SQL On Hadoop目前的竞争局面。据测试，其性能提高约26倍。

（技术）架构师特刊：Apache Kylin实践

 InfoQ做的麒麟特刊，看了几个互联网公司的案例，从业务出发来规避麒麟的问题，也能达到很好的效果。有一篇说麒麟的好处是把前台查询和大数据平台放在一起，但后续很多case都是麒麟的hbase单独搭建一个集群做查询，感觉还是很割裂。

（技术）物联网大数据平台TIZA STAR架构解析

万物互联的时代正逐步到来，据权威报告预测，2020年全球物联网连接的终端数将达到500亿，数据呈现爆发式增长，从数据中提取价值也更加有挑战。TIZA STAR是一个企业级的物联网大数据平台，文章介绍了TIZA STAR的架构，涉及数据接入、存储、处理、交换等流程处理，以及安全、监控、具体应用场景等。

（技术）机器学习通用框架总结

每个数据科学家每天都要处理成吨的数据，而他们60%~70%的时间都在进行数据清洗和数据格式调

aliyun32183

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录