开源大数据周刊-第28期

摘要: 大数据在医疗行业应用,Hive/ElasticSearch新版本特性,Spark欧洲峰会

阿里云E-Mapreduce动态

E-Mapreduce产品即将发布的版本信息如下:

1.5.2版本

  • 增加预定制配置,如试用型/入门配置/高计算配置/高存储配置等

1.6.0版本

  • 交互式查询(支持Hive、Spark)

资讯

  • 干货报告丨医疗大数据的行业应用研究

    报告从医疗大数据的概念、政策财政支持、发展背景以及现状,到相关具体的应用场景进行了详细介绍,该领域具有广阔的前景。
    
  • 大数据的价值:找到别人的“集体智慧”

    作者为数据咨询师车品觉,文章主要内容:①大数据行业正在发生三大颠覆性变化;②大数据变成企业的洞察力、行动力;③大数据的创新依靠集体智慧;④考量“好数据”的六把标尺。
    
  • 八个国家级的大数据中心已经或即将启动建设

    为了响应号召,国家部委、地方政府、基础电信运营商、互联网巨头、信息通信设备制造商纷纷投资建设自己的大数据中心帝国。目前,八个国家级的大数据中心已经或即将启动建设,包括国家化学品数据中心、国家化学品数据中心、全国精准扶贫精准脱贫大数据平台、全国精准扶贫精准脱贫大数据平台、生态环境大数据平台、国土资源大数据平台、国家政务信息共享交换平台、国家交通运输物流公共信息平台。
    
  • Spark Submit Europe 2016

    Spark 2016欧洲峰会1025~27在布鲁塞尔召开,议题包括工业界的Spark开发者的分享(FaceBook/Microsoft等)、Spark实践(TensorFlow on Spark/Struct Streaming等)、学术界的研究(AMP Lab UC Berkeley/Purdue University等),可以下载一些ppt。
    
  • (技术)Apache Hive走向内存计算,性能提升26倍

    Apache Hive 2.1已于几个月前发布,它引入了内存计算,这使得Hive计算性能得到极大提升,这将会影响SQL On Hadoop目前的竞争局面。据测试,其性能提高约26倍。
    
  • (技术)架构师特刊:Apache Kylin实践

     InfoQ做的麒麟特刊,看了几个互联网公司的案例,从业务出发来规避麒麟的问题,也能达到很好的效果。有一篇说麒麟的好处是把前台查询和大数据平台放在一起,但后续很多case都是麒麟的hbase单独搭建一个集群做查询,感觉还是很割裂。
    
  • (技术)物联网大数据平台TIZA STAR架构解析

    万物互联的时代正逐步到来,据权威报告预测,2020年全球物联网连接的终端数将达到500亿,数据呈现爆发式增长,从数据中提取价值也更加有挑战。TIZA STAR是一个企业级的物联网大数据平台,文章介绍了TIZA STAR的架构,涉及数据接入、存储、处理、交换等流程处理,以及安全、监控、具体应用场景等。
    
  • (技术)机器学习通用框架总结

    每个数据科学家每天都要处理成吨的数据,而他们60%~70%的时间都在进行数据清洗和数据格式调
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值