开源大数据周刊-第74期

摘要: 资讯 大数据早报:海量大数据重度孵化器获A+轮融资 阿里自然语言处理技术获突破11月29日消息,海量大数据重度孵化器宣布公司已于2017年10月获得了广州众上集团的A+轮投资。 百度开源高性能 Python 分布式计算框架 Bigflow百度近日开源了一套计算框架 Bigflow , 致力于提供一套简单易用的接口来描述用户的计算任务,并使同一套代码可以运行在不同的执行引擎之上。

资讯

11月29日消息,海量大数据重度孵化器宣布公司已于2017年10月获得了广州众上集团的A+轮投资。

百度近日开源了一套计算框架 Bigflow , 致力于提供一套简单易用的接口来描述用户的计算任务,并使同一套代码可以运行在不同的执行引擎之上。

AI芯片公司Groq由前Google员工创建,核心成员包括Google TPU的主要设计者之一Jonathan Ross。成立以来他们一直比较低调,刚刚才公开了官网。目前官网只有一张照片,但这张照片给出的信息:单芯片,400TOP/s的性能指标,8TOP/s/W的能效指标,可以说是简单粗暴。从这个团队成员和Google TPU的渊源来看,我们不妨拿Google TPU来作为参考分析一下。

在当今世界中许多重要的数据集都以图或网络的形式出现:社交网络、知识图表、蛋白质交互网络、万维网等。然而直到最近,人们才开始关注将神经网络模型泛化以处理这种结构化数据集的可能性。

技术

Hive是业界大数据平台使用最广泛的SQL引擎,提供了一层SQL抽象接口和一套元数据规范, 将SQL查询翻译为分布式的计算作业,支持MapReduce/Spark/Tez等多种计算引擎。 同时Hive定义的元数据标准已经成为了一种事实标准,业界流行的大数据SQL引擎均对Hive元数据进行了兼容和支持。

本文介绍了阿里巴巴当前 Blink SQL 丰富的功能,底层实现的原理,并且讲解流与表是如何相互转换的。目前阿里巴巴已经将大部分 Blink 和 Blink SQL 的改进贡献回 Flink 社区。本次分享会主要介绍了阿里巴巴对 Flink SQL 的各项贡献和改进,并向大家分享 Blink SQL 在阿里内部的大规模应用场景。

Apache Flink 和 Apache Storm 是当前业界广泛使用的两个分布式实时计算框架。其中 Apache Storm(以下简称“Storm”)在美团点评实时计算业务中已有较为成熟的运用,有管理平台、常用 API 和相应的文档,大量实时作业基于 Storm 构建。

近年来,深度学习(DL)技术在许多 AI 应用当中取得了巨大成功。在获得大量数据的情况下,深度神经网络(DNN)能够很好地学习特征表示。但是,深度神经网络和大规模数据有着很高的计算资源要求。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值