开源大数据周刊-第74期

最新推荐文章于 2024-07-30 07:55:41 发布

aliyun32183

最新推荐文章于 2024-07-30 07:55:41 发布

阅读量127

点赞数

分类专栏：云栖社区开源大数据周刊

本文链接：https://blog.csdn.net/aliyun32183/article/details/79171539

版权

云栖社区开源大数据周刊专栏收录该内容

61 篇文章 1 订阅

订阅专栏

摘要：资讯大数据早报：海量大数据重度孵化器获A+轮融资阿里自然语言处理技术获突破11月29日消息，海量大数据重度孵化器宣布公司已于2017年10月获得了广州众上集团的A+轮投资。百度开源高性能 Python 分布式计算框架 Bigflow百度近日开源了一套计算框架 Bigflow ，致力于提供一套简单易用的接口来描述用户的计算任务，并使同一套代码可以运行在不同的执行引擎之上。

资讯

大数据早报：海量大数据重度孵化器获A+轮融资阿里自然语言处理技术获突破

11月29日消息，海量大数据重度孵化器宣布公司已于2017年10月获得了广州众上集团的A+轮投资。

百度开源高性能Python分布式计算框架Bigflow

百度近日开源了一套计算框架 Bigflow ，致力于提供一套简单易用的接口来描述用户的计算任务，并使同一套代码可以运行在不同的执行引擎之上。

谷歌TPU团队离职创立的芯片公司Groq，把AI芯片的性能推向新高

AI芯片公司Groq由前Google员工创建，核心成员包括Google TPU的主要设计者之一Jonathan Ross。成立以来他们一直比较低调，刚刚才公开了官网。目前官网只有一张照片，但这张照片给出的信息：单芯片，400TOP/s的性能指标，8TOP/s/W的能效指标，可以说是简单粗暴。从这个团队成员和Google TPU的渊源来看，我们不妨拿Google TPU来作为参考分析一下。

深度 | 一文概览图卷积网络基本结构和最新进展

在当今世界中许多重要的数据集都以图或网络的形式出现：社交网络、知识图表、蛋白质交互网络、万维网等。然而直到最近，人们才开始关注将神经网络模型泛化以处理这种结构化数据集的可能性。

技术

Hive0.13到Hive2.1跨版本升级全姿势

Hive是业界大数据平台使用最广泛的SQL引擎，提供了一层SQL抽象接口和一套元数据规范，将SQL查询翻译为分布式的计算作业，支持MapReduce/Spark/Tez等多种计算引擎。同时Hive定义的元数据标准已经成为了一种事实标准，业界流行的大数据SQL引擎均对Hive元数据进行了兼容和支持。

基于 Blink SQL 的阿里实时计算平台StreamCompute介绍

本文介绍了阿里巴巴当前 Blink SQL 丰富的功能，底层实现的原理，并且讲解流与表是如何相互转换的。目前阿里巴巴已经将大部分 Blink 和 Blink SQL 的改进贡献回 Flink 社区。本次分享会主要介绍了阿里巴巴对 Flink SQL 的各项贡献和改进，并向大家分享 Blink SQL 在阿里内部的大规模应用场景。