【直播预约】揭秘大数据架构--从数据服务架构到数据存储架构

a79f629c993694bcca2605a3bec782b5.gif

Data Everywhere 系列活动-北京站

2022/6/25

以Hadoop为基础的第一代大数据技术,解决了海量的数据处理和应用问题,完成了从0到1的奠基,大数据技术基本实现了可用。

随着越来越多的应用基于大数据构建,出现了新的繁复的业务场景与技术演化需求。这对大数据技术的使用提出了更高的要求,也影响大数据技术本身的演化。Snowflake 等新兴产品,开始推动数据平台从“能用/可用”向“高效/易用”进化。

第二代大数据技术,需要在技术上做到更好的技术分层和更强的专业化。而实现这一切的出发点,在于架构的设计,对系统进行有序化重构,不断减少系统的“熵”,从而使系统不断进化。

本期活动,我们将带来大数据架构(数据服务架构,数据存储架构)的深入剖析。

面对复杂的业务场景,如何基于大数据组件进行选型,构建稳定、高效、准确的大数据服务,是每个企业面临的难题。本期活动,我们首先会介绍数据服务的架构,我们将介绍如何使用大数据技术栈构建实时数据服务;如何基于算法构建非结构化的数据应用。

对于每一个大数据从业者,尤其是大数据引擎从业者,需要深刻理解大数据产品迭代的历史脉络。剖析时代背景下的技术需求,并针对此进行架构上的设计,在可用性、扩展性、并发、成本等要素之间权衡。本期活动,我们会带你揭开大数据存储引擎设计的面纱。在本期的分享中,我们将介绍云原生的分布式文件系统的架构设计,和大规模NoSQL存储的技术架构。

无论你是大数据服务应用的构建者,还是大数据引擎的设计者,亦或是仅仅想了解大数据的面貌,都欢迎你一起来参加这场大数据架构的盛宴。把握架构,把握先机。

大数据的未来已来,Data Everywhere!

1

d5ba1b07c51c11e51b97fa938f356859.png

活动信息及报名

时间:6月25日  下午 14:00 - 16:30

方式:线上直播

报名:我们将在示说网、视频号双平台同步直播,期待大家的参与!

示说网观看链接:识别二维码预约

                           也可点击阅读原文直接跳转

8ab1bc87243074f3d213eadd09323f1e.png

视频号观看链接:识别二维码预约

041f93777c2c9ece8b6d34eec2299e80.png

2

fd7a817628b09dae177a9ac5dafd8d68.png

日程安排

14:00-14:05

活动开场

14:05-14:40

阙乃祯 

使用DataStax 技术栈在亚马逊云科技上构建实时数据服务

14:40-15:15

侯杰

快速构建非结构化数据应用

15:15-15:50

高昌健

JuiceFS 为云而生的分布式文件系统

15:50-16:25

李君

如何构建超大规模无服务器

 NoSQL 数据库服务?

- Amazon DynamoDB 架构揭秘

16:25-16:30

活动结束

3

957bcf918dc04193e8c8b62c19bc8ae7.png

嘉宾介绍

5df49502bed657ef189bb76e519525f0.png

阙乃祯

DataStax 技术专家

分享主题:

使用DataStax 技术栈

在亚马逊云科技上构建实时数据服务

分享内容:

分享DataStax Astra和Pulsar 在亚马逊云科技上设计实时数据架构,提升零售,IOT,用户中心等数据敏捷性。

讲师介绍:

近年来,他的重点主要是大型,分布式数据库和流处理系统解决方案的设计和咨询。

1adf7711b37265ddf05772cfd6738bed.png

侯杰

Zilliz首席工程师

分享主题:

快速构建非结构化数据应用

分享内容:

1. 什么是非结构化数据

2. 非结构化数据与深度学习

3. Say Hellow to Towhee

4. 快速构建图像搜索应用

5. Demo演示

讲师介绍:

目前在 Zilliz 主要负责 Towhee 项目相关的研发工作。他曾先后任职于阿里等头部电商公司,负责超大规模推荐广告系统的算法工作,对超大规模分布式机器学习系统和优化算法有深入的钻研。侯杰拥有南京理工大学自动化专业博士学位,研究方向主攻机器学习理论和机器学习系统。

beae4434a222b8ec0dec688141f0699e.png

高昌健

Juicedata 技术专家

分享主题:

JuiceFS 为云而生的分布式文件系统

分享内容:

• 介绍 JuiceFS 诞生的背景和发展历程,以及目前的社区发展情况。

• 介绍 JuiceFS 的架构以及背后的设计哲学。

• 介绍几个真实场景案例,讲述文件系统能提供哪些价值。

讲师介绍:

十年互联网行业从业经历,曾在知乎、即刻、小红书多个团队担任架构师职位,专注于分布式系统、大数据、AI 领域的技术研究。现在 Juicedata 担任技术专家,参与建设 JuiceFS 开源社区。

3e5982c22ce9d07ba398468c35444f44.png

李君

亚马逊云科技 

资深数据库技术专家

分享主题:

如何构建超大规模无服务器NoSQL数据库服务?- Amazon DynamoDB 架构揭秘

分享内容:

Apache Cassandra 官网上提到“Apache Cassandra 依赖于 Amazon's Dynamo 分布式存储键值系统的多种技术”。

Dynamo 是亚马逊科学家们在2007 ACM 操作系统原理研讨会(SOSP 会议)上发表的论文“Dynamo: Amazon’s Highly Available Key-value Store ”。这篇论文被业界认为是推动了 NoSQL 的分布式数据库技术的发展。

基于Dynamo 在亚马逊内部中的广泛采纳和成功经验,十年前,也就是2012年,亚马逊云科技发布了 Amazon DynamoDB,无服务器的 NoSQL 数据库服务。今天我们就来看看这个超大规模无服务器 NoSQL 数据库服务是如何构建的?系统架构,关键组件都有哪些?

讲师介绍:

李君 亚马逊云科技资深数据库技术专家。

多年从事于分布式、数据库领域。

4

2eb4883a158cb20e775fe81a5f9cbb4a.png

活动福利

惊喜一提问环节,有机会领取 Data Everywhere  系列精美定制周边!

8e1afa0b4cb8aaaacefcf2d06f39b458.png

6c46a4ec67b985aca4b270ed69e45993.png

d7700b403ec1304824f47feb2883d6ef.png

惊喜二:参与群内(群二维码在下方)互动抽奖,就有机会获得其他精美周边或红包喔~手气最佳还有额外奖品!

7a56ab3219b26350c708b80c2bac7eb0.png

c83386ad1257a6f7dbc3d0ed0317e860.png

【北京群二维码】

e17729dba2707bc144c57046115d84a0.png

感谢本期活动的各位合作伙伴,期待参加本场 Meetup 的讲师、开发者和志愿者们,也欢迎朋友们积极报名参加活动,收获知识,收获快乐!欲知更多信息或活动预告,请持续关注微信公众号【亚马逊云开发者】

欢迎与我们共赴一场技术之约!

78ffdc6d193cf384a8c49b591e851542.gif

bdf1d64dd73eda77286e27dc4cfa342e.gif

听说,点完下面4个按钮

就不会碰到bug了!

27d7f520a94eba0c7edeaa0cdca2c48a.gif

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值