2022/8/13 Data Everywhere 系列活动-杭州站
开源遇上大数据
数据无处不在,大数据的浪潮下,一波又一波为数据而生的开源项目开始崛起,我们既能看到开源对数据应用的加速作用,也可以试图用数据来分析开源,开源和大数据的相遇,会擦出什么样的火花?本期分享,我们将围绕大数据和开源项目,展开四场不同的讲座,从分布式文件系统到 HTAP 数据库,再到开源数据的洞察分析和消息队列的演进,相信本次的分享一定能给开源大数据相关企业和个人带来足够的收获。
活动信息及报名
活动时间:8月13日 下午 13:00-17:10
活动地点:杭州市余杭区西坝路59号2号楼9层和润之家(数智引擎斜对面)
报名方式:https://mini.awsapp.cn/l/ptjvfP5O0FJj
温馨提示:根据杭州防疫政策须凭七天内核酸检测阴性证明,到时以最新防疫政策为准
日程安排
13:00-13:30 签到
13:30-13:40 开场介绍和亚马逊云科技社区介绍
13:45-14:30 高昌健《浅析大规模分布式文件系统的元数据设计》
14:30-15:15 李浩《什么是真正的 HTAP 数据库?》
15:15-15:45 茶歇
15:45-16:15 赵生宇《数解开源开源中的大数据》
16:15-17:00 沈瑀昊《云原生时代消息队列演进》
17:00-17:10 互动&抽奖&收尾&合影
高昌健 Juicedata 技术专家
分享主题:浅析大规模分布式文件系统的元数据设计
讲师介绍:参与建设 JuiceFS 开源社区的主力队员。十年互联网行业从业经历,曾在知乎、即刻、小红书多个团队担任架构师职位,专注于分布式系统、大数据、 Al 领域的技术研究。
分享内容:
1.什么是分布式文件系统
2.业界大规模分布式文件系统的架构简介
3.什么是文件系统的元数据
4.如何设计文件系统的元数据5.后续展望
听众收益:
1.了解分布式文件系统的概念
2.了解业界大规模分布式文件系统的架构设计
3.了解如何设计一个文件系统的元数据
李浩 StoneDB 首席架构师
分享主题:什么是真正的 HTAP 数据库?
讲师介绍:StoneDB 首席架构师、曾在华为、爱奇艺、北大方正从事数据库内核核心架构设计。超过10年数据库内核开发经验,擅长查询引擎、执行引擎、大规模并行处理等技术。拥有数十项数据库发明专利,著有《PostgreSOL 查询引擎源码技术探析》
分享内容:
1.什么是 HTAP 数据库
2.HTAP 产生的背景是什么
3.一个真正的 HTAP 应该具有哪些能力
4.HTAP 的实践经验
5.对开源数据库的思考
听众收益:
1.了解 TP 数据库,AP 数据库,HTAP 数据库是什么,各自使用场景
2.了解一个真正的 HTAP 数据库应该具有什么样的能力
3.学习 HTAP 数据库实践中的经验
赵生宇 开源社理事 同济大学计算机在读博士生
分享主题:数解开源_ 开源中的大数据
讲师介绍:
-
2022开源社理事
-
同济大学 X-lab 在读博士
-
主要做开源相关的理论研究和数据分析工作前阿里巴巴开源办公室成员
演讲内容:
1.开源中的开放数据有什么
2.国际行业中的开源社区度量方法介绍
3.图算法下的开源数据分析和洞察
4.开源数据中的可视化
听众收益:
1.了解开源世界中的大数据
2.了解目前主流的数据度量方法
3.从网络视角理解开源世界
沈瑀昊 StreamNative 产品经理
分享主题:云原生时代消息队列演进
讲师介绍:目前在 StreamNative 担任产品经理,主要负责私有云以及 PulsarOperator 相关的产品管理工作。曾在微软、七牛、PingCAP 从事客户成功、产品管理相关的工作,专注在分布式系统、云原生、大数据等领域。
演讲内容:
1.消息队列的演进历程
2.云原生消息队列的典型特点
3.ApachePulsar 的介绍
-
分层分片的架构
-
统一的消息模型和协议 -内置的企业级特性
4.Apache Pulsar 应用场景
-
金融交易场景
-
跨地域多活场景
-
批流融合实时数仓
-
物联网场景
听众收益:
1.了解消息队列的一些常见特性,主流消息队列的一些特点
2.了解 ApachePulsar 的基本概念和架构特点
3.了解 ApachePulsar 适合的应用场景
活动福利
福利一:线下的活动,除了干货满满的分享内容,肯定少不了精美可口的茶歇!
福利二:活动现场签到,即可领取 Data Everywhere 系列精美定制周边!
福利三:现场提问环节,还有机会获得 User Group 和合作社区为您精心准备的其他精美周边~