点击蓝字
关注我们
AI TIME欢迎每一位AI爱好者的加入!
哔哩哔哩直播通道
扫码关注AITIME哔哩哔哩
官方账号预约直播
12月5日 14:30-15:30
个人简介:
魏成坤,浙江大学博士后,导师为陈文智教授。研究方向软硬协同的云计算网络系统和数据隐私保护。相关研究发表在SIGCOMM、HPCA、CCS、NDSS、TIFS、TDSC等会议及期刊。主持/参与国家自然基金、重点研发计划、浙江省博士后择优资助项目等项目。
报告题目:
Achelous: Enabling Programmability, Elasticity, and Reliability in Hyperscale Cloud Networks
报告简介:
近年来云计算的高速发展促使企业迁移到云端以获得可靠的按需计算。在单个VPC (Virtual Private Cloud)中,实例(如vm、裸机和容器)的数量已经达到数百万,这给支持数百万个实例带来了挑战,这些实例的网络位置与底层硬件解耦,具有高弹性性能和高可靠性。然而,学术界的研究主要集中在高速数据平面和虚拟化路由基础设施等具体问题上,而现有的工业技术未能充分解决这些挑战。本文介绍了阿里云网络虚拟化平台Achelous的设计与体验。Achelous包括三个增强超大规模VPC的关键设计:基于数据平面和控制平面协同设计的新型分层编程体系结构;分别针对纵向扩展和横向扩展的弹性性能策略和分布式ECMP方案;健康检查方案和用户无感的虚拟机动态迁移机制,确保故障转移期间有状态流的连续性。评估结果表明,Achelous在单个VPC中扩展到超过150万个具有弹性网络容量的虚拟机,编程时间减少了25倍,99%的更新可在1秒内完成。对于故障转移,它在虚拟机实时迁移期间缩短了22.5倍的停机时间,并确保99.99%的应用程序不会出现停机。更重要的是,三年的运行经验证明了Achelous的可维护性,以及独立于任何特定硬件平台的多功能性。
12月6日 19:30-20:30
个人简介:
沈俊贤,清华大学五年级博士生,导师为王继龙教授。研究方向为可观测性能力构建、无服务器计算与高性能网络I/O。相关研究工作发表在SIGCOMM、CCS、TPDS、IWQoS等会议及期刊上。
报告题目:
Network-Centric Distributed Tracing with DeepFlow: Troubleshooting Your Microservices in Zero Code
报告简介:
随着微服务应用复杂性的日益增长,传统性能监控方案正面临前所未有的挑战。一方面,微服务的快速扩张对现有的分布式追踪框架构成了巨大的使用和维护压力;另一方面,基础设施的复杂性增加了产生网络性能问题的风险,并使网络盲点日益凸显。在此背景下,本篇由清华大学与云杉网络合作完成的研究论文,引入了一种全新的微服务故障诊断神器——以网络为核心的分布式追踪框架DeepFlow。DeepFlow不仅利用以网络为中心的跟踪平面和隐式上下文传播,实现了开箱即用的追踪功能,还能有效揭示网络基础设施中的盲点,以低成本捕获关键网络指标,促进各组件和层之间的深度协同。经过深入的分析和实证验证,DeepFlow展示了其在定位微服务性能异常方面的卓越能力,且其运行开销几乎可以忽略不计。DeepFlow已在超过26家公司中发现超过71个关键性能异常点,并被数百名开发人员采用。我们的生产实践证明,DeepFlow不仅能为用户节省宝贵的时间,还将故障排查时间大幅缩短,从数小时降至数分钟,成为微服务运维世界中的一盏明灯。
添加“AI TIME小助手(微信号:AITIME_HY)”,回复“PhD”,将拉您进“AI TIME PhD 交流群”!
AI TIME微信小助手
往期精彩文章推荐
关注我们 记得星标
关于AI TIME
AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。
迄今为止,AI TIME已经邀请了1400多位海内外讲者,举办了逾600场活动,超600万人次观看。
我知道你
在看
哦
~
点击 阅读原文 预约直播!