专访李飞飞 :从清华附中高材生到阿里飞刀,一口井钻出「云原生」

如果要用一个关键词来定义中国当下的消费时代,“双11”是再贴切不过了。

从2009年11月起,它只花了十年的时间,就从一个只有27家商户参与的打折日,变成了一个全民狂欢的消费节,2019年已经有超过18万家品牌参加,累计成交额更是高达2684亿元。

每年的双11,都是互联网的流量洪峰。

面对逐年攀升的成交额数据,到底是什么作为支撑呢?

阿里巴巴集团副总裁、阿里云智能事业群数据库产品事业部总裁、达摩院数据库与存储实验室负责人李飞飞在新智元专访中透露,去年双11交易峰值达到了每秒55万笔,而每笔交易又能拆分成很多个事务,总的下来每秒会有几百万的transaction事务在0:00:01那一刻发生,交易量会暴涨133倍。比如说之前一秒有一个,现在就是一秒有133个。

短时间内如此高的增长,对后端的计算和存储系统的挑战巨大。系统的弹性、可扩展性及高可用性要非常好,不然难以支撑瞬间的交易暴涨。

这是对数据科学的极大挑战,也是每个有抱负的「数据科学家」最好的舞台,李飞飞为这个舞台准备了20年。

从清华附中起飞:李飞飞如何走上数据科学之路?

李飞飞从小喜欢深挖钻研,参加了很多数学和物理竞赛。

在清华附中的国家教委理科实验班,没有了高考的压力,李飞飞便一头扎进了竞赛里。

16岁是个分水岭。那一年,他初三毕业进入了国家教委理科实验班,确定了后续保送进清华的道路。

本科的毕业设计,让他第一次接触到了数据科学。那个年代,大数据还没有兴起,但在当时的李飞飞看来,这个工作具有前瞻性的意义。

即使来到了2017年,「数据科学家」这个岗位也依然很「感性」。

因为当时,数据科学还不是一门大热学科,「数据科学家」的概念还停留在表层,很少有人能透过枯燥和乏味参悟到其中的魅力。

从2001年初到2002年上半年,在这一年多的时间里,李飞飞都沉浸在自己的毕设项目里,每天都和外文网站上的海量数据打交道。

通过对BBC、CNN等网站信息的拆解并分析Hyperlink资源,成功将网站的结构拓扑出来,并描绘出一个完整的后台,还初步实现了对网站信息的自动化理解。

「现在回头来,我们当时这个项目看其实是非常超前的,以当时的技术确实也也不大可能lead to somewhere」,在谈到本科毕设的项目时,李飞飞如是说。

虽然当时只用了一些分词、词频统计等简单的方法,但是已经有了现代NLP技术的影子。真正有前瞻思考的人总是走在时代的前面。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
深度学习-面向视觉识别的卷积神经网络,2016斯坦福大学公开课。课程介绍: 计算机视觉在社会中已经逐渐普及,并广泛运用于搜索检索、图像理解、手机应用、地图导航、医疗制药、无人机和无人驾驶汽车等领域。而这些应用的核心技术就是图像分类、图像定位和图像探测等视觉识别任务。近期神经网络(也就是“深度学习”)方法上的进展极大地提升了这些代表当前发展水平的视觉识别系统的性能。 本课程将深入讲解深度学习框架的细节问题,聚焦面向视觉识别任务(尤其是图像分类任务)的端到端学习模型。在10周的课程中,学生们将会学习如何实现、训练和调试他们自己的神经网络,并建立起对计算机视觉领域的前沿研究方向的细节理解。最终的作业将包括训练一个有几百万参数的卷积神经网络,并将其应用到最大的图像分类数据库(ImageNet)上。我们将会聚焦于教授如何确定图像识别问题,学习算法(比如反向传播算法),对网络的训练和精细调整(fine-tuning)中的工程实践技巧,指导学生动手完成课程作业和最终的课程项目。本课程的大部分背景知识和素材都来源于ImageNet Challenge竞赛。 主讲人: 李飞飞,斯坦福大学计算机科学系副教授。担任斯坦福大学人工智能实验室和视觉实验室主任,主要研究方向为机器学习、计算机视觉、认知计算神经学。她在TED上的演讲,如何教计算机理解图片。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值