GPT-4o 17人Omni金牌团队首揭秘!清北上交中科大6位华人领衔 | 最新快讯

  新智元报道

  编辑:编辑部

  就在刚刚,奥特曼表扬了 GPT-4o 关键团队的成员。17 位 Omni 团队成员中,有 6 人是华人,本科分别来自清华、北大、上交、中科大、MIT 等,甚至还有一位是美国 IOI 队教练。奥特曼大赞:正是你们的努力,让「Her」成为现实。

  几天前的发布会上,OpenAI 再次向全世界证明,它永远走在 AI 领域的最前沿。

  眼看着《Her》中的 Samantha 在自己眼前成真,那一刻,全世界为之振奋。

  就在刚刚,GPT-4o 的关键团队信息,也被公布了出来。

  就是这个名为「omni」的团队,发挥出了不可思议的潜力,让 OpenAI 的首个原生全多模态模型成为可能。

  Sam Altman 盛赞,如果没有团队负责人 Prafulla Dhariwal 长期以来的远见、才智、信念和决心,就没有 GPT-4o。而整个团队的努力,才使得他所期待的人机交互革命成为现实。

  OpenAI 联创 Greg Brockman,也表扬了这位肩负着整个团队使命的负责人。

  多亏了 Prafulla Dhariwal「建立全能大模型」的信念,并且在过去的 18 个月中联合了 OpenAI 的许多团队,在多个团队的通力合作下,GPT-4o 才得以诞生。

  根据负责人的说法,其实 OpenAI 早就有意打造这样一个 Omni 大模型了。

  然而一年多之前,团队曾经做过多次多模态的尝试,却没有一次能让最大的 GPT 成功地完成多模态运行。

  幸运的是,团队成员齐心协力,用出色的能力攻克了种种能力,使 GPT-4o 成为可能。

  网友锐评:「你们确实处于创新的前沿,执行水平达到了大型科技巨头梦寐以求的水平。」

  而如此惊艳的演示,竟然是一个不到 20 人的小团队打造出来的。

  Omni 团队揭秘

  接下来,一起看看打造 OpenAI 首个原生多模态 GPT-4o 背后团队成员,都有谁?

  负责人 Prafulla Dhariwal

  领导 GPT-4o 开发的负责人 Prafulla Dhariwal,是一位印度小哥。

  他于 2017 年获得了麻省理工学院的计算机科学学士学位。

  毕业前夕,Dhariwal 就加入了 OpenAI(那时 OpenAI 仅成立一年),并在 17 年正式成为研究科学家。

  至今,Dhariwal 任职 OpenAI 7 年,可以说,他见证了这家初创公司的成长全过程。

  在此期间,Dhariwal 参与了诸多重磅的研究。

  根据 LinkedIn 个人主页,他将发表论文的领域分类为生成式模型、无监督学习、Scaling Law、定理证明、强化学习、量子复杂性。

  其中包括 DALL·E 3、DALL·E 2,模型一致性等,还共同提出了著名的「Scaling Law」。

  值得一提的是,Dhariwal 曾在高中期间参加了几次国际奥林匹克竞赛。

  他是 2012 年 IMO 竞赛的金牌得主,也是 IAO(国际天文学奥林匹克竞赛)、IPhO(国际物理奥林匹克)的金牌获得者。

  有网友称,Prafulla Dhariwal 从高中起就是我的灵感来源。他当年为印度赢得了 IAO、IPhO 和 IMO 的金牌,并在 OpenAI 大学毕业后从事非常酷的 VAE、Gans、DDPM、一致性模型等项目。

  6 位华人

  Li Jing

  Li Jing 在团队中发挥的作用是,让大家拥有令人惊叹的图像/3D 生成。

  此前,他为 Dall-E 3、Sora、GPT-4o 都做出过贡献。

  他曾在 Meta 做过 2 年的博后研究员,随后进入 OpenAI 成为全职研究员。

  虽然才入职 OpenAI 不到两年,但他已参与过多个 OpenAI 的重磅研究了。

  他在北京大学获得物理学学士学位,在 MIT 获得物理学博士学位。

  Casey Chu

  Casey Chu 是团队的老员工了。

  他从 2020 年 4 月就入职了 OpenAI,如今已经是 4 年的「元老」了。

  他本科在哈维·穆德学院获得数学学士学位,在斯坦福大学获得计算数学硕士学位。

  Mark Chen

  Mark Chen 是 OpenAI 的前沿研究主管,并且还是美国 IOI 队的教练。

  在团队漫长的研究中,Mark Chen 是大家奋斗的支柱。

  他已是 OpenAI 五年多的老员工。此前曾在微软、Trading 实习,在哈佛做访问学者,在量化研究工作过 5 年,并且成为合伙人。

  他毕业于 MIT 数学-计算机专业。

  Jiahui Yu(于佳慧)

  Jiahui Yu 负责带领 OpenAI 的感知团队。

  此前,他曾担任 Google Brain 和 Google DeepMind 的高级研究科学家和经理。

  他的研究领域包括序列建模(语言、语音、视频、金融数据)、计算机视觉、生成模型和高性能计算。

  在研究生期间,他在微软亚研院、旷视科技、Adobe Research、Snap Research、Jump Trading、百度研究院、Nvidia Research 和 Google Brain 都有过实习经历。

  他本科毕业于中国科技大学少年班,获得计算机学士学位。博士毕业于伊利诺伊大学香槟分校。

  Huiwen Chang

  Huiwen Chang 在 OpenAI 已经工作一年。

  此前她曾在谷歌工作过 5 年,在微软亚研院、Adobe、Facebook 有过实习经历。

  她在清华大学计算机科学实验班(姚班)取得学士学位,然后在普林斯顿大学取得博士学位。

  Yu Zhang

  他在 OpenAI 工作了 8 个月。他此前曾在谷歌 DeepMind 工作过 6 年,还在微软亚研院、微软实习过。

  他本科在上海交通大学取得计算机学士学位,在 MIT 取得博士学位。

  其他关键成员

  James Betker

  James Betker 在这个团队中负责得非常全面,应有尽有,包括图像、音频、数据、集成、后训练(post-training)。

  这是从谷歌跳槽至 OpenAI 的大咖。

  在加入 OpenAI 之前,Betker 曾在谷歌担任了 3 年的软件工程师。

  此外,他还在 2011 年加入了 Garmin International,现任职高级软件工程师。

  他曾获得了 UCSB 的计算机科学学士学位,与此同时,在 2005-2009 年期间,还是在学校担任 4 年的软件工程师。

  Jamie Kiros

  Jamie Kiros 让 GPT-4 获得当前最佳的视觉感知能力,做出了非凡的成绩。

  此前,他曾在谷歌工作过 3 年。

  他在多伦多大学取得计算机博士学位。

  Rowan Zellers

  Rowan Zellers 在 Omni 团队中的贡献是,让 OpenAI 可以像人一样自然地看到视频。

  毕业后,他加入了艾伦人工智能研究所(AI2)成为研究实习生。

  2022 年 6 月,成为 OpenAI 的一名技术人员。

  Zellers 曾获得了哈维·穆德学院(Harvey Mudd College)的数学和计算机科学的学士学位,以及华盛顿大学计算机科学博士学位。

  Alexis Conneau

  在加入 OpenAI 之前,Alexis Conneau 就已经提出了「Her」(视觉模型)的理念,并且坚持不懈地执行并实现了它。

  目前,Conneau 是 OpenAI 的语音 AGI 负责人。

  进入他的个人主页,就知道 Conneau 对 Her 有多么痴迷了。

  Conneau 在加入 OpenAI 之前,曾在 Meta、谷歌担任过研究科学家,有着 9 年的自然语言深度学习的经验。

  华盛顿邮报曾对 Conneau 进行了个人专题报道——

Alexis Conneau 曾帮助 Meta(Facebook)和谷歌打造了以惊人的精确性理解数十种语言的 AI 系统。

  在 Meta 期间,Conneau 团队推进了机器学识算法,将语言用数字抽象形式表现的能力,最终训出能够处理同步语言的 AI。

  比如 XLM-R 模型可以处理 100+ 语言,其准确性几乎与单一语言模型一致。

  Conneau 在 Meta 做的最后一项工作是 Wave2vec-U。这是一种无人监督的语音识别系统,可以从音频中读取单词。

  此外,他还发明了一种算法 XLm-Roberta,能够阅读各种语言的海量数据。这项研究也成为他被引最高的成果。

  他曾获得了 Facebook AI Research 的计算机科学博士学位,在巴黎-萨克雷高等师范学校获得了机器学习硕士学位,以及巴黎综合理工学院获得了数学硕士学位。

  Gabriel Goh

  Gabriel Goh 和接下来要介绍的 Ishaan Gulrajani,在团队中主要贡献是,提出了一系列相关的「Scaling Law」的工作。

  这样当所有这些模态(视觉、语音等)汇集在一起时,模型便可以擅长处理一切事物!

  Gabriel Goh 也是 OpenAI 5 年多的老员工,此前曾在苹果工作 1 年半。

  他在英属哥伦比亚大学取得硕士学位,在加州大学戴维斯分校取得了数学专业博士学位。

  CBC 曾报道过 Gabriel Goh 到 OpenAI 后,在 2021 年设计的 CLIP 系统。

  他参与的这项研究,揭示了 CLIP 无法正确识别图像,会把放着 iPod 字样的苹果识别为 iPod。

  Ishaan Gulrajani

  Ishaan Gulrajani 目前是 OpenAI 的研究员。

  根据 OpenReview 的介绍,他曾在谷歌和 Meta 工作过。并在 MIT 获得学士学位,以及在斯坦福大学获得博士学位。

  Alex Nichol

  Alex Nichol 在团队中主攻 3D 图像生成,也是 DALL·E 2 的共同发明者。

  此前,他一直是一位自由职业者。

  随后,在 2107 年加入了 OpenAI 任技术研究员,中间还离职有近一年时间,并在 2020 年 5 月再次入职。

  比如,在 GPT-4o 官方报博客中的演示,它可以生成一致的试图,重建复杂 3D 模型。

  这些所展示出的成果,离不开 Nichol 的贡献。

  Heewoo Jun

  与 Nichol 一样,Heewoo Jun 在团队中也在负责图像、3D 生成。

  根据 OpenReview 介绍,他曾在 2015-2019 年间在百度(美国研究院)担任研究员,2019 年从百度离职后加入 OpenAI 担任研究员至今。

  他曾获得了斯坦福大学的硕士学位,以及多伦多大学的学士学位。

  Christine McLeavey

  这位 Christine,是一位宝藏研究员。

  她在 OpenAI 已经工作 6 年。

  此前,她曾在 Unity 从事 2D、3D、VR、AR 游戏的工作。

  还曾做过 4 年的钢琴演奏艺术家,创办了交响乐、芭蕾、歌剧院管弦乐团的音乐家组织。

  她在普林斯顿取得了艺术、物理、和钢琴表演的学士学位。

  在毕业后,她在世界顶尖音乐学院——茱莉亚学院进修了两年钢琴。

  三年后,她在斯坦福取得了神经科学的硕士学位。

  al jabr

  最后这位「al jabr」,并没有公布自己的真名,因此资料无从查找。

  参与 GPT-4o 的所有成员

  网友:下一个方向是什么

  在留言区,网友们纷纷表示赞叹——

  「团队使这种令人难以置信的突破性体验成真,o将彻底重构人机交互的方式。」

  「GPT-4o 是创新和协作的证明,你们的奉献精神,构造了人工智能进步的灯塔。」

  所以,Omni 团队的下一步,又会给全世界带来怎样惊人的大作?

  参考资料:

  https://twitter.com/sama/status/1790816449180876804?t

java相关学习资源、电视剧等资源下载,请点击

来自: mp.weixin.qq.com

  • 6
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

www3300300

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值