OpenAI高层巨变:联创辞职总裁休假,网友:领导层成了空壳

梦晨 克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

刚刚,OpenAI高层大地震:

联创John Schulman辞职跑路,联创&总裁Greg Brockman长期休假,产品副总裁Peter Deng也被曝离职。

6f0ae90d9ad04d0a9158cbea5ea005c4.png

John Schulman(约翰·舒曼),长年领导OpenAI强化学习团队,被誉为“ChatGPT架构师”

也是他在Ilya Sustkever离开之后,临时接管了超级对齐团队。

现在他宣布“做了一个艰难的决定”,加入隔壁Anthropic,也就是Claude团队。

bfcf5362b2b2e02925e0812fa96b12fb.png

与此同时,OpenAI总裁Greg Brockman也宣布将休长假,直到年底。

OpenAI计划10月1日起在全球各地举办开发者日等活动,他也将缺席。

52e8217c0da128a74da0df793c89c172.png

Brockman自述是在连续工作了9年之后第一次放松,但对年底之后的计划说的比较模糊,也有网友认为是出于保密协议。

e86b12309a7b5526ab0ec41157aad1e6.png

在舒曼离职官宣20分钟后,奥特曼在回复中感谢了舒曼的贡献,以及回忆了两人2015年初次见面时的情景。

但截至目前,奥特曼没有对Brockman休假做任何回应。

aa8fe156dcd6068504aa7d396e1b71bd.png

奥特曼平常有打字句首字母和“i”不用大写字母的习惯,但每当重要同事选择离开时,他都会表现得更正式一些。

72b68ae221c25c02b1236f6964874b5f.png

著名OpenAI内幕爆料账号苹果哥表示:现在领导层已经成了一个空壳,你们还是赶紧发布产品吧。

cf77db998aa709bb0366c5a3b3943c42.png

ChatGPT架构师离职

舒曼本科在加州理工学习物理,在UC伯克利短暂学习过神经科学,后来师从强化学习大牛Pieter Abbeel,完成计算机科学博士学位。

在他成为OpenAI联创时,博士还未毕业。

OpenAI是他在实习之外工作过的第一家也是唯一一家公司。

d0a2f5bf64f38ba7d22c13b00d9c0c82.png

他的代表作、最高引论文PPO,也就是ChatGPT核心技术RLHF中选用的强化学习算法。

b55a490923c35e315c1bf7a16cc6d0cd.png

后来在从GPT-3.5、GPT-4到GPT-4o的一系列工作中都领导了对齐/后训练团队。

这次他自述的离职原因也是与此相关:

希望加深对AI对齐的关注,并开启我职业生涯的新篇章,让我可以重返实际的技术工作。

不过他也给足了OpenAI面子,补充到“不是因为OpenAI缺乏对安全对齐工作的支持而离开”,只是出于个人希望集中精力。

在ICML2023的演讲中,舒曼自述过个人接下来关注的研究方向之一:如何避免过度优化

  • ChatGPT 中的一些令人讨厌的行为(例如过度道歉)是过度优化的结果。

  • RLHF很容易对狭窄的指标进行过度优化,例如模型可能学会了能获得奖励的捷径,但没有真正理解。

  • 适当的对话任务训练需要推理、换位思考和知识,研究人员必须精心设计训练过程、奖励功能和数据集

  • 奖励信号必须评估整个对话的质量,而不仅仅是个别反馈。

dd58784d2624d05d0a3fbb8e06ae50bb.png

在今年五月份与播客主持人Dwarkesh Patel访谈时,舒曼也表示,算力应该更多从预训练向后训练转移

fd9e676aa52f933c87fc141fb5cdd66a.png

OpenAI人才持续流失

由于在AI安全方面理念和奥特曼不合,OpenAI的人才发生了大量流失。

今年5月,超级对齐团队的两名负责人——首席科学家Ilya Sutskever和RLHF发明者之一Jan Leike,在同一天内相继离开OpenAI。

a77bdff5a17bb280d84e4aa724167b9c.png

彼时离超级对齐团队的成立,过去还不到一年。

Jan Leike离开后更是连发十几条推文,对着OpenAI疯狂炮轰,控诉其没有兑现20%算力的承诺,并且对安全的重视程度远不及产品。

后来,Jan Leike选择加入了OpenAI的竞争对手Anthropic,继续进行超级对齐的研究。

在GPT-4项目上与Jan Leike共同领导对齐工作的Ryan Lowe,也已于3月底离开OpenAI。

还有超级对齐成员之一William Saunders,以及参与过GPT-4对抗性测试的Daniel Kokotajlo,也都从OpenAI离职。

更不必说隔壁Anthropic的创始人Dario Amodei和Daniela Amodei兄妹,也是OpenAI出身。

哥哥Dario离开前是OpenAI的研究副总裁,妹妹Daniela则是安全与策略部门副总监,走的时候还把GPT-3首席工程师Tom Brown等十几名员工一起带到了Anthropic。

导致他们选择出走创业的原因之一,就是OpenAI在安全问题尚未解决的情况下就直接发布了GPT-3,引发了他们的不满。

对安全的重视,加上创始人的背景,也让Anthropic成为了包括Jan Leike和这次离职的舒曼在内的OpenAI员工的主要去处之一。

0ae34498078c50ea6ca39ad169b09250.png

OpenAI这边最近在安全工作上也有所动作——

7月末,OpenAI把安全部门高级主管Aleksander Madry调离了安全岗位,并给他重新分配了“AI推理”的工作。

但OpenAI告诉媒体,Madry到了新职位上之后,仍将致力于人工智能安全工作。

CEO奥特曼也是强调,OpenAI一直都很重视安全工作,并坚持了“给整个安全团队至少20%算力”的承诺。

6d30a7d6205dc566251db2d8dbc24512.png

但眼尖的网友很快发现,奥特曼玩了一波偷换概念,原来承诺的的是给超级对齐团队20%算力,被偷偷改成了全部安全团队

所以,在奥特曼的推文之后,网友也是毫不留情地把这一背景信息添加了上去,并附上了当时OpenAI的官方链接。

632df3754d5a24f8c003fce546e2350d.png

emm……互联网还是有记忆的。

One More Thing

在内部大量人才流失的同时,OpenAI的“老仇人”马斯克这边也有新的动作——

马斯克刚刚再一次把OpenAI告上了法庭,一同被告的还有奥特曼以及总裁Brockman。

这次起诉的理由是,马斯克认为自己参与创立OpenAI之时受到了奥特曼和Brockman的“欺骗和敲诈勒索”。

284c8d392502fa32dc669459c92c4e67.png

马斯克称,自己当初参与并投资OpenAI就是因为相信了奥特曼的话,当时奥特曼承诺OpenAI是一个安全、开放的非营利组织。

但后来OpenAI成为了营利性组织,还把一部分股份卖给了微软,这让马斯克感到十分不满,认为自己遭到了背叛,痛斥奥特曼“背信弃义”。

马斯克的律师Marc Toberoff表示,此次诉讼和之前撤回的那起有很大差别,要求被告“对故意向马斯克和公众做出虚假陈述的行为负责”,并寻求“大规模追回他们的不义之财”。

同时,起诉书还要求撤销OpenAI对微软授予的许可。

参考链接:
[1]https://www.bloomberg.com/news/articles/2024-08-06/openai-co-founder-john-schulman-departs-for-ai-rival-anthropic
[2]https://www.cnbc.com/2024/07/23/openai-removes-ai-safety-executive-aleksander-madry-from-role.html
[3]https://x.com/sama/status/1818867964369928387
[4]https://www.documentcloud.org/documents/25031741-elon-vs-openai-again
[5]https://www.nytimes.com/2024/08/05/technology/elon-musk-openai-lawsuit.html

量子位年度AI主题策划正在征集中!

欢迎投稿专题 一千零一个AI应365行AI落地方案

或与我们分享你在寻找的AI产品,或发现的AI新动向

07ee12bfc7c644f5c57c14548e2ce2b3.png

点这里👇关注我,记得标星哦~

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值