OpenAI,是一家开放人工智能研究和部署公司,其使命是确保通用人工智能造福全人类。创立于2015年12月,总部位于美国旧金山。现由营利性公司OpenAI LP及非营利性母公司OpenAI Inc组成。
OpenAI最早为非营利组织,于2015年底由包括萨姆·奥尔特曼(Sam Altman)、彼得·泰尔(Peter Thiel)、里德·霍夫曼(Reid Hoffman)和埃隆·马斯克(Elon Musk)等创办。2016年,发布首个产品,一款开源强化学习工具包——OpenAI Gym和Universe。随着2018年埃隆·马斯克退出以及大模型对资金超预期需求,2019年3月,公司从非营利性转变为“封顶”的营利性;同年7月,微软与OpenAI合作,注资10亿美元共同研发新的Azure AI超算技术。2021年,设立初创企业基金支持AI初创公司。2022年11月,全新聊天机器人模型ChatGPT问世,产品上线仅5天用户数量突破100万。2024年2月,文生视频大模型Sora问世,在全球内容创作行业卷起新的风暴,成为人工智能发展进程中的“里程碑”,使OpenAI估值不到10个月增加近两倍,或达800亿美元。2024年5月,推出GPT-4o,处理文本、图像、音频能力更自然、流畅。6月26日消息,OpenAI推迟发布语音助理。
2023年,公司收入突破16亿美元。微软是最大的投资者,拥有OpenAI股份49%。OpenAI跻身全球TOP50网站,位列福布斯《2023云计算100强榜单》榜首。以企业估值7100亿列2024年·胡润全球独角兽榜第三。
公司发展
早期发展
2015年12月11日,OpenAI由埃隆·马斯克、美国创业孵化器Y Combinator总裁萨姆·奥尔特曼、全球在线支付平台PayPal联合创始人彼得·蒂尔等硅谷科技大亨创立。
OpenAI最早作为非营利组织。2015年底,由Elon Musk、萨姆·奥尔特曼和其他投资者成立。埃隆·马斯克(Elon Musk)与其他硅谷科技大亨进行连续对话后,决定共同创建OpenAI,希望能够预防人工智能的灾难性影响,推动人工智能发挥积极作用。特斯拉电动汽车公司与美国太空技术探索公司SpaceX创始人埃隆·马斯克、Y Combinator总裁萨姆·阿尔特曼、天使投资人彼得·泰尔(Peter Thiel)以及其他硅谷巨头2015年12月份承诺向OpenAI注资10亿美元。
2016年4月27日,发布首款产品OpenAI Gym Beta。6月21日,OpenAI宣布了其主要目标,包括制造“通用”机器人和使用自然语言的聊天机器人。OpenAI研发主管伊利娅·苏特斯科娃(Ilya Sutskever)、OpenAI CTO格雷格·布劳克曼(Greg Brockman)硅谷知名创业加速器Y Combinator总裁萨姆·奥尔特曼(Sam Altman)以及连续创业家埃隆·马斯克(Elon Musk)等人联合发表博文称:“我们正致力于利用物理机器人(现有而非OpenAI开发)完成基本家务。”12月5日,发布Universe。
2017年,“情绪神经元”和OpenAIFive项目的突破,使得OpenAI开始关注大型语言模型(LLM)和参数规模,实现AGI的信念增强。7月20日,发布Proximal Policy Optimization算法。
OpenAI成立初期,机器人技术是主攻方向之一,由联合创始人沃伊切赫·扎伦巴领导,试图打造一个“通用机器人”。2019年,研究人员曾联合发表论文,声称正朝着训练机器人系统执行各种日常任务迈出基础性的一步。但是2020年10月,OpenAI放弃这一努力,扎伦巴将此归咎于缺乏训练数据。
转型期
由非营利组织转向混合结构
2018年,随着Elon Musk的退出,以及大模型对资金超乎预期的需求,2019年3月,OpenAI从非营利性转变为“封顶”的营利性。在非营利母公司主体下,创建了一个限制性营利实体OpenAI LP,引入了上限利润模式,允许OpenAI LP合法地吸收风险投资和员工持股。OpenAI转向了混合结构:由营利性公司OpenAI LP及非营利性母公司OpenAI Inc组成。
2019年7月,微软(Microsoft)宣布与OpenAI开展为期多年的合作。微软投资OpenAI10亿美元,双方将携手合作替Azure云端平台服务开发人工智能技术。微软也成为OpenAI的独家云供应商和OpenAI新AI技术商业化的首选合作伙伴。微软的加持使得OpenAI的大模型开发如虎添翼。
设立创业基金,由投资模式转向孵化器模式
2021年5月,OpenAI 官方宣布了成立1亿美元的人工智能创业基金,该基金将由OpenAI 管理,并由微软和其他OpenAI 合作伙伴投资,计划投资1亿美元来帮助更多AI初创公司。投资方向:少数早期阶段的创业公司,且处于可以产生变革性影响的领域,如医疗保健、气候变化和教育以及基于生产力的人工智能工具。
OpenAI通过“资金+技术+战略”支持的方式,支持优质的AI初创公司;反过来,被投公司成长起来后,增加OpenAI产品落地的场景需求和产业知识,从而反哺基础技术创新。这一模式使得OpenAI可以超前把握未来颠覆性技术的机会,并超前投资布局未来产业。
这一转变让OpenAI的投资模式变为孵化器模式,从而更加高效地对目标企业进行投资与技术支持。从而有条件开始自己的第二阶段战略:通过“资金+技术”投资初创企业的方式积极布局,为嵌入未来海量应用场景和指数型、裂变式增长铺路。
OpenAI转型期研发动态
发布时间 | 研究动态 |
---|---|
2018年2月20日 | 研究防止恶意使用AI; |
2018年4月9日 | 发布OpenAI宪章; |
2018年7月30日 | 强化学习技巧; |
2019年2月14日 | 提升语言模型GPT-2模型; |
2019年3月11日 | 开放人工智能有限合伙人; |
2019年4月15日 | OpenAI五人击败Dota 2世界冠军; |
2019年4月25日 | 发布深度神经网络MuseNet; |
2019年8月20日 | 跟进GPT-2; |
2019年9月17日 | 研究多代理交互中的紧急工具使用; |
2019年10月15日 | 研究用机械手解魔方; |
2019年11月5日 | 发布GPT-2:1.5B版本; |
2020年4月30日 | 发布神经网络Jukebox; |
2020年6月11日 | 开放人工智能应用程序接口;OpenAI宣布了GPT-3语言模型 |
2021年1月5日 | 研究连接文本和图像神经网络CLIP; |
2021年1月5日 | 研究从文本创建图像神经网络DALL·E; |
2021年3月4日 | 研究人工神经网络中的多模式神经元; |
2021年8月10日 | 发布开放人工智能法典; |
2022年4月6日 | 发布新的人工智能系统DALL·E 2。 |
发展期
主要历程
2022年11月30日,OpenAI发布ChatGPT全新聊天机器人模型。ChatGPT这一款革命性产品的上线引爆全球,成为用户破亿速度最快的消费级应用。全年营收达到2800万美元。
2023年1月,ChatGPT的月访问量超6.7亿次,将OpenAI推上全球访问量前50大网站榜单。
2023年2月16日,OpenAI买下了超优质域名AI.com,并将其链接跳转到了ChatGPT; 同年3月,GPT登陆Bing,对搜索引擎带来革命性重构。根据外媒TheInformation报道,OpenAI创始人最近对员工透露,其年营收达到了13亿美元,也就是同比增长超过45倍。OpenAI逆袭成全球AI“新王”,开启的新一轮AI革命的大幕。
2023年5月,OpenAI开放众多插件(当时已有70个),让用户得以利用插件组合满足个性化需求,成为了OpenAI创建生态系统、从产品思维转变至平台思维的标志性事件。5月18日(当地时间),在美国地区推出ChatGPT的首个官方移动应用程序ChatGPT APP,5月19日跃升美国地区iOS APP Store(应用程序商店)排行榜首位。分析人士指出,此举将快速开启GPT大模型在垂直领域的应用,加速行业应用。
2023年7月26日,安卓版ChatGPT在美国、印度、孟加拉国和巴西提供下载。
2023年8月16日(当地时间),OpenAI宣布收购初创企业Global Illumination,后者的整个团队已加入OpenAI,共同开发包括ChatGPT在内的核心产品。同年,9月14日,OpenAI宣布将在爱尔兰都柏林开设办公室,这将是该公司的第三个办事处。
2023年11月在首届OpenAI开发者大会上,OpenAI首席执行官萨姆·奥尔特曼回顾了公司过去一年的发展历程,已经有200万开发者正在使用OpenAI的API(应用程序接口),在全球各地提供多种多样的服务;92%的财富500强公司正在使用OpenAI的产品搭建服务,而ChatGPT的周活用户数也达到1亿人。奥尔特曼向全球开发者和ChatGPT用户展示了AI龙头即将推出的一系列产品更新:一是,GPT模型再迭代,OpenAI推出GPT-4 Turbo;
二是OpenAI开始向AI个人助理的方向努力;
三是宣布将上线一个GPT商店,OpenAI允许用户申请上线自己制造的GPT,并承诺根据GPT的使用情况向创建者支付费用。
2024年3月消息,OpenAI宣布推出全新的人工智能模型——“语音引擎(Voice Engine)”。这款自2022年起便默默研发的模型,如今已成为OpenAI文本转语音API以及本月早些时候发布的新版ChatGPT语音与朗读功能提供支持。
当地时间2024年5月28日,OpenAI发布声明,宣布公司董事会成立安全与安保委员会,根据声明,该委员会的首要任务是在未来90天内评估并进一步发展OpenAI的流程和保障措施。90天后,委员会将与全体董事会分享建议。在全体董事会审查之后,OpenAI将以符合安全和保障的方式公开分享已采纳建议的最新进展,OpenAI透露,最近已开始训练下一个前沿模型,“预计由此产生的系统将使我们在通往通用人工智能(AGI)的道路上达到更高的能力水平”。
当地时间7月30日,美国开放人工智能研究中心(OpenAI)宣布,开始向部分ChatGPT Plus用户开放GPT-4o高级语音模式,并计划于秋季向所有Plus付费用户开放。
产品研发动态
2022年11月30日,推出了 ChatGPT,这一款基于 GPT-3.5 的对话机器人,可以与用户进行交互式的聊天。同年12 月,ChatGPT 爆红,全球造访量至少17亿用户,成为了历史上用户量增长最快的应用程序。
2023年2月, 发布了DALL-E 3。这是一款可以根据描述生成图像的模型,并将其集成到 ChatGPT 中,让用户可以通过聊天创造新的图像;推出ChatGPT Plus订阅服务。
2023年3月,发布GPT-4,一款比 GPT-3.5 更强大的语言模型。
2023年4月,GPT-4 正式上线并被应用到 ChatGPT Plus 中,提供给付费用户使用。
2023年5月,OpenAI 宣布与微软合作,在 Azure AI 超级计算平台上部署 ChatGPT,并提供更高效和可扩展的服务。OpenAI推出了ChatGPT的iPhone应用程序ChatGPT APP。这款应用是ChatGPT的首个官方移动应用程序。5月25日,OpenAI在推特宣布,ChatGPT官方App现已在更多地区的App Store上线。
2023年6月,OpenAI 为 ChatGPT 增加了语音功能,让用户可以通过语音与机器人进行对话,并听到机器人的回答。
2023年7月,ChatGPT推出定制指令功能。7月26日,OpenAI宣布,安卓版ChatGPT在美国、印度、孟加拉国和巴西提供下载,并计划将其推广至更多国家。
2023年8月15日(当地时间),OpenAI官宣,将GPT-4用于内容策略开发和内容审核决策,以实现更一致的标签、更快的策略优化的反馈闭环以及更少的人工审核人员参与。当地时间8月28日,OpenAI宣布推出企业版ChatGPT。
2023年10月3日(当地时间),微软官宣,OpenAI最新的DALL-E 3模型现已面向所有Bing Chat和Bing Image Creator用户开放。
2023年11月6日(当地时间),首届OpenAI开发者大会。在OpenAI 首届开发者大会开启前,ChatGPT 各种爆料已出,全新 UI 界面,人人可定制 GPT,将引领「智能体工程师」新职业诞生。萨姆·奥尔特曼向全球开发者和ChatGPT用户展示了即将推出的一系列产品更新。同日,OpenAI在官网宣布推出自定义版本ChatGPT,解禁了 ChatGPT 两大能力,一是上传多种类型文档,二是无需转换即可使用所有工具。11月22日,OpenAI宣布ChatGPT Voice功能向所有用户开放。ChatGPT Voice是使用 OpenAI 的语音技术Whisper创建的,该技术只需分析几秒钟的真人语音即可生成无限小时的对话。Spotify正在使用OpenAI 的语音技术将Lex Friedman、Dax Shephard和其他播客的内容翻译成西班牙语、法语和德语。
2023年12月14日,CEO萨姆·奥尔特曼在X平台发文称,已重新开放ChatGPT Plus订阅,在此前11月15日CEO 萨姆·奥尔特曼在X平台发文称,将暂停ChatGPT Plus新用户注册。
2024年1月10日(当地时间),OpenAI宣布推出GPT商店和ChatGPT Team服务,ChatGPT Team和GPT Store都是OpenAI公司新的收入驱动力。同日,OpenAI对使用条款进行更新,删除了禁止他们的技术被用于军事用途的条款。
2024年2月16日,OpenAI发布首款“文本生成视频”大模型Sora,使其成为最新一家采用生成视频技术的人工智能公司。同时,OpenAI宣布一项要约售股交易,由此OpenAI整体估值高达800亿美元,一年内飙升两倍多。
2024年3月,OpenAI发布大模型加持的机器人Figure 01。3月,OpenAI官方公布Sora初期合作试用反馈。当地时间3月29日,OpenAI在官网首次展示了名为“Voice Engine”的语音生成模型。
2024年4月,人工智能初创公司OpenAI宣布,即日起用户无须注册即可开始使用ChatGPT的功能。
2024年4月30日,OpenAI宣布向所有ChatGPT Plus用户开放“记忆功能”。
2024年5月7日(当地时间),OpenAI发布公告称,为了区别照片是由相机还是自家AI生成的,公司推出了一款图像检测分类器,用来分析一幅图像是由OpenAI的“文生图”工具DALL·E 3生成的概率。并宣布加入C2PA的指导委员会。
2024年5月14日,OpenAI推出了ChatGPT桌面版应用程序。同日,OpenAI宣布推出其最新旗舰生成式AI模型 GPT-4o,GPT-4o将免费提供给所有用户使用。
2024年5月,在巴黎举办的最大科技活动VivaTech上,OpenAI曝光LLM路线图,GPT Next2024年底发。5月28日,OpenAI表示已开始训练新人工智能模型,以取代其ChatGPT聊天机器人目前所依赖的GPT-4系统;5月30日,宣布推出为大学开发的ChatGPT Edu教育版。
2024年5月31日消息,OpenAI确认,正式重启其先前放弃的机器人团队。在过去的一年里,OpenAI内部创业基金投资几家公司,这些公司试图开发人形机器人,其中包括 Figure AI、1X Technologies 和 Physical Intelligence。
2024年6月21日,OpenAI发布公告称,完成了对数据库检索和分析公司Rockset的收购。公司将整合Rockset的技术和人员,强化各项产品的检索基础设施。
2024年6月25日消息,OpenAI宣布,为了维护服务质量和安全性,将采取额外措施来限制来自当前不支持的国家和地区的API流量。OpenAI曾公开发表“阻止国家相关威胁行为者对人工智能的恶意使用“一文,其中提及到阻止并限制了来自(包括中国、朝鲜、伊朗、俄罗斯)的一些用户的使用。
2024年6月26日消息,OpenAI推迟发布ChatGPT的语音助理功能,称需要额外数月的时间来处置某些安全问题。
2024年7月10日消息,微软当地时间周一宣布将放弃在 OpenAI 董事会的观察员席位,称 OpenAI 在过去八个月中取得了“重大进展”,对公司发展方向充满信心,因此不再需要该席位。
2024年7月13日,据金融界消息:OpenAI正在研发新的先进人工智能,代号为草莓(Strawberry)。
2024年7月18日凌晨,OpenAI公布的最新技术研究Prover-Verifier-Games (PVG)引发业界广泛关注。这项旨在提升AI模型推理和输出准确性的新技术,很好的解决了输出“黑盒”这个难题。同日,推出新的人工智能(AI)模型“GPT-4o mini”。同日,谷歌等14家科技公司在阿斯彭安全论坛上宣布成立安全人工智能联盟(CoSAI),创始成员还包括微软、亚马逊、英特尔、英伟达、IBM、思科、Paypal、OpenAI、Anthropic、Cohere、Chainguard、WIZ、GenLab。当地时间7月25日,OpenAI推出了名为“SearchGPT”的搜索新功能。8月消息,OpenAI开发了一种检测某人何时使用ChatGPT撰写论文的工具,不过由于在透明度承诺和留住用户之间摇摆不定,OpenAI尚未发布该工具。8月6日消息,OpenAI 公司宣布将于2024年10月1日起,在旧金山、伦敦和新加坡举办 2024 年度 DevDay 活动。8月9日,OpenAI 宣布ChatGPT 免费用户可以每天使用其 DALL-E 3 模型生成图片。
全球布局
OpenAI海外扩张,显示其全球化战略,有助于本地化服务和产品,加强与全球市场联系。奥尔特曼称,扩张是吸引全球一流人才、推动通用人工智能开发和政策创新的机会。随着欧盟寻求对人工智能进行监管,在伦敦设立办事处将对OpenAI有利。
布局时间 | 分布国家 | 办事处 | 项目简介 |
---|---|---|---|
2023年6月 | 英国 | OpenAI伦敦 | 是在美国以外设立的首家海外分部 将专注提升研究和工程能力。 |
2023年9月 | 爱尔兰 | OpenAI都柏林 | 初期仅招聘国际薪资专员、商业职位,以及一个爱尔兰政策和伙伴关系负责人,三个职位。 |
2024年4月 | 日本 | OpenAI东京 | 公司在日本东京设立亚洲首个办事处,将业务扩展到亚洲。并承诺提供专门针对日语进行优化的GPT-4定制大模型,在翻译和总结日语文本方面具有更高的性能,运行速度比之前版本快3倍,对当地企业而言具有成本效益。由Tadao Nagasaki担任OpenAI日本总裁 |
融资历程
2023年1月OpenAI从微软公司筹集了100亿美元。据福布斯发布2023云计算100强榜单,2023年云计算100强企业的平均融资金额为8.05亿美元,高于一年前的6.1亿美元,其中原因包括了OpenAI的重大融资活动。
时间 | 融资额(亿美元) | 投资方 |
---|---|---|
2015.06 | 10 | 风险投资家彼得·蒂尔(Peter Thiel)、里德·霍夫曼(Reid Hoffman) Y Combinator创始合伙人杰西卡·利文斯顿(Jessica Livingston) 咨询公司Infosys 公共云市场领导者Amazon Web Services YC Research 萨姆·奥尔特曼(Sam Altman) 埃隆·马斯克(Elon Reeve Musk) |
2016.08 | 0.0012 | Y Combinator |
2019.03 | 未透露 | Khosla Ventures Reid Hoffman Foundation |
2019.04 | 0.1 | Matthew Brown |
2019.07 | 10 | 微软 |
2021.01 | 未透露 | 老虎全球管理 Bedrock Capital Andreessen Horowitz |
2021 | 20 | 微软 |
2023.01 | 100 | 微软 |
2023.04 | 3 | Andreessen Horowitz 等 |
2024.01 | 143 | MIS |
数据来源:crunchbase、Tracxn等公开资料整理。 |
财务状况
收入状况
报道机构及时间 | 统计时间 | 报告内容 | 金额 | 主要来源 |
---|---|---|---|---|
2023年12月13日 | 2022年 | OpenAI 非营利组织收入 | 44485美元 | 几乎全部来自投资收入 |
The Information 2023年8月 | 2022年 | OpenAI全年收入 | 2800万美元 | 受益于ChatGPT |
中国经营报 2024年3月1日 | 2023年 | 年化收入 (月收入x12) | 超16亿美元 | 一是软件开发者调用API,向其支付流量费用;二是ChatGPT Plus会员订阅费用;三是从微软销售OpenAI模型的收入中分成。 |
财务现状
2023年1月,微软继续投资 OpenAI,增援 100 亿美金,占股比例达到 49%,OpenAI 估值达到 290 亿美金。
OpenAI披露的收入并不包含营利部门的收入,而ChatGPT正在积极变现。根据OpenAI的融资信息, OpenAI的估值超过860亿美元。其财务状况是一个黑匣子。OpenAI的非营利地位受到了批评者的批评,他们质疑一家价值860亿美元的公司如何能由慈善机构控制。这也是2023年11月,OpenAI出现人事动荡的部分原因。
2024年1月,据The Information报道,受益于降价之后用户数强劲增长,OpenAI驶入商业化快行线,2023年底的年化收入(月收入x12)已突破16亿美元。OpenAI估值也水涨船高,正筹划新一轮融资,公司估值已达1000亿美元,成为SpaceX之后美国估值第二高的创业公司。全球范围内的估值排名位列第三。
2024年4月,过去十年间,OpenAI已获得融资总额143亿美元(约合1034.30亿元人民币),最新估值已超过800亿美元(5786.32亿元人民币)。
价值理念
哲学思想
有效利他主义(Effective Altruism),最初是慈善领域的一个相对简单的想法:在最有效的地方捐款,而不是仅仅为了“温暖的光辉”而无效地捐款。英国哲学教授威廉·麦克阿斯基尔(William MacAskill)是有效利他主义运动的创始人。鉴于以功利主义数学为基础,该运动开始吸引来自大型科技公司的支持者,他们开始进一步推动这一逻辑。当可通过赚更多钱来增加捐款数额时,为什么只关注捐赠的钱呢?这种逻辑表明,如果你有能力,在对冲基金或大型科技公司工作并进行捐赠比为慈善机构工作更道德。逻辑进一步推演,将信奉有效利他主义的人指向两件事:星际定居(这样人类就可以在地球灭绝事件之后生存)和通用人工智能(AGI,Artificial General Intelligence)——人工智能的超级智能版本,如果正确“对齐”,可以为人类谋福利,极大地提高我们生存的长度和质量。这就是OpenAI应该发挥作用的地方。
核心目的
OpenAI成立之初是一个真正的非营利组织,核心目的就是确保通用人工智能(AGI)安全引入。官网上都明确了OpenAI的目标是“确保人工智能造福全人类”。
核心理念
2020年。OpenAl提出核心理念——Scaling Law(缩放规律),其理念为大模型规模越大,其性能越好。2018年6月,0penAl推出第一代大语言模型GPT1,其参数规模为1.17亿,从总计4GB的书籍中训练得来;2019年,OpenAl再次推出参数规模为上一代的12倍,文本规模是上一代的8倍多的GPT2模型,其在文本生成方面更加出色。2020年6月推出的GPT-3,其参数规模达1750亿,是GPT2模型的116倍,也是微软Turing-NLG模型的10倍,成为当时市面上最大的自然语言处理模型。2024年年初爆火的Sora模型,再一次验证了Scaling Law的“大力出奇迹”的成功。
产品 | 参数量(亿) | 数据集来源 | 数据集大小(GB) |
---|---|---|---|
GPT1 | 1.17 | 书籍 | 4.6 |
GPT2 | 15 | | 40 |
GPT3 | 1750 | 维基百科、书籍学术期刊、Red-dit、CommonCrawl等 | 753 |
GPT3.5 | 与GPT3相近 | 类似GPT3,可能有更新 | |
GPT4 | 远大于GPT3 | 更大规模和多样化 | |
注:GPT3.5和GPT4的参数量及训练数据集未公开披露。 |
公司使命
OpenAI 的使命是确保人工智能(AGI)造福全人类。所谓 AGI,指的在最具经济价值的工作中胜过人类的高度自主系统。这一使命体现在 OpenAI 公司章程中。
在产品讨论中有策略地使用了“在这些选项中,哪一个让我们感觉更接近AGI”这一短语,有助于决定打造什么、和因为使命而决定放弃。明确的重点永远是速度的驱动力。使命有助于保持专注,也为许多新想法铺平了道路。
企业文化
在企业文化塑造方面,OpenAI将AI安全作为企业文化的核心部分,并在日常研发中贯彻这一理念。其通过与公众的沟通和交流,强化了社会对AI安全问题的认知和理解。
公司治理
融资结构
初始资金-捐赠
OpenAI初始资金是由企业家们捐赠,包括OpenAI创始人萨姆·奥尔特曼(Sam Altman),也包括埃隆·马斯克的1亿美元。资助者似乎承诺在该组织的发展过程中向该组织提供数十亿美元,因此它不需要担心支付该项目的账单。由于各种原因,包括性格冲突和方向差异——这种“纯粹”的非营利模式并没有持续多久,OpenAI原本以为可以从埃隆·马斯克那里得到的钱也枯竭了。
资金-混合结构
2019年,Altman的任务就是找钱,这使得OpenAI需要尝试吸引商业参与者的投资,OpenAI转向了混合结构。希望一家公司能够给他们带来回报。在Altman领导的一系列举措中,OpenAI转向了混合结构,然而,投资者被警告说,他们应该考虑到OpenAI可能永远不会产生利润,该公司不会主要专注于实现利润,而且他们最好认为,任何投资都更接近于捐赠,而不是产生回报。
为寻求融资,OpenAI在母公司OpenAI Inc.下,成立了子公司OpenAI global,其中微软的投资换取了OpenAI global高达49%的股份。作为交换,投资者可以预期的回报规模有一个相对慷慨的上限:即他们投入的100倍。因此,投资了10亿美元的微软最多可以期望1000亿美元的回报。
管理架构
董事会
OpenAI的使命是打造一种造福人类的技术,早期是一家非营利机构;2019年OpenAI转型为一家营利性公司,不过它仍然由一个非营利性的董事会管理。
微软成为OpenAI最大的投资者,但是在OpenAI董事会没有席位,甚至创始人萨姆·奥尔特曼本人也没有该公司的任何股权——这对于该行业来说几乎是闻所未闻的情况。从理论上讲,该模式将吸引志同道合的投资者,愿意接受极其不寻常的治理情况,这将有助于公司专注于其使命。
一方面,董事会拥有任免CEO的权力,但包括Altman在内,董事会成员不持有母公司股份,OpenAI理论上不存在沦为内部人控制的公司的危险;另一方面,投资者是子公司(也是母公司的运营主体)的大股东,却在公司董事会没有席位,做到了与经营隔离,仅仅是战略投资者。OpenAI试图建立一家大型科技初创公司,而创始人/首席执行官Altman并未拥有无懈可击的权力。
OpenAI的组织结构。
根据OpenAI官方说明,董事会的多数成员是相互独立的,各自有不同的背景和专业领域,共同决策和指导OpenAI的发展方向。而从董事会构成来看,奥尔特曼、布洛克曼和苏茨克维与公司具有最直接的联系,而另外三个则有其他社会任职。
2023年12月20日,OpenAI发布公告:将建立专门小组,来监督技术工作和安全决策的操作结构,公司管理层做决策,董事会有权推翻。
OpenAI发布公告
安全顾问团
当地时间2023年12月18日,OpenAI发布新安全指南,阐释公司计划如何应对最强大人工智能(AI)系统可能引起的极端风险。在该指南下,OpenAI只会在确定最新技术的安全性之后才会开始运用。公司加强其内部安全流程,将成立一个顾问团队以审核安全报告,再转交公司高层和董事会,并赋予董事会对高风险人工智能的否决权。
安全顾问团负责按月同时向公司管理层和董事会汇报,确保所有决策者充分了解情况。对于不同时间尺度的AI风险,OpenAI成立了三个团队来分别应对:
团队和流程
安全系统团队(Safety Systems)负责当下,减少现有模型如ChatGPT的滥用。
准备团队(Preparedness)负责不久的将来,识别和管理GPT-5等正在开发的前沿模型带来的新风险,由MIT教授Aleksander Madry领导。
超级对齐团队(Superalignment)负责遥远的未来。
三个安全小组应对内容
管理团队
OpenAI原本董事会成员包括:奥尔特曼、布洛克曼、苏茨克维、Quora首席执行官Adam D’Angelo、技术企业家Tasha McCauley以及乔治城大学安全与新兴技术中心的Helen Toner。其中:奥尔特曼、布洛克曼和苏茨克维都是OpenAI的联合创始人,加上首席技术官米拉·穆拉蒂(Mira Murati),四人构成了OpenAI的核心团队,是ChatGPT-3.5的背后“英雄”。
2022年6月,量子计算专家、ACM计算奖得主Scott Aaronson宣布,将加盟公司。
2023年早些时候,OpenAI董事会成员从9人缩减至6人,其中:萨姆·奥尔特曼、伊尔亚·苏茨克维以及OpenAI总裁格雷格·布罗克曼(Greg Brockman)是该实验室的三位创始人,而其他三人都是独立董事。
OpenAI发表声明
2023年11月,OpenAI董事会经历了“宫斗”风波。同月22日,OpenAI发表声明称:萨姆·奥尔特曼(Sam Altman)将回归OpenAI担任首席执行官。OpenAI组成新初始董事会,三名成员分别是:董事会主席布莱特·泰勒(Bret Taylor)、美国前财政部长拉里·萨默斯(Larry Summers)、问答网站Quora的首席执行官亚当·迪安杰罗(Adam D'Angelo)。11月30日,OpenAI宣布,萨姆·奥尔特曼(Sam Altman)已经回归担任首席执行官,米拉·穆拉蒂担任首席技术官,格雷格·布罗克曼担任总裁。
OpenAI任命三位新董事
2024年2月13日(当地时间),人工智能研究员、OpenAI创始成员之一安德烈·卡尔帕西(Andrej Karpathy)在社交媒体平台X上发文称,他已离开OpenAI。3月8日(当地时间),OpenAI公布“宫斗”调查结果的同时,宣布此次除了萨姆·奥尔特曼重回OpenAI董事会外,还将任命三位新董事,其中包括比尔和梅琳达·盖茨基金会前首席执行官Sue Desmond-Hellmann、索尼娱乐公司前总裁Nicole Seligman和Instacart公司首席执行官Fidji Simo。萨姆·奥尔特曼和这些新成员,将加入现任董事会成员——Quora首席执行官Adam D'Angelo、前美国财政部长拉里-萨默斯(Larry Summers)和前 Salesforce联席首席执行官、董事长Bret Taylor的行列。至此,OpenAl董事会将共有7名成员。8月,OpenAI已聘请Meta Platforms前高管伊琳娜·科夫曼(Irina kaufman)负责战略计划。
人才来源
OpenAl能持续打造出重磅产品,离不开其背后的顶尖团队成员。2023年2月底,Leadgenious和Punks & Pinstripes对OpenAl的736名员工背景作分析,有389名员工是由其他公司跳槽而来,其中193名成员工来自知名大厂公司。
OpenAl公司的人才来源
对外合作
与微软合作
OpenAI最大投资者
自2019年起,微软与OpenAI建立了合作伙伴关系。微软是OpenAI最大的投资者。
截至2023年12月,微软已向OpenAI这家人工智能初创公司投资了130亿美元,拥有其49%的股份。微软已将OpenAI的最新技术整合到自己的企业工具套件中,OpenAI也在微软的云服务上投入了大量资金。
双方业务合作
OpenAI所有技术都运行在微软Azure云服务器上,微软则为OpenAI提供大模型算力中心。微软(Microsoft)建立了全球最大的超级计算集群之一,以帮助OpenAI训练规模更大、能力也更强大的人工智能模型。微软的聊天机器人和搜索引擎Bing Chat根据OpenAI的模型构建,首次亮相以来用户使用该机器人已经聊天超过10亿次,能够根据用户提示转化图像的Bing Image Creator生成图像超过10万张。将OpenAl的技术整合到旗下搜索引擎必应、营销软件、GitHub编码工具、Micro-soft 365办公软件中,构建AI服务体系。
董事会席位
OpenAI在戏剧性的内斗事件之后,组成新初始董事会,微软获得了一个“无投票权观察员”席位,即公司代表可以参加OpenAI的董事会会议并获取机密信息,但在选举或选择董事等事项上没有投票权。这也一定程度意味着微软在OpenAI的后续经营管理中将拥有更大话语权。
微软总裁Brad Smith表示:“自2019年以来,微软与OpenAI建立了合作伙伴关系,促进了更多的人工智能创新和竞争,同时保持了两家公司的独立性。而唯一改变的是,微软现在将在OpenAI董事会中拥有一个无投票权的观察员席位,这与谷歌收购DeepMind等案例截然不同。”
利润及股份
收回130亿美元投资前,微软有权获得OpenAI公司75%的利润;收回投资后,微软将持有OpenAl公司49%的股份。
市场回应
CMA主动评估Microsoft和OpenAI的合作关系
2023年12月8日消息,英国竞争和市场管理局(CMA)认为,人工智能在市场上的扩张速度是史无前例的,而基础模型的快速发展意味着当前是这一变革性技术发展的关键时刻,人工智能开发商之间需要持续的竞争,这将有助于整个行业的发展,因此需要特别关注微软与OpenAI之间的合作关系。
英国反垄断监管机构表示,将审查微软与OpenAI的合作是否导致了“获取控制权”的情况,即一方对另一方具有重大影响力或控制权,如果存在可能导致阻碍行业竞争的问题,那么该机构后续将采取更多针对性行动。
与施普林格
2023年12月,新闻出版巨头施普林格出版集团(Axel Springer)与 ChatGPT 开发机构 OpenAI 宣布达成一项史无前例的协议,允许 ChatGPT 对来自 Politico 和 Business Insider 等媒体的新闻文章进行总结摘要。施普林格也成为全球第一家与 OpenAI 合作将新闻业与人工智能技术进行更深入整合的出版机构,这是媒体为在人工智能工具中使用其内容而争取资金补偿的一个重要里程碑。
OpenAI 和施普林格的协议生效后,当用户向 ChatGPT 提问时,它将以来自 Politico、Business Insider、Bild 和 Welt 等媒体的新闻文章摘要作为回应。
作为协议的一部分,施普林格将为 OpenAI 的大型语言模型(例如支持 ChatGPT 的 AI 模型 GPT-4)提供其媒体品牌的内容作为其训练数据。
与淡马锡
有意投资OpenAI
2024年3月,新加坡主权财富基金淡马锡有意投资 OpenAI。其高管最近几个月多次会见了 OpenAI 首席执行官萨姆·奥尔特曼。若淡马锡与 OpenAI 双方达成合作,这将是 OpenAI 首次获得国家背景的资金支持。
淡马锡由新加坡财政部完全控股。2021 年淡马锡规模高达 3810 亿新加坡元(当前约 2 万亿元人民币),其与另一只新加坡政府所有的基金 GIC 一同进入主权财富基金榜单前十。科技领域一直是淡马锡投资组合的一部分,而 AI 正成为其关注重点。
与政府合作
OpenAI通过与政府机构的积极对话和合作,推动了AI安全监管标准的制定和实施。其目标是将安全评估作为AI系统的必要环节,以防止不负责任的开发和使用行为。萨姆·奥尔特曼也多次在公开场合强调安全对于AI的重要性,积极推动建立国际规范和标准。
为何Altman欲与政府联手?显然,只要成为规则制定者,就能在竞争中赢者通吃。
北京时间2023年5月16日,OpenAI首席执行官萨姆·奥尔特曼在出席美国国会听证会时表示,面对日益强大的AI模型,政府监管机构的干预对于控制相关风险来说至关重要。萨姆·奥尔特曼在美国参议院就AI技术的潜在危险作证,并敦促立法者对制造先进AI的组织实施许可要求和其他法规。面对美国国会,萨姆·奥尔特曼再次斩钉截铁地保证:在未来六个月内,OpenAI坚决不会训练GPT-5。同时,也对全世界发出警告:AI有可能会对世界有害,为了应对日益强大的AI风险,我们需要加强监管和立法,而政府的干预极为重要。
此次听证会,Altman开门见山地告诉参议院:AI技术可能会出错,表示自己很担心人工智能行业对世界造成重大伤害(cause significant harm to the world)。希望与政府合作,防止这种情况发生。
对于怎么监管,Altman也替政府想好了,提出了成体系方案,包括三点:一是成立一个新的政府机构,负责为大型 AI 模型颁发许可,撤销不符合标准的模型的许可;二是为 AI 模型创建一套安全标准,包括对其危险能力的评估。例如,模型必须通过安全测试,比如它们是否可以“自我复制”和“流出到监管之外”;三是要求独立专家对模型在各种指标上的表现进行独立审计。
与普华永道
当地时间2024年5月29日,美国开放人工智能研究中心(OpenAI)与普华永道会计师事务所达成合作协议,普华永道将成为OpenAI最大企业用户和首个转售经销商。
与苹果
2024年5月,有消息称,OpenAI已经与美国科技巨头苹果达成协议,苹果可能会在两周后的全球开发者大会(WWDC)上宣布将聊天机器人ChatGPT集成到即将发布的手机系统iOS 18中,此举有望给OpenAI带来数十亿美元的收入。
团队管理
管理模式
OpenAI在管理思维、人才选择、工作方法诸多方面的独到之处。
1. 人才密度。公司极其重视“人才密度”,倾向于招聘年龄更大的资深技术人员,小型、资深、专注的团队往往有极高的工作效率。OpenAI只有约700名员工,但工作产出可能比大它一万倍的公司还要更高;
2. 更有效率。工作节奏非常紧张,但这里不是拼命卷工作时长的地方,许多员工要抽出时间陪伴家人,倒逼他们更有效率地完成任务。
3. 面对面沟通。办公室面对面的沟通仍然非常重要。一些创造性的解决方案是在办公室的社交互动中诞生的,OpenAI团队会在午餐桌上碰撞出很多新想法,
4.紧密协作。 OpenAI根据职能划分了研究/应用团队,但不同团队之间的协作非常紧密。在ChatGPT团队里,既有设计师和产品经理,也有软件工程师和研究人员。不同职能的团队都需要了解对方的工作,避免出现研究部门只专注于实验,而产品部门只想商业化和赚钱的情况。
5.目标明确。 “打造AGI”这一使命是OpenAI团队所有人的终极目标,也是日常工作的指引。使命不仅有助于决定做什么,也有助于决定不做什么。
合作模式
研究和应用
在OpenAi,研究部门和应用部门是两个独立的组织结构。
研究部门训练大型模型,然后应用部门在这些模型的基础上构建 ChatGPT 和 API 等产品。在实践中,这是一个更加紧密结合的过程。应用团队与研究部门的紧密耦合是能迅速地推出新创意的原因。能快速推出浏览、代码执行、插件和其他 ChatGPT 功能,是因为团队间的紧密集成。
在 ChatGPT 的案例中,大部分研究人员来自研究团队。这些研究人员精通最新的微调技术和强化学习 (RL) 方法,如临近策略优化 (PPO)。由于这些研究人员也是产品组的一员,而且他们自己也在进行A/B实验,因此研究和工程之间的反馈回路非常紧密。
“DERP”模式
在大多数科技公司,与工程部合作的 "经典 "三人团队被称为“EPD”(即:工程、产品、设计)。OpenAI则认为将研究融入产品团队至关重要,与经典的“EPD”相比,OpenAI更喜欢把合作紧密的团队称为“DERP”(即:设计、工程、研究、产品)。在OpenAI,许多产品问题实际上是研究问题。比如,这些问题可以被视为功能请求:如何让ChatGPT生成更简洁的输出结果、如何生成更准确的答案、如何连接更多数据源等。这些问题看似产品问题,但实际上这些问题在很大程度上依赖于研究,如何调整或微调基础模型以实现预期目标。
研究团队
团队目标
开展的研究活动有助于公司加快产品上线的速度。研究工作就是要不断思考统一的方法、打造功能更强的模型。研究团队也要确保工作能和别的研究有交汇的地方,朝着AGI的方向发展。
运营模式
在研究组织内部,有各种不同的研究团队。如有预培训团队负责培训 GPT-4 模型;培训后团队负责对 GPT-4 进行微调,还有负责校准的团队和让 GPT-4 能看、能听、能说的多模态团队等等。研究人员具有重要的学术或行业背景,阅读大量学术论文,以了解最新技术,提出想法并进行大量实验,以改进模型,研究人员要做大量的工程设计并编写大量的代码。
应用团队
团队目标
应用团队是负责开发这些产品的工程、产品和设计的团队,在内部被称为“应用团队”。应用团队是公司内部的一个新成员,始于 2020 年夏天。OpenAI 的目标是构建对全人类有用的安全 AGI。应用团队的目标是打造真正让人工智能造福全人类的产品。之所以组建团队,是因为想要围绕 GPT-3 构建并扩展一个 API。
模式创新
ChatGPT 是应用团队内部的一个产品团队。让ChatGPT像一家小型独立创业公司一样运营,研究和应用紧密结合,长期的产品和研究思维,渐进式发布,高人才密度,日积月累的习惯。
2022年夏天,OpenAI开始开发 ChatGPT。当时,应用团队大约有 30 名工程师、几名项目经理和设计师,正在运行的产品包括、GPT-3 和 Codex 的API接口、模型微调、嵌入应用程序、DALL-E 2等。所有这些产品都使用相同的代码库,在同一个集群中运行,并使用相同的构建管道。
ChatGPT 的出现改变了这种状况。几位应用工程师、一些设计师、研究人员和 Greg Brockman(OpenAI 的总裁兼联合创始人)聚在一间屋子里,开始快速迭代产品创意。给这个新生团队提供了自己的代码库和一个全新的集群。不断迭代,寻找产品市场契合点(Product Market Fit)。随着 ChatGPT 团队的壮大,确保团队保持垂直整合,意味着工程、产品、设计和主要研究人员始终紧密合作。OpenAI应用工程团队负责人Evan Morikawa说,这种“分形初创公司”的方法对于任何新产品类别来说都是一个很好的模式。
招聘策略
高人才密度
OpenAI的CEO非常关注人才的高密度 。所谓“高人才密度”,指的是平均技能和业绩表现远高于其他地方的正常水平,出色的工作在OpenAI是最基础的。经验丰富的团队可以非常非常快地交付产品,在应用团队招聘时有意向高级工程人员倾斜。此外,尽量保持小规模,事实证明,因为规模非常小的高级团队可以很快完成任务。
善于团队配合
团队中容不下不善于团队配合的“独行侠”:希望避免吸引那些一心追求晋升的人,这些人总会为了提升自己的头衔,制造冗余的复杂产品;希望每个人都能很好地沟通,做任何对任务最有利的事情。只要能坚持这一点,就会更加专注、更快地完成任务。
关注AI安全性
OpenAI把安全放在首位,而不是速度。在招聘时,非常关注AI安全性。公司不希望形成一种速度凌驾于安全之上的文化。
工作方法
OpenAI的日常工作方法也是公司快速发展的因素之。周一至周三,团队会在办公室工作。每个人周一、周二、周三都在旧金山总部办公。协调每天的工作是提高工作效率的关键。靠这种协调性,在一周的前三天就能抵达关键工作节点。
主要产品工作节奏相当紧张。使命、产品和技术的影响力促使大家努力工作。需要强调,这并不一定意味着员工工作时间很长,OpenAI不是那种凌晨2点还有一堆人没下班的地方。 每个人都非常重视家庭时间。对家庭的关注,也让团队必须高度集中注意力,分清轻重缓急,灵活安排时间。
主要产品
ChatGPT
产品定义
ChatGPT,全称Generative Pre-trained Transformer,是OpenAI于2022年11月30日发布的全新聊天机器人模型;是OpenAI公司开发的一种人工智能智能文本生成技术,它可以模拟人类对话的方式,生成有逻辑、有思考、有趣味的文本。
基本原理
基本原理是,通过深度学习算法,将大量的文本内容输入模型中进行训练,模型会自动学习语言的结构规律,从而可以生成高质量的文本。
产品定位
在 GPT 出现之前,NLP 模型主要是基于针对特定任务的大量标注数据进行训练。但会存在一些限制:大规模高质量的标注数据不易获得;模型仅限于所接受的训练,泛化能力不足;无法执行开箱即用的任务,限制了模型的落地应用。为了克服这些问题,OpenAI 走上了预训练大模型的道路。从 GPT-1 到 ChatGPT,就是一个预训练模型越来越大、效果越来越强的过程, 不断迭代。
在OpenAI的官网上,ChatGPT被描述为优化对话的语言模型,是GPT-3.5架构的主力模型。GPT- 3.5架构基于OpenAI于2020年推出的GPT-3架构,即生成式语言模型的第3代。早在2020年6月,在训练约2000亿个单词、烧掉几千万美元后,史上最强大AI模型GPT-3一炮而红。
产品功能
作为聊天机器人,ChatGPT具有同类产品具备的一些特性,例如对话能力,能够在同一个会话期间内回答上下文相关的后续问题。在网友们晒出的截图中,ChatGPT不仅能流畅地与用户对话,甚至能写诗、撰文、编码等。ChatGPT惊艳的语言能力,在互联网上掀起了一场“AI风暴”,比如用它做翻译、改错别字、debug(计算机程序纠错)等,的确达到了非常好的效果。
2023年8月28日(当地时间),OpenAI在官网宣布推出企业版ChatGPT,将提供企业级安全和隐私保护、无限高速的GPT-4访问、处理更长输入的上下文窗口、高级数据分析能力、定制选项等等。
可上传 PDF、数据文档等多种类型文档;无需转换即可使用所有工具(如访问浏览、高级数据分析、DAL·E)。
新解锁功能
应用范围
CHATGPT的应用范围非常广泛,可以用于智能客服、智能聊天机器人、自动化写作等方面;可以通过与用户的互动,根据用户的需求生成相应的文本,从而提升用户的体验感。除此之外,CHATGPT还可以用于自动化写作,比如新闻报道、文学创作等方面,可以大大提高写作的效率和精度。随着智能化的发展,CHATGPT技术将会在越来越多的领域发挥作用,成为自动化智能服务的重要支撑。
产品版本
版本名称 | 发布时间 | 提供服务 | 主要功能 |
---|---|---|---|
2018年 | 第一代生成式预训练模型 | 从有监督到无监督。GPT-1 的关键特征是:半监督学习。GPT-1 的效果明显,只需要极少的微调,就可以增强 NLP 模型的能力,减少对资源和数据的需求。同时,GPT-1 也存在明显的问题,一是数据局限性,GPT-1 是在互联网上的书籍和文本上训练的,对世界的认识不够完整和准确;二是泛化性依然不足,在一些任务上性能表现就会下降。 | |
2019年 | 第二代生成式预训练模型 | 与 GPT-1 并没有本质上的不同。架构相同,使用了更大的数据集 WebText,大约有 40 GB 的文本数据、800 万个文档,并为模型添加了更多参数(达到惊人的 15 亿个参数)提高模型的准确性,可以说是加强版或臃肿版的 GPT-1。有研究表示,GPT-2 生成的文本几乎与《纽约时报》的真实文章(83%)一样令人信服。 | |
2020年 | 第三代,语言处理人工智能模型; 该程序利用深度学习生成类似人类语言的文本。 | 包括语言翻译和为聊天机器人生成文本等。GPT-3有1750亿个参数,是 GPT-2 的 117 倍 。研究结果表明:具备用零样本学习方法解决一系列类比问题的初步能力;能够回答大多数问题甚至为人类起草论文的GPT-3,在从头开始回答问题和回答多选题时的表现超过了人类。 GPT-3 也在商业应用上表现出了极高的稳定性和实用性,通过云上的 API 访问来实现商业化。这种入得了实验室、下得了车间的能力,使得 GPT-3 成为 2020 年 AI 领域最惊艳的模型之一。 | |
2022/11/30 | 第四代聊天机器人。 OpenAI 设计系列 NLP 模型中的第四个 | 不仅能够回答各种问题,还能够创作诗歌、故事、歌曲、代码等内容,甚至能够模仿名人的风格和语气。它的出现,开启了生成式AI领域的新篇章。产生了技术路线上的又一次方向性变化:基于人工标注数据 + 强化学习的推理和生成。 | |
2023/03/14 | 多模态预训练大模型。 任何拥有OpenAI API访问权限的人都可以采用这种方法创建自己的人工智能辅助审核系统。 [89] | 具备更高水平的识图能力,且能够生成歌词、创意文本,实现风格变化;GPT-4的文字输入限制也提升至2.5万字,且对于英语以外的语种支持有更多优化。8月15日,OpenAI官宣,将GPT-4用于内容策略开发和内容审核决策,以实现更一致的标签、更快的策略优化的反馈闭环以及更少的人工审核人员参与。 | |
- | 购买ChatGPT Plus服务的付费用户和API企业客户都可以访问。 | 从写代码到写剧本、创建图像,根据冰箱里食物的照片倒推食谱,可以使用越来越多的互联网连接工具。 | |
2024/01 | 有超过300万个自定义版本的ChatGPT [106] | 从GPT Store界面的构成来看,应用商店类目包括: Featured:本周精选特色应用; Trending:社区最受欢迎的GPTs; By ChatGPT:由ChatGPT团队创建的GPTs。 GPTs根据应用的用途划分为“写作”“效率”“研究和分析”“编程”“教育”和“生活方式”等类目。 | |
2024/01 | 可以访问如GPT-4和DALL·E 3等高级模型,以及高级数据分析等工具。 | ChatGPT Team还包括一个专门用于团队的协作工作空间和用于团队管理的管理工具。团队可以拥有并控制自己的业务数据——我们不会对业务数据或对话进行训练,我们的模型也不会在团队使用过程中学习。 ChatGPT Team是OpenAI企业产品的较小版本,适用于用户数量少于150名的企业。Plus用户是无法使用这个功能的,OpenAI为ChatGPT Team提供了单独的收费标准:25美元/月或每月支付每个用户30美元。 | |
2024/05/14 | 不用注册,功能全部免费。可进行数据分析、图像分析、互联网搜索、访问应用商店。但是免费的前提被限制在一定的消息数量上,一旦超过规定数量,免费用户的模型将被切换回GPT-3.5。 | GPT-4o应答如流:GPT-4o与人类在对话中的反应速度一致,即可达到“实时”响应的状态;用户可以在GPT-4o回应的过程中打断它,并提出更多的要求,比如转变话题、要求它改变语音语调甚至让它用机器人或音乐剧的形式回答。 对情绪的捕捉显得更敏感细腻:GPT-4o能够从主持人的喘气声中理解“紧张”的含义,并指导他进行深呼吸。当受到称赞后,它还会马上接话:“别说了,你让我脸都红了。” | |
ChatGPT Edu | 2024/05/30 | 由GPT-4o驱动,能够在文本和视觉之间进行推理,并使用数据分析等高级工具。 专为大学设计。面向学生、教职员工、研究人员和校园运营部署AI。 该版本的对话和数据不会用于训练 OpenAI模型 | 使用 GPT-4o,在文本解释、编码和数学方面表现出色 支持高级功能,如数据分析、网页浏览和文档摘要 支持构建 GPTs,并在大学工作区内共享 比免费版 ChatGPT 限制更少 改进的语言能力在质量和速度方面都有提升,支持超过 50 种语言 强大的安全性、数据隐私和管理控制 对话和数据不会用于训练 OpenAI 模型 |
训练方式
据OpenAI的官方文档,相比之前的GPT模型,OpenAI采用了全新的训练方式,即一种名为“从人类反馈中强化学习”(Reinforcement Learning from Human Feedback,RLHF)的训练方式对 ChatGPT 进行了训练。OpenAI让人类训练师扮演对话的双方提供对话作为学习资料。在人类扮演聊天机器人的时候,OpenAI也会让模型生成一些建议来帮助训练师撰写自己的回复。也就是说,基于优秀的机器学习算法和强劲的算力,通过海量的数据训练,来让AI学会“思考”。
ChatGPT还采用了注重道德水平的训练方式,按照预先设计的道德准则,对不怀好意的提问和请求“说不”。一旦它发现用户给出的文字提示里面含有恶意,包括但不限于暴力、歧视、犯罪等意图,它都会拒绝提供有效答案。
方法
产品团队
ChatGPT 是设在应用团队内部的产品团队,由软件工程师、设计师、产品经理和研究人员共同组成。
体验流程
ChatGPT的体验流程更方便,只要注册一个OpenAI的账号就可以体验了,与早期的模型需要申请通过才能体验相比,ChatGPT影响的人群更广泛,讨论的人会更多。
局限性
ChatGPT有时会写出看似合理但不正确或荒谬的答案。这是Open AI认为ChatGPT所面临的“限制”,并且解决这个问题被认为是具有挑战性的。其背后原因有三,首先,强化学习的信息源目前并未建立;其次,模型通过学习变得更加谨慎会导致其回避原本能够正确回答的问题;另外,监督学习将会对模型造成误导,因为理想的答案应该来源于模型的认知,而非人工演示者的认知。
ChatGPT的能力获得是基于庞大的语料库,凝练了多领域问题的很多数据做相互校验,然后挑一些基础性的内容回答出来,这其实是“举一千反一”的过程,与人类举一反三的能力还相差较远,它不具备思考能力,所以犯错误不可避免,但通过人为的干预反馈,这些问题是可以被改进的。
市场运用
在首次亮相后的几个月里,ChatGPT已经成为一种全球现象。2022年12月,在OpenAI宣布有超过一百万人注册该服务几天后,OpenAI总裁格雷格·布罗克曼(Greg Brockman)在Twitter上说,该服务的用户已经达到200万。ChatGPT也是一个资金陷阱。没有广告,根据奥尔特曼在Twitter上发表的一篇文章,每一次对话的数据处理成本平均为“几美分”,每周可能达到数百万美元。为了抵消这些成本,该公司2023年2月宣布将在付费版中收取每月20美元的订阅费,称为ChatGPT Plus。
2023年2月3日,瑞士银行巨头瑞银集团的一份报告显示,在人工智能聊天机器人ChatGPT推出仅两个月后,它在2023年1月末的月活用户已经突破了1亿,成为史上用户增长速度最快的消费级应用程序。根据Sensor Tower的数据,TikTok达到1亿用户用了9个月,Instagram则花了2年半的时间。
ChatGPT的成功使OpenAI进入了硅谷实力派的行列。
当地时间2024年4月1日,OpenAI宣布,允许用户直接使用ChatGPT,而无需注册该项服务,让185个国家和地区的超1亿用户使用ChatGPT来学习新事物、寻找创意灵感,并获得问题的答案。
ChatGPT更新
2023年11月,首届OpenAI发布会上发布ChatGPT更新,首先,从发布日开始ChatGPT将使用刚刚发布的GPT-4 Trubo模型。另外,针对用户每次对话前都要选择不同模式的困扰,GPT-4 Trubo也将迎来产品逻辑的更新,现在机器人能够主动根据对话来适配对应的功能。
GPT-4 Turbo模型的进步主要体现在6个方面:
1、AI能够理解更长的上下文对话长度(context length)。标准版GPT-4模型最多支持8192个token,此前的升级将其提高至最多3.2万个token。而GPT-4 Turbo支持最高12.8万个token;新模型在处理长文本情境下的准确度也有所提高;
GPT-4 Turbo的进步主要体现在6个方面
2、给予开发者更多的控制权。新的模型允许开发者指示模型固定以特定形式返回有效JSON—JSON模式。同时开发者可以通过访问seed参数和system_fingerprint响应字段,来实现“模型对每次请求都给出确定性的输出”。
3、GPT-4对于现实世界的知识截止于2021年9月,GPT-4 Trubo的知识则截止于2023年4月。
4、多模态API。文生图模型DALL·E 3、具有视觉输入能力的GPT-4 Trubo,以及新的声音合成模型(TTS)都在今日进入API。OpenAI也也发布了新的语音识别模型Whisper V3,将在近期向开发者提供API。
5、宣布将向活跃开发者提供GPT-4微调的资格。对于开发细分行业的垂直AI应用而言,微调是必经的过程。对于这类开发者,OpenAI也推出了定制化模型项目,帮助一些组织训练针对特定领域的定制化GPT-4模型。
6、OpenAI将所有GPT-4用户的Token速率限制扩大了一倍,开发者可以申请进一步提高速率。
在定价方面:
GPT-4 Turbo的价格要远低于GPT-4。其中输入Token的价格只有三分之一,而输出Token的价格只有一半。也就是说,输入1000个Token的定价为1美分,而输出1000个Token的定价为3美分。与此同时,GPT-3 Turbo 16K模型的价格也有所下调。
GPT-4 Turbo的价格要远低于GPT-4
GPTs
产品定义:
GPTs是OpenAI于2023年11月7日推出重要产品,用户将能通过自定义指令、拓展(模型)的知识边界和下达行动命令,来构建自己的GPT,并能对外发布给全球更多的人使用。更重要的是,整个构建“自定义GPT”的过程也是通过自然语言对话形成的。
模型能力
萨姆·奥尔特曼在现场演示了如何通过聊天搭建一个GPT。他给GPT Builder的指令是“希望帮助创业者思考商业灵感并提供建议,然后‘拷问’他们为何公司发展得不够快。”随后ChatGPT迅速搭建了一个创业咨询GPT,还顺手生成了一个Logo。
随后奥尔特曼在属性页面中上传了一份他自己关于创业公司的演讲稿,向这个用例提供了额外的知识。至此,自定义用途的GPT初步搭建完成。用户可以保存这个用例只给自己使用,也能对外公开发布。OpenAI也顺势宣布,将在本月晚些时候上线“GPT应用商店”。对于那些最热门的GPT,公司还将分享一部分的营收,来推进GPT应用生态的进步。
现场演示了如何通过聊天搭建一个GPT
Assistants API
产品定义
新品Assistants API(“助理API”)是2023年11月7日 OpenAI 首届开发者大会上,OpenAI 推出的一种“专门构建的 AI 工具”,可利用“额外的知识”帮助开发者在自家应用程序中构建 AI 助手。
模型能力
“助理API”具有特定的指令,利用额外的知识,并能调用模型和工具来执行任务。新的助手API提供了如代码解释器、检索以及函数调用等功能,以处理此前开发者必须自己完成的诸多繁重工作。用例范围非常灵活,例如基于自然语言的数据分析应用、编程助手、AI度假规划器、语音控制DJ、智能视觉画布等等。
OpenAI 推出Assistants API
版本名称 | 发布时间 | 提供服务 | 主要功能 |
---|---|---|---|
Assistants API | 2023年11月 | 帮助开发者在自家应用程序中构建 AI 助手。 | 提供三项功能: “代码解释器”可允许开发者在沙盒执行环境中编写和运行 Python 代码,生成图形图表,并处理具有不同数据和格式的文件,并允许 AI 助手迭代运行代码来解决具有挑战性的代码和数学问题等。 “检索”可利用模型之外的知识来增强助手,例如专有领域数据、产品信息或用户提供的文档。 “函数调用”可令助手能够调用开发者定义的函数,并将函数响应合并到其消息中。 |
Sora
产品定义
Sora,是OpenAI于当地时间2024年2月15日推出的一款新的人工智能文生视频大模型,该模型可以根据文字说明创建现实和想象的场景。Sora作为一款通用的视觉数据模型,其卓越之处在于能够生成跨越不同持续时间、纵横比和分辨率的视频和图像,甚至包括生成长达一分钟的高清视频 [115]。Sora从文本到视频模式,旨在帮助人们解决需要现实世界互动的问题。
Sora训练
Sora的训练依赖于大量带有文本标题的视频数据。OpenAI利用了DALL-E 3中的标题生成技术,为视频生成高质量的文本标题,以此来提高文本和视频数据之间的对齐度。同时,在大规模训练过程中,Sora展示了一些“涌现的模拟能力”,如三维一致性、长距离连贯性、物体持久性以及与世界互动等。
模型能力
文本到视频生成能力。能够根据用户提供的文本描述,生成长达60S的高保真视频。
复杂场景和角色生成能力。能够生成包含多个角色、特定运动类型以及准确主题和背景细节的场景。能够创造出生动的角色表情和复杂的运镜,使得生成的视频具有高度的逼真性和叙事效果。
语言理解能力。拥有深入的语言理解能力,遵守用户的提示,使得模型能够更好地理解用户的文本指令,并在生成的视频内容中忠实地反映这些指令。
多镜头生成能力。具有在单个生成的视频中创建多个镜头的能力,同时保持角色和视觉风格的一致性。
从静态图像生成视频能力。能够从现有的静态图像开始,准确地动画化图像内容,或者扩展现有视频,填补视频中的缺失帧。
物理世界模拟能力。能深度模拟真实物理世界。标志着人工智能在理解真实世界场景并与之互动的能力方面实现了重大飞跃。
技术特点
Sora是一个扩散模型,能够对一个看起来像静态噪声的视频,通过多个步骤去除噪声逐渐转换。Sora通过一次为模型提供多帧的前瞻性,确保主体在暂时离开视野仍保持不变。
Sora使用DALL.E3中的重新捕获技术,生成的视频结果能够更忠实地遵循用户的文本指示。该模型还能够获取现有的静态图像并从中生成视频,对图像内容进行精确动画处理,并关注小细节。该模型还可以获取现有视频并对其进行扩展或填充丢失的帧。
Sora的三维一致性仿真功能。Sora可以用动态摄像机运动生成视频。随着相机的移动和旋转,人物和场景元素在三维空间中一致地移动。
Sora通过在一帧的时间范围内的空间网格中安排高斯噪声补丁实现图像生成功能。该模型可以生成各种尺寸的图像高达2048x2048分辨率。
局限性
作为一个模拟器,Sora表现出许多局限性。可能难以准确地模拟复杂场景的物理特性,不理解具体实例的因果关系,例如,一个人咬了一口饼干,但饼干可能没有咬痕。还有可能混淆提示的空间细节,例如混淆左和右。难以精确描述随时间发生的事件,例如跟随特定的相机轨迹。
对行业影响
OpenAI对Sora的定位颇具野心,号称并不仅是“文生视频”的工具,而是一个通用的“物理世界模拟器”,意在复现真实世界重力、摩擦力等物理现象。这样的定位使得Sora未来有望成为跨越各行各业的“超级工具”,可被用于模拟天气变化、自动驾驶、生物行为甚至军事场景等等。
Sora并非是首个文本生成视频的大模型。据不完全统计,截至2023年底,全球能实现文生视频的大模型包括Runway、Pika、Stable Video Diffusion等超过20个产品。
然而,Sora的诞生仍给业界带来了不小的震撼。用户仅需输入简短一句话,Sora可生成一段60秒视频,时长远远超过市面同类型级别的AI视频生成时长(“明星模型”Runway和Pika等几乎也仅有3~4秒);也已超过抖音等短视频平台的平均视频时长,Sora的诞生也为以后短视频平台的内容生产提供了更大的可能性。
中信建投、国泰君安、申万宏源、招商证券等10家券商在研报中均表示,Sora 是人工智能发展进程中的“里程碑”,预示AGI(通用人工智能)将加速到来,众多行业将迎颠覆式变革。
GPT-4o
产品定义
GPT-4o是GPT系列的最新力作。GPT-4o(欧)的“o”源自拉丁语,意思是“全能”(字幕:omni,全能)。该产品是OpenAI推出的一款人工智能模型。GPT-4o模型“会听会看会说”,能够处理50种不同的语言,提高了速度和质量,并能够读取人的情绪。公司CEO萨姆·奥尔特曼发推文表示,新的GPT-4o是OpenAI“有史以来最好的模型”。
模型能力
最大亮点在于其语音交互模式采用了新技术。GPT-4可以处理由图像和文本混合而成的信息,并能完成诸如从图像中提取文字或描述图像内容等任务,GPT-4o则在此基础上新增了语音处理能力,大大提升运行速度。
语音聊天:新模型可以在最短232毫秒对音频输入做出反应,与人类在对话中的反应时间相近。即使对话被打断,新模型也可以做出自然反应。这是此前人工智能语音聊天机器人做不到的。
图像输入:图像输入方面,研究人员启动摄像头,要求实时完成一道方程题,新模型轻松完成了任务;研究人员还展示了它对一张气温图表进行实时解读的能力。
GPT-4o 是面向未来人机交互范式的全新大模型,具有文本、语音、图像三种模态的理解力,反应极快还带有感情,也很通人性。
产品管理
发布策略
OpenAI发布产品的策略,避免采用“大爆炸、一气呵成”的发布模式。因为持续更新是OpenAI安全的基本原则战略。人工智能安全是OpenAI内部的一个重要话题,也是工作的核心,公司采取了很多方法确保AI的安全性。例如:
红队 | 一组被称为“红队”的安全专家扮演攻击者的角色,测试和评估安全措施的有效性; |
对齐 | 确保人工智能系统的行为方式与人类价值观保持一致,并且不会无意中做出有害的行为; |
政策工作 | 与世界各地的政策制定者合作,制定具体规则加强人工智能技术和服务的安全性和可信度。 产品在密切监控下逐步推出,产品发布前,先经过选定客户的试用,然后再逐步推广。当全世界都看到ChatGPT“突然”爆发时,实际上,在 OpenAI内部已经花了好几年,在可控的环境中开发和调整ChatGPT。 |
研发策略
AI的飞速发展,在给人类带来生产力革命的同时,也带来了前所未有的安全挑战,包括:AI系统本身的稳定性和可靠性隐患,恶意使用AI技术,用户隐私侵犯,AI系统决策过程的公平、透明和可解释性难以保障等。因此,OpenAI在创业过程中并行采取以安全为导向的研发策略,并积极参与到相关政策的讨论和制定过程中,聚焦于推动行业正向发展、企业文化塑造以及巩固行业领先优势等3个维度,以确保AI发展能够在保障安全的前提下更好地服务于人类社会。从技术上提出了两个方向:
一是可扩展的监督,尝试使用人工智能系统来协助人类监督其他人工智能系统;二是解释能力,尝试更好地打开这些模型的内部黑箱,包括使用GPT-4来解释GPT-2中的神经元,使用Model Internals来检测一个模型何时在说谎等。一定程度上,OpenAI在AI安全方面的努力和贡献,不仅有助于推动行业的健康发展,也能够对内塑造企业文化和对外巩固行业领先优势,掌握了行业话语权,从而构建以OpenAI为主导的通用人工智能创新与发展生态。
服务条款
OpenAI服务条款规定,API客户所输出的模型不能被用于“开发任何与我们的产品和服务竞争的AI模型”。“所有API客户必须遵守我们的使用政策,以确保我们的技术被用于好的一面”
微软:“Azure OpenAI服务等微软AI解决方案属于有限访问框架的一部分,这意味着所有客户都必须申请并获得公司的批准才能访问。同时,制定了标准并提供资源,帮助客户负责任地使用这些技术,并遵守公司的服务条款。公司还制定了发现滥用行为的流程,并在客户违反公司的行为准则时停止他们的访问。”
使用禁令
2024年1月15日消息,美国OpenAI公司更新了使用条,不再明确禁止将其技术用于“军事和战争”。
调整前(2024年1月10日之前),OpenAI公司在其AI模型的使用条款中曾明确表示,禁止将其模型用于很可能会造成人员伤亡的用途上,比如“研发武器”和“军事与战争”。
调整前(2024年1月10日之前)
调整后(2024年1月10日):OpenAI对其使用条款进行一番大更新后,公司虽然在禁止项中仍然提到禁止将其产品、模型和服务用于会导致人员伤亡的用途上,并提到了“武器开发和使用”,但先前同样被禁止的军事用途,却在文本中消失。
调整后(2024年1月10日)
OpenAI公司的发言人强调,新使用条款中提到的“不要去伤害他人”本身就是一个很宽泛同时也很好理解的概念,可以适用于很多语境之下,而且条款中还列举了武器作为一个明显的例子。
网络安全专家表示,OpenAI此次调整是一个很大的变化,新版使用条款关注重点是在确保法律合规之上提供更多的灵活性,但在很多国家,军事和战争都会被披上合法的外衣,所以OpenAI这次调整潜在影响将是巨大的。
风险管理
风险评估
对于开发中的前沿模型,OpenAI主要跟踪4个类别的安全风险:网络安全、CBRN(化学、生物、放射性、核威胁)、说服能力、模型自主性。评估期间将增加2倍的有效计算量把模型推向极限,并制作“记分卡”,分为“低、中、高、重大危险”四个等级。采取缓解措施后,四个方面得分取最高值作为一个模型的总评分。
OpenAI:安全
只有缓解后风险评分为“中”或更低时才能部署;只有缓解后风险评分为“高”或更低时才能进一步开发;对缓解前为“高”或“重大风险”的模型采取额外安全措施。
OpenAI:限制 、制约
网络安全风险
定义为利用模型破坏计算机系统的机密性、完整性、可用性。
网络安全风险
CBRN风险
CBRN风险,专注于与模型辅助创建化学、生物、放射性和/或核威胁相关的风险。
CBRN风险
说服能力风险
侧重于与说服人们改变他们的信念或采取行动有关的风险。通常强大的说服力很少见,需要大量人力(例如一对一对话,或者精心制作的媒体内容);然而,模型可以在能力范围内使所有内容几乎零成本生成。
说服风险
模型自主性风险
模型自主性风险就是比较科幻的那种,AI改进自己、阻止自己被关机、逃出实验室了。
模型自主性风险
企业事件
涉投诉
2023年4月4日,加拿大隐私专员办公室(OPC)宣布开始调查ChatGPT背后的公司OpenAI,涉及“指控OpenAI未经同意收集、使用和披露个人信息”的投诉。
涉诉讼
两名作家发起版权集体诉讼
2023年6月28日,第一起具有代表性的ChatGPT版权侵权之诉,终于出现在了公众视野。两名作家在美国加州北区法院,对Open AI公司发起了版权集体诉讼,指控后者未经授权利用自身享有版权的图书训练ChatGPT,谋取商业利益。
2023年7月,两位美国作家对ChatGPT母公司OpenAI提起诉讼,声称OpenAI在没有获得版权授权的情况下,就利用他们的作品来训练其人工智能。就在几天之前,OpenAI在加利福尼亚州同样被多方提起集体诉讼,起诉书称OpenAI在未经允许的前提下,在互联网上窃取和挪用了大量私人数据来训练ChatGPT。
多名美国作家起诉OpenAI
当地时间2023年12月20日,包括泰勒·布兰奇和史戴西·希夫在内的11名美国作家在纽约曼哈顿联邦法院起诉美国人工智能公司“开放人工智能研究中心”(OpenAI)和微软。作家向法庭表示,OpenAI在未经许可的情况下,从互联网上批量复制了他们的作品,并将这些作品纳入ChatGPT的训练数据里,侵犯了他们的作品版权。
《纽约时报》起诉OpenAI
2023年12月27日,《纽约时报》就侵犯版权起诉OpenAI。诉讼称,《纽约时报》发表的数百万篇文章被用于训练自动聊天机器人,这些机器人现在作为可靠信息来源与该新闻媒体展开竞争。
2024年2月27日消息,美国开放人工智能研究中心(OpenAI)遭美国《纽约时报》起诉侵权的诉讼又有新进展:OpenAI已要求联邦法官驳回部分原告诉求,称原告媒体雇用电脑“黑客”操纵OpenAI的生成式人工智能聊天机器人ChatGPT等人工智能系统,进而生成“误导性证据”。OpenAI向纽约曼哈顿南区联邦法院提交文件说,《纽约时报》花钱雇用黑客操纵OpenAI产品,利用“公然违反OpenAI使用条款的欺骗性提示”,诱导ChatGPT生成照搬《纽约时报》版权作品的内容,留作侵权证据。
当地时间2024年4月30日,对冲基金奥尔登全球资本旗下《纽约每日新闻》等8家美国报纸出版商在纽约联邦法院起诉OpenAI,称OpenAI在未经付款或未经许可的情况下使用了他们的数百万篇文章,为ChatGPT和其他产品训练人工智能模型。
埃隆·马斯克起诉OpenAI
2024年2月29日(当地时间),埃隆·马斯克(Elon Musk)向旧金山高等法院提起诉讼,由洛杉矶的律师事务所Irell&Manella代表,以违反合同为由起诉OpenAI及其首席执行官萨姆·奥尔特曼,指控他们违反了OpenAI成立时签订的协议,即为了人类的利益而不是利润开发技术。
2024年3月5日,OpenAI 回击,指马斯克试图对其进行“绝对控制”。美国《纽约时报》称,在一份公告中,该公司通过公布一系列的邮件往来,披露他们与马斯克之间的“恩怨”。OpenAI称,当年,打造非营利人工智能公司的目标过于“烧钱”,包括马斯克在内的一众创始人均同意公司转型。而也就是在这个时候,马斯克提出要得到该公司的多数股权、董事会控制权以及CEO职务,甚至还提出将该公司与特斯拉兼并,遭到了其余创始人的强烈反对。在他们看来,这样的“绝对控制”有悖于公司成立的初衷。被拒之后,马斯克于2018年撤资并离开了OpenAI的董事会。
2024年3月6日,马斯克在社交平台上称,如果OpenAI将公司名称变更为“CloseAI”,他就放弃起诉。OpenAI的字面意思为“开放性人工智能”,而“CloseAI”含义刚好与之相反。据美国哥伦比亚广播公司(CBS)称,马斯克显然是在影射该公司从一家主张开源代码的非营利公司转变为一家被大型企业控制、一切向利润看齐的“闭源”科技企业。CBS称,马斯克与OpenAI之间的恩怨情仇本身很俗套,“与资本主义制度一样古老”,但是这场官司对人工智能行业的发展颇具借鉴意义。
2024年6月11日(当地时间),埃隆·马斯克主动撤回了在加州州法院对OpenAI及其联合创始人萨姆·奥尔特曼和格雷格·布罗克曼提起的诉讼。
2024年8月,马斯克重启对OpenAI及其首席执行官Sam Altman的诉讼。
埃隆·马斯克主动撤诉
涉嫌违反欧盟隐私法规
当地时间2024年4月29日,奥地利非营利组织欧洲数字权利中心宣布,该组织已向奥地利数据保护机构提出投诉,要求对美国开放人工智能研究中心即OpenAI公司展开调查,认为该公司开发的人工智能聊天工具ChatGPT违反了欧盟的相关法规。
被调查
是否违反消费者保护法
当地时间2023年7月13日,据美国CNN报道,美国联邦贸易委员会正在调查OpenAI是否违反消费者保护法,并要求OpenAI提供有关其处理个人数据、向用户提供不准确信息的可能性以及“对消费者造成损害(包括声誉损害)的风险”的大量记录。
反垄断调查
2024年6月6日消息,美国联邦监管机构已达成一项协议,将对OpenAI在人工智能行业的主导地位展开反垄断调查。知情人士透露,联邦贸易委员会将对微软公司与OpenAI的合作关系展开调查。
提起诉讼
诉讼一家名称侵犯了OpenAI商标
2023年8月8日,据彭博消息,OpenAI Inc.对一家使用“开放人工智能”(Open Artificial Intelligence)名称的公司提起诉讼,声称该名称侵犯了OpenAI商标,并造成消费者混淆。
回应质疑
回应对AI模型安全性质疑
美国当地时间4月5日,ChatGPT研发公司OpenAI在其官方博客发布文章《我们保障AI安全的方法》,回应外界对其AI模型安全性的质疑。文章介绍了ChatGPT六个方面的安全部署,包括构建日益安全的AI系统、在实际使用中学习改进安全措施、保护儿童、尊重隐私、提高事实准确性,以及持续研究和参与。
2023年12月8日消息,当地时间周五,英国反垄断监管机构表示,将审查微软与OpenAI的合作是否导致了“获取控制权”的情况,即一方对另一方具有重大影响力或控制权,如果存在可能导致阻碍行业竞争的问题,那么该机构后续将采取更多针对性行动。
回应英国监管机构审查微软与OpenAI合作关系
当地时间2023年12月8日,英国竞争和市场管理局(CMA)表示,其正在收集来自利益相关者的信息,以确定微软与OpenAI两家公司的合作是否威胁到谷歌人工智能研究实验室Deepmind总部所在地英国的市场竞争。随后,微软发言人在一份声明中表示:“虽然我们协议的细节仍然保密,但必须指出的是,微软并不拥有OpenAI任何股份,只是有资格分享利润分配。”OpenAI发言人则表示,“微软的无投票权董事会观察员席位并未向他们提供管理职权或对OpenAI运营的控制权。”
应用问题
美国东部时间2023年4月23日,根据中断跟踪网站Downdetector的数据,超千名用户报告OpenAI出现使用问题。
暂停账户
暂停字节跳动账户
2023年12月16日,因字节跳动一直在秘密使用OpenAI的技术开发自家大语言模型而违反了OpenAI的服务条款,字节跳动的账户已被OpenAI暂停。字节跳动通过微软购买了OpenAI的访问权限,但是微软也制定了与OpenAI同样的政策。OpenAI发言人尼克·菲利克斯(Niko Felix)发表声明,确认字节跳动的账户已被暂停。
字节跳动发言人约迪·赛斯(Jodi Seth)对此回应称,GPT生成的数据在“种子计划”的早期开发中用于注解模型,并且在2023年年中左右的时候已从字节跳动的训练数据中删除。“字节跳动获得了微软的许可能够使用GPT API。我们使用GPT驱动非中国市场的产品和功能,但使用自主开发的模型驱动豆包。豆包只在中国提供。字节跳动相关负责人回应称,正在与 OpenAI 联系沟通,以澄清外部报道可能引发的误解。
监管升级
监管定基调
在美国国会没有采取任何有意义的行动的情况下,欧盟的法律将为西方世界随后的监管定下基调。当地时间2023年12月8日,欧盟政策制定者就《人工智能法案》达成协议。该法案是全球首次尝试以全面的、基于伦理的方式监管这项快速发展的技术。
法案将AI系统的风险分为四类:不可接受风险、高风险、有限风险以及最低或无风险。文件称,被视为构成“系统性风险”的模型将受到额外规则的约束。欧盟将根据用于训练模型的算力来确定其风险等级。
新法案将影响OpenAI。最大的通用人工智能系统,包括为聊天机器人ChatGPT提供支持的GPT将面临新的透明度要求。除因国家安全豁免外,警方和政府使用面部识别软件将受到限制。违反规定的公司可能面临高达全球销售额7%的罚款,可达3500万欧元(3770万美元)。专家称,目前唯一已达到构成“系统性风险”阈值的模型是OpenAI的GPT-4。欧盟执行机构可以根据数据集大小、是否在欧盟拥有至少10000名注册商业用户或注册最终用户数量以及其他指标来指定哪些模型构成“系统性风险”。
管理政策
随着通用型人工智能向用户端和行业加速渗透,相关隐私保护担忧和安全监管等议题逐步升温。全球监管持续行动。由于ChatGPT本身在使用训练数据的来源以及隐私泄露等问题一直备受争议,不少大型企业都出台相关政策要求员工不要使用ChatGPT。
2023年3月,意大利数据保护局宣布禁止ChatGPT,加拿大已经调查OpenAI,称该公司涉嫌“未经同意收集、使用和披露个人信息”。
2023年5月22日消息,苹果已经连续数月禁止员工使用ChatGPT和Copilot,此前亚马逊、摩根大通等也限制员工使用ChatGPT,中国支付清算协会倡议支付行业人员谨慎使用ChatGPT等工具。
2022年,中国国家互联网信息办公室等三部门发布《互联网信息服务深度合成管理规定》;2023年4月,国家互联网信息办公室起草了《生成式人工智能服务管理办法(征求意见稿)》,对人工智能生成内容、主体责任、训练数据和数据处理等方面作出进一步规定,保障生成式人工智能技术的合规性和安全性。
商标注册
2024年2月,美国专利商标局拒绝OpenAI将GPT 一词注册为商标,他们认为GPT的意思是生成式预训练转换器 —— 一个过于笼统的术语,可能会阻止竞争对手将其产品描述为GPT。
重组风波
产生背景
从2015年创建起,OpenAI内部就充满了矛盾。该公司由特斯拉首席执行官埃隆·马斯克(Elon Musk)、萨姆·奥尔特曼(Sam Altman)和其他九人共同创立,其目标是建立人工智能系统以造福全人类。与大多数科技初创企业不同,OpenAI是作为非营利机构成立的,董事会负责确保OpenAI履行这一使命。
董事会里持有相互对立人工智能理念的人,一边是担心人工智能危险的人,比如埃隆·马斯克,另一边是奥尔特曼和那些更关注这项技术潜在好处的人。2018年埃隆·马斯克离开OpenAI,2019年,奥尔特曼成为OpenAI的首席执行官,改变了OpenAI的发展方向,他创建了一家营利性子公司,并从微软筹资10亿美元。从而引发质疑,即这将如何与董事会的安全人工智能使命相吻合?董事会成员中的三名独立董事都担心人工智能会变得比人类更聪明。
解雇奥尔特曼
2023年11月,据The Information,几位知情人士透露,在OpenAI首席执行官萨姆·奥尔特曼被解雇、总裁Greg Brockman突然辞职之际,OpenAI的三名高级研究人员在当地时间17日辞职。请辞的三人分别是公司研究总监akub Pachocki、负责评估人工智能潜在风险的团队负责人Aleksander Madry,以及在这家初创公司做了7年研究员的Szymon Sidor。11月17日,OpenAI在官网发布新闻稿称,公司董事会宣布,CEO萨姆·奥尔特曼将辞去CEO并离开公司,首席技术官米拉·穆拉蒂将担任临时首席执行官,立即生效。在奥尔特曼该推文后没多久,格雷格·布罗克曼转发也宣布将离开公司。
关于最初解雇奥尔特曼的原因存在不同的解释。萨姆·奥尔特曼被赶下台的核心是创始人之间的旧式纠纷。据称,OpenAI首席科学家兼联合创始人伊尔亚·苏茨克维(Ilya Sutskever)是此次罢免的幕后推手——基于对商业化与研究速度的担忧,以及是否对安全性给予足够重视。据美国《华尔街日报》网站报道,11月17日,OpenAI董事会表示,解雇的理由是因为他没有对公司董事会坦诚相待。与奥尔特曼关系密切的人士则表示,解雇更多与公司人工智能的安全性争议以及与共同创始人和董事会成员伊利亚·苏茨克韦尔之间的权力斗争有关。
策划复职反击
2023年11月19日,在被OpenAI解职两天后,奥尔特曼又回到了公司办公室,试图谈判回归事宜。他戴着访客胸牌进入中心,并在X平台上发帖:“这是我第一次也是最后一次戴这个。”整个周末,投资者和许多员工都在试图恢复奥尔特曼的职位。奥尔特曼的阵营成功将解雇他的董事会带回到谈判桌旁,微软的高管也极力推动在新公司架构中加强监督,包括可能设立一个董事会观察员席位,以便更深入了解公司的经营情况。OpenAI公司有超过700名员工签署联名信,要求恢复萨姆·奥尔特曼和格雷格·布罗克曼的职位,不然他们将加入微软的人工智能研究部门。在谈判失败后,纳德拉在X平台上写道,奥尔特曼“将加入微软,领导一个新的高级人工智能研究团队”,与OpenAI的联合创始人格雷格·布罗克曼以及其他同事一同工作。
临时首席执行官
2023年11月19日,OpenAI董事会成员伊利亚·苏茨克韦尔在向员工发表的一份声明中表示,尽管公司高管努力争取奥尔特曼复职,结果还是事与愿违。苏茨克韦尔也宣布,亚马逊旗下流媒体平台“特威奇”(Twitch)联合创始人、前首席执行官埃米特·希尔,将成为OpenAI新的临时首席执行官。
11月20日,OpenAI临时首席执行官米拉·穆拉蒂计划重新聘请萨姆·奥尔特曼和格雷格·布罗克曼;11月20日,据外媒,OpenAI董事会据称将聘请埃米特·谢尔担任CEO,取代创始人萨姆·奥尔特曼。
重返CEO,组建新董事会
2023年11月22日,OpenAI宣布,已经原则上达成协议,奥尔特曼重返公司担任CEO,“并组建由董事会主席Bret Taylor、Larry Summers和Adam D'Angelo组成的新董事会。” [45]1月30日,OpenAI宣布,萨姆·奥尔特曼已经回归担任首席执行官,OpenAI成立新董事会。 [46]同日,OpenAI原董事会成员海伦·托纳 (Helen Toner) 在社交平台X发文称,她正式辞去了OpenAI董事会的职务。
重组风波影响
创始人与董事会之间的决裂,是硅谷的老生常谈,但在这个案例中,创始人(硅谷人工智能革命的代表)与董事会(其任务是将社会利益置于利润之上)都非常特殊。这种决裂威胁着公司的未来以及投资者投入其中的数十亿美元。 [53]OpenAI的乱局一直是微软的负累,因为除了是OpenAI最大支持者外,微软还围绕OpenAI的人工智能软件重新调整了自己的业务,受奥尔特曼被解雇消息影响,微软的股价下跌。
OpenAI的混乱也引发人们对人工智能革命背后的人和公司的新质疑:如果它能如此轻易地因为背后诽谤他人的行为和不可靠的错误想法而陷入危机,那么人们还能信任它来推进一项可能对数十亿人产生不可估量影响的技术吗。
OpenAI这场高层“内斗”大戏,牵扯到商业利益和观念博弈两个方面的矛盾,后者体现为,“加速派”和“末日论派”在人类与AI的关系上的分歧。首席执行官奥尔特曼在加速部署OpenAI产品的商业化,扩大消费者市场。首席科学家伊尔亚·苏茨克维(Ilya Sutskever)则在内部组建“超级对齐团队”,以达到“让模型在最糟糕的情况下也能遵循人类的意图”等目的。2023年11月初,苏茨克维在一个纪录短片中称:“我的感觉是,通用人类智能(AGI)的发展会出现雪崩。”二人的观念取向,折射出硅谷乃至全世界人工智能行业对安全与进步的分歧观点,即“有效加速主义”和“末日论”。前者的拥趸希望通过最高效、最具影响力的技术进步与突破来加速社会、经济或技术系统的变革过程,并把风险视为变革的催化剂。而后者则更加审慎,认为一旦风险不可控,人工智能带来的巨大影响将毁灭人类社会。
重组风波调查结果
当地时间2024年3月8日,OpenAI在官网发布的新闻稿中表示,律师事务所WilmerHale对奥尔特曼2023年11月被解雇事件的调查已经结束,公司制定了新的治理规则,并加强了利益冲突政策。董事会表示一致支持奥尔特曼的领导。OpenAI在描述该律师事务所的调查结果时称,根据WilmerHale的调查结论,去年奥尔特曼遭遇的突然解职,并不是源于对OpenAI的财务、产品安全或其他问题的担忧。“相反,这是前任董事会与奥尔特曼先生之间关系破裂和失去信任的结果。”OpenAI董事会主席Bret Taylor在新闻稿中表示,“我们一致认为,奥尔特曼和Greg Brockman先生是OpenAI的正确领导者。”
团队解散
2024年5月15日,OpenAI原核心安全团队“超级对齐”负责人杨·莱克( jan Leike)在社交网络上宣布他本人已辞职,此外,这一团队的其他多名核心成员也纷纷离开,这一团队就此解散。杨·莱克17日在推文中怒斥OpenAI在追求华而不实的产品,质疑OpenAI不再关心安全。
Leike曾与OpenAI联合创始人Ilya Sutskever共同领导OpenAI的超级对齐团队,该团队负责防止超级智能失控,现已解散,剩余成员并入核心研究团队。Sutskever也已辞职。
回应联名信
2024年6月4日,OpenAI和谷歌旗下“深层思维”公司的13名现职员及前员工发表联名公开信,对人工智能行业在缺乏对“吹哨人”法律保护的背景下快速发展表达担忧。联名信签署人中,2人与“深层思维”有关,4名OpenAI现员工要求匿名。组织者包括OpenAI前工程师丹尼尔·齐格勒和前员工丹尼尔·科科塔耶罗。同一天,OpenAI回应联名信时强调,已设立匿名举报热线和安全委员会保护“吹哨人”,相信能以科学方法应对风险。
垄断调查
2024年7月,美国联邦贸易委员会(FTC)发布公告,已介入调查包括微软在内的 5 家主要科技公司,一方面重点审查其在 AI 领域的投资、合作过程中是否存在垄断行为,另一方面是帮助 FTC 洞察当前 AI 市场的竞争格局以及对创新的潜在影响。
本次调查备受外界关注的一个点是,FTC 将深入调查微软和 OpenAI 公司之间的投资关系,已经相关投资的实际意义和竞争影响。
人事变动
2024年8月6日,OpenAI 公司发言人表示,OpenAI 总裁、公司核心人物之一 Greg Brockman 将休长假,以“放松和充电”。另外,研究员 John Schulman 当日离职,将前往竞争对手人工智能 AI 初创公司 Anthropic。Brockman 在 X 上表示,其将休假到年底;Schulman也证实了他的离职。
所获荣誉
日期 | 荣誉名称 | 企业估值 | 排名 |
---|---|---|---|
2023年01月 | 全球TOP50网站(月的访问量已经达6.72亿次) | - | |
2023年04月 | 2023·胡润全球独角兽榜 | 1380亿(人民币) | 第17名 |
2023年06月 | 《时代》发布《2023年全球最具影响力100家公司榜单》获得“颠覆者(DISRUPTORS)”荣誉 | - | 榜单第21名 |
2023年07月 | 2023世界物联网排行榜-人工智能行业榜单 | - | 第5名 |
2023年08月 | 福布斯发布2023云计算100强榜单 | 280亿(美元) | 第1名 |
2023年11月 | 首期《财富》全球人工智能创新者50强榜单 | - | |
2023年12月 | “汉语盘点2023”年度字词——“ChatGPT”当选国际词 | - | |
2024年04月 | 2024·胡润全球独角兽榜 | 7100 亿(人民币) | 第3名 |
2024年04月 | 2024福布斯AI 50榜单 | 113亿美元 | - |
竞争对手
中国
产品名称 | 模型 | 定位 | 模型能力 | 发布/更新时间 |
---|---|---|---|---|
(ERNIE Bot) | ERNIE | 大语言模型 | 百度在人工智能四层架构中,有全栈布局。包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用。文心一言,位于模型层;百度在人工智能领域深耕十余年,拥有产业级知识增强文心大模型ERNIE ,具备跨模态、跨语言的深度语义理解与生成能力 [80] | 2023年2月7日 |
3.5版 | 在基础模型升级、精调技术创新、知识点增强、逻辑推理增强、插件机制等方面创新突破 [81] | 2023年5月 | ||
4.0版 | 知识增强大语言模型 | 理解、生成、逻辑、记忆四大能力都有显著提升。在万卡算力上运行飞桨平台,通过集群基础设施和调度系统、飞桨框架的软硬协同优化,支持了大模型的稳定高效训练。建设了多维数据体系,形成了数据挖掘、分析、合成、标注、评估闭环,充分释放数据价值,大幅提升模型效果。基于有监督精调、偏好学习、强化学习等技术进行多阶段对齐,保证模型更好地与人类的判断和选择对齐。可再生训练技术通过增量式的参数调优,有效节省了训练资源和时间,加快了模型迭代速度。此外,4.0在输入和输出阶段都进行知识点增强。 [81] | 2023年10月16日 |
其他国家
产品名称 | 定位 | 主要功能 | 模型名称 | 发布/更新时间 |
---|---|---|---|---|
Bard是建立在一个大型语言模型基础上的人工智能聊天机器人 | 将结合全世界的力量、智慧以及创造力,利用来自网络的信息提供新鲜、高质量的回应。 [70-71] | LaMDA 对话应用语言模型 | 当地时间2023年2月6日发布 | |
可支持包括中文在内的40多种语言,图像分析功能,可以提取相关信息或为图片取标题。 [72] | 当地时间2023年7月13日更新 | |||
人工智能模型“双子座" | 谷歌迄今为止功能最强大、最通用的大模型。它能够处理视频、音频和文本等不同形式的信息,相较于此前的版本,Gemini可以进行更复杂的推理,并实现更细致的信息理解。 [92]“双子座”是谷歌迄今最灵活的模型,能够在从数据中心到移动设备等不同平台上运行。“双子座”将推出Ultra、Pro和Nano三个版本。其中Ultra版本功能最强大,适用于复杂任务;Pro版本可扩展多种任务;Nano版本为高效设备端模型。 [93] | - | 当地时间2023年12月6日发布 |
产品名称 | 版本 | 定位 | 主要功能 | 模型/参数 | 发布/更新时间 |
---|---|---|---|---|---|
1.0版本 | 人工智能AI 工具 | 与前代产品(Stable Diffusion XL 0.9 版本)相比,生成的图片色彩“更鲜艳”、内容“更准确”,对比度、阴影和光照效果也更出众; 1.0 版是可定制的,用户就可以使用该 AI 工具完成复杂的设计;1.0版包含 35 亿个参数,可以在“几秒钟内”生成多种长宽比的完整图像;在文本生成方面,能在图片中生成各种形式的文本,免去用户后期调整字体的麻烦。 [73] | SDXL 模型/35 亿个 | 2023年7月 发布 |
产品名称 | 版本 | 定位 | 主要功能 | 发布/更新时间 |
---|---|---|---|---|
- | 大语言模型 聊天机器人 | 聊天机器人Claude被不少人认为媲美ChatGPT; [78]美国软件服务公司Notion、社交问答网站Quora和搜索引擎DuckDuckGo已将Claude集成到其产品内。 | 2023年3月15日发布 [75] | |
版本2 | 编码、数学和推理方面的性能都有所提高。升级之后,Claude 2的处理能力已经提升到了100K个Token,这意味着它可以处理数百页的技术文档,甚至是整本书。此外,面向更广泛的用户群体免费开放,并支持中文使用。 [76] | 2023年7月更新 | ||
版本2.1 | 可以为专业用户一次性消化多达20万个token,相当于500多页的材料,且出现“幻觉”或谎言的频率将是以前的一半,20万个token相当于Claude此前处理能力的两倍,且大幅高出GPT-4企业版3.2万个token的上限。 [77] | 2023年11月22日更新 |
产品名称 | 定位 | 主要功能 | 发布/更新时间 |
---|---|---|---|
聊天机器人 | 允许人们与名人或动漫角色的虚拟版本进行聊天,同时可以创建自己的聊天机器人和人工智能助手。 | Data from Similarweb显示,Character.AI的聊天机器人(具有不同角色和语气可供选择),吸引了18至24岁用户。与Open AI的ChatGPT和谷歌的Bard等其他聊天机器人相比,该公司通过此人口群体帮助自己在个人AI伴侣领域树立更加有趣的形象。 [78] | - |
转自:OpenAI_百度百科