一个视频说清楚,国庆假期AI界发生的四件大事

一条视频说清楚国庆假期AI界发生的四件大事

以下是视频的文章稿👇

国庆假期终于结束了,大家可能都在陆续进入工作状态,那这里我们一篇文章回顾在过去的一周中, AI 届都发生了哪些大事。

OpenAI DevDay

首先是 10 月 1 号 OpenAI 的第二届开发者大会 DevDay,那相比第一届来说,在内容策划上明显是对开发者友好了很多。2023年的那一次会开完以后,很多开发者近乎 OpenAI 抢了他的饭碗,但这次更多的是让开发者体会到了 OpenAI 给他的赋能。

这届 DevDay 上主要发布了四大件, Realtime API、 Prompt cache、 视觉微调以及模型蒸馏。我个人比较关注的是 Realtime API 和视觉微调,也和我的工作内容相关。在前面有条视频,我演示了两个 AI 相互辩论,大家可以看到它那个反应时间是非常短的。一个 AI 说完它的观点以后,另一个 AI 能够准确检测到他说完以后的停顿,然后马上开始回应,那个背后就是基于 OpenAI 最新的 Realtime API 进行开发的,当然那个演示不是我从零开始写的,而是我基于 OpenAI 官方的一个示例去加以改进的。

之所以我能那么快速的掌握这个示例的代码,并且对它进行改进,我是借助了一个 AI 工具叫 Eagle DevAgent,它可以迅速的帮我们读懂整个项目的代码,并且回答我们关于这个项目的几乎任何问题。那实测效果是几万行、十万行甚至到几十万行的代码,准确率都是比较高的。

而视觉微调我会把它用到什么场景软件的 UI 界面的自动化测试? UI 的自动化测试过去可能很大程度上都依赖人工录制脚本,但人工录制脚本它会带来一个问题,就是现代的软件由于我们对用户体验的不断追求,所以这个界面经常会改的,所以人工录制那个脚本它经常要去变,那最后就导致说效率的提升并不是很明显。

那另外一个方面借助 AI 的能力。比如说微软,它就曾经有过研究,就是用 GPT -4V去看这个软件的界面,并且判断下一步应该怎么去做测试。但是在我们过去实践中觉得这个准确率还是有待提高,那现在它提供了视觉微调的能力,那我就可以把我们的一些测试用例,数据人工做的去喂给这个模型,对它进行微调,就有望提高到生产可用的准确率,提升这个 UI 界面的测试的自动化程度。

硅谷历史上最大规模融资

那第二件大事儿就是 OpenAI 在10月2号完成了新一轮的融资,也是硅谷历史上最大规模的风险投资。而且这笔风险投资是带了对赌的,这么大规模的资金,然而还签了对赌,这也真的是史无前例。

Meta发布Movie Gen视频生成模型

自于Facebook,也就是 Meta 现在可谓是开源大模型的全球的领袖,他们在十一期间发布了最新的视频生成模型,直接对标春节期间 OpenAI 发布的Sora。

你看这俩公司一个在春节期间发布Sora,一个在国庆期间发布它的视频生成大模型,真的是不让中国人过个好节,他们把这个模型叫做 Meta Movie Gen、Sora该有的特性它也都有,但是它生成的视频的长度不及Sora。不过 Meta 还提供了一个配套的音频,所以它叫 Movie Gen,可以给生成视频配音,不像 Sora生成的都是默片,怎么样?这个效果还可以,不过需要提一下的是,这个模型目前还没有看到它的开源下载地址,所以它会不会像 Llama那样是一个开源模型现在还不好说。

ChatGPT Canvas

那最后一件事是在 10 月 4 号 OpenAI 发布的,那个可以说是新的产品,我个人觉得更准确的说是 ChatGPT 这个 Web APP,它的一个新的特性叫canvas。说起来,它是一个不是特别大的一个更新,我个人认为,但是确实是在网上引起了不小的反响。

这个特性对于内容创作者特别有用,比如说我要用 ChatGPT 来写一篇文章,改一个报告,或者说是写一个程序代码,那过去可能我提示完以后它生成的内容,如果我想去修改,我再次提示它,然后它继续往下去修改,但现在相当于是它生成了一份内容放在那,然后你在提示它的时候,它在这个内容基础上去做修改,这种体验就更加自然,更像我们人类平时去改一个文件,最后达到要求的那个过程。

不过这个特性其实它不是 OpenAI 的首创了, OpenAI 的一些竞品,比如说 Anthropic的 Claude,之前很长时间其实就已经提供了,而且功能比这个可能还要稍微好一些。你比如说如果生成一个 html 的网页的话,那 Claude里边它能够直接渲染出来这个网页实际在浏览器中打开看到的效果,但目前 ChatGPT 的 CANVAS 尚不支持。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值