可能是最有前途的国产大模型:讯飞星火认知大模型

大家好,我是可夫小子,关注AIGC、读书和自媒体。解锁更多ChatGPT、AI绘画玩法。加:keeepdance,备注:chatgpt,拉你进群。

昨天下午,科大讯飞发布了自己的大模型——星火认知大模型。在上周他们还在内测的时候,我就第一时间拿到了内测资格,通知群里的小伙伴,申请也是秒过。我简单地测试了一下,最直观感受就是「水平在线、诚意满满」。

昨天我观看了他们的发布会。关于大模型,刘庆峰主要讲了1+N的模式,1就主要是大模型的七个能力:内容创作、语义理解、知识问答、逻辑推荐、数学能力、代码能力,还有一个多模态。

loading

对于这些能力,各家的说法都不一样,无外乎就是吴恩达总结LLM的几点能力:总结、推断、转换、扩展。性能上,大语言模型的一些问题它也存在。总的来说,还算中文大模型中第一梯队。那它为什么是「可能最有前途」的那个呢?我主要有以下几点思考

与语音的结合,有天然的优势

我们知道,科大讯飞是一家做语音起家的公司。在许多场景中,前端声学处理 + 语音识别 + NLP + TTS构成了一个最基础的语音全链路技术 。科大讯飞这几十年就是在这个生意,不管是2B业务,还是2C业务。

在全链路的NLP部分,这些年使用最多还是神经网络。而以ChatGPT为代表的大语言模型,使用的是Transformer,算是一种神经网络的技术升级。讯飞的大语言模型的引用,就会对NLP作出了较大的改良。当然其实模块也有会影响,但NLP提升性能最大。

loading

我们在发布会现场也看到,科大讯飞研究院院长刘聪演示大模型案例的时候,输入是使用语音输入,再识别成文本(ASR)。回答的文本也使用了语音合成(TTS)技术读文本。可以看到,他们整合很迅速了。这些前、后端,都是他们成熟的技术,这就是他们比其他公司的优势。

与现有业务结合,快速落地商用

一个新的技术,能否迅速流行起来,就是看能不能快速融入到现有的商业模式中去。在国产大模型中,阿里的通义千问,有这样的潜质。与钉钉办公产品结合,有着立竿见影式的降本增效功能,但钉钉的商业化之路一直走得不顺。

讯飞业务中,教育占了很大比重。其实在发布会,后面也显示了「智能批改作业」的功能,这就是一个很直观的商业落地场景。这块业务,他们在市场、渠道、产品、商业模式都走通过。现在只要用大模型的能力,把这些节点都重塑、改造。小步探索,慢慢试水,就容易搞出一条大模型的变现之路。有了商业的正反馈,技术发展也会得到保障,形成商业与研发的良性互动。

loading

一些新的点

除此之外,我还看到他们关于插件、RPA的一些演示。其实这些是针对大语言模型的技术尝试。我在之前的文章《》,就介绍了OpenAI的Gerg在TED演示的一些内测功能,就有插件的应用。比如6月份,他们还会集成浏览器插件,实现实时信息搜索,可以说讯飞应用层面,没有落后太多。

loading

挑战与风险

我注意到,在昨天的发布会上,刘庆峰在介绍大模型的能力之前,就先提出一个「评测体系」的概念。一方面是想当国内大模型的执牛耳者,成为标准的制定者。还有一个考量就是边界划定。这波AI热度无疑是里程碑式的,那它目的地在哪里?安全边界又怎么界定?

这其实是当下各国政府以及科学家最担心的问题,还不说远景的AGI发展与人类的关系的思考,就当下如何保证技术不被滥用,都是一个很大的课题。讯飞想接这个瓷器活,但也不一定拿得出「金刚钻」

loading

还有一个挑战,就是「算力」。我们大模型的训练和使用就是算力猛兽,每一次请求,都是数亿次的计算。据CNBC报道,ChatGPT一次训练需要200-1200美元,用了1万个英伟达的DGX A100 GPU服务器。这些高性能的GPU,就是机器学习和图形计算的AI心脏,而英伟达占据了95%有市场,之前传闻A100和H100 GPU都不卖给中国公司了。科大在22年9月被美国列入了「实体清单」,要获得这些高性能GPU更是难上加难。

巧妇难为无米之炊,谁不能忽视悬在中国公司头上的「达摩克利斯之剑」

再有一个就是对于「智能涌现」分歧,对于大语言模型的发展,实践其实是走在理论在前面。相关研究人员发现,在ChatGPT的训练语料中,中文不到1%,但是在实际的使用过程中,中文的能力并不会比英文低很多。是不是模型在海量语料学习中,掌握各种语言之间的通用规则,出现一种「智能涌现」的能力?这其实还没有定论。1750亿的参数,就是一个黑盒子。

在刘庆峰的发言稿中,我搜索了「智能/智慧涌现」高达14次。可以看得出他对这个能力的信息,这到底是科学地乐观主义,还是盲目冒进,抑或其他原因,不得而知。

loading

后话

在知乎上,有一个网友问讯飞大模型,Who is the President of the United States?「美国的总统是谁」,大模型回答,他的知识更新是2021年9月,后面的事情它不知道。

2021年9月是一个代表性的日期,ChatGPT和GPT-4他们的训练集知识断点也是这个时间。所以也有网友怀疑,它只是调用OpenAI的API。我自己试了下,怎么回答不会再出现那个「2021年9月」了。当然,这也说明不了什么。

loading

讯飞在发布上的所有示例,都是真人现场演示,我还是觉得他们是有底气的。对此,我保持谨慎而乐观!

📣通知

我的《小白玩转ChatGPT》小册上线啦,已有180多位同学在里面学习,诸多福利一起赠送。只需一杯奶茶钱,让我们联系更紧密。

image.png

推荐阅读: ChatGPT知识库

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

可夫小子

感谢大佬!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值