一周工作5分钟完成！新版文心一言实测：秒秒钟出广告片，几句话搞定代码，办公科研生产力直接ProMax...

QbitAl

于 2023-08-17 17:06:30 发布

阅读量611

点赞数 1

文章标签：文心一言

本文链接：https://blog.csdn.net/QbitAI/article/details/132353071

版权

金磊发自凹非寺
量子位 | 公众号 QbitAI

家人们，百度文心一言的插件，现在可以联动着用了——

只要几十秒，立马给你生成一个专业广告大片！

话不多说，直接先来看一下成品：

不信？

没关系，我们现在就来手把手地实操演示一下。

首先就是要把要用到的文心一言的相关原生插件“火力全开”：

百度搜索：也就是大家常说的“联网”，可以保证大模型的时效性和准确性（默认开启）；
说图解画：把图片丢进去，就可以根据它写故事、文案、回答问题等；
一镜流影：根据主题词、语句或段落，一键创作生成视频（依托文心跨模态大模型，突破了不同模态之间语义对齐等技术难题，创新融合文本、视觉、语音、跨模态等一系列技术能力）。

然后我们将一张可爱的奶牛照片丢进去：

让文心一言先做一个理解：

从解析的结果上来看，文心一言精准无误地做到了“看图说话”：

一头黑白相间的奶牛，站在蓝天下，正凝视着镜头。它似乎有些好奇或惊讶，又或许在思考着自己的存在和命运。它的耳朵竖立，眼睛炯炯有神，仿佛在寻找什么重要信息。它是一只充满生命力的动物，充满了活力与好奇心，让人不禁想要靠近观察它的世界。

接下来，我们让文心一言帮忙取一个品牌名称：

在给出的品牌名称的风格之上，我们再让文心一言写一段广告语：

最后，只需要求文心一言根据以上内容生成一个视频，“啪的一下”，数十秒时间，广告视频就诞生了！

或许有朋友要说了，职场人拍个广告片，前期可是要做大量的调研工作才能保证视频内容的真实性与精准度。

确实如此，不过现在，借助文心一言多个插件的联动，这项工作也会变得异常轻松容易：

览卷文档：根据给定的文档，可以完成摘要、问答和创作等任务；
E 言易图：仅需简单的数据图表需求，或输入待生成图表的数据内容，即可生成可交互图表，已支持7类图表的生成，包括数据图、饼状图、折线图、雷达图、漏斗图、思维导图、散点图。

在将文档“喂”给文心一言之后，不论是对内容的总结亦或是对数据的分析，都变成了一句话的事了：

如此一来，原本要消耗数天甚至数周的工作，直接压缩到了几分钟的时间里。

网友们在看到这般效果之后，也是纷纷惊呼“泰酷辣”、“给工作带来了很多帮助”。

为了能够打造更多的插件，文心一言还发布了大模型插件统一开发范式及工具集，邀请第三方为文心一言开发插件。感兴趣的小伙伴可以去尝鲜了（链接见文末）。

（注：除百度搜索外，目前可最多联动3个插件。）

而以文心一言为代表的大语言模型，也意味着跨入了一个新的台阶，正如百度首席技术官王海峰在大会中首次对外所表示的那般：

人工智能具有多种典型能力，理解、生成、逻辑、记忆是其中的核心基础能力。这四项能力越强，越接近通用人工智能，而大语言模型具备了这四项能力，为通用人工智能带来曙光。

升级后的文心大模型，还能做什么？

作为开发者大会，定然是少不了代码场景下的能力升级。

百度集团副总裁吴甜在现场便抛出了一个让很多程序员头疼的问题——接手代码：

“前人”留下的代码太难懂、太晦涩了。

现在，程序员们再遇到这样的问题就不用愁了，一个“复制粘贴”的动作，把烦恼统统交给文心一言来解决。

它会逐行地对代码的功能做出解释，并且在结尾处会总结整个代码的作用：

这个函数的功能是计算给定文本中单词的频率，并按照频率对结果进行排序。

若是依旧不是很好理解，也只需让文心一言对代码做一个改写：

当然，我们还可以让它写一个测试用例，并给出运行结果。

至于在代码输出能力，吴甜在现场也演示了生成展示词云的代码，并将它实时运行了出来：

可见文心一言已经具备了很强的代码解释、代码改写、代码注释、代码生成等能力。程序员防秃头，就用文心一言呀。

WAVE SUMMIT大会上百度为开发者提供的福利可不止这个。大模型社区“星河”上线了！

在星河大模型社区，开发者可以获得一体化大模型开发体验。飞桨+文心贯通全开发流程，与开发者持续共创大模型项目和应用。

它的前身其实很多小伙伴都已经比较熟悉了，正是飞桨的AI Studio（星河社区），专门为大模型增设了一块新的“专区”。

据了解，星河大模型社区目前已经有300多个大模型创意应用，还有创意配方可以分享和使用，同时也提供了稳定的应用部署环境（登录AI Studio访问“社区”栏目，能玩儿上好一阵）。

不过刚才提到的种种新能力，也还只是文心一言升级表现的一隅。

工作生产力方面，百度智能工作平台“如流”也得到了相应加持——重磅发布超级助理，不仅是工具那么简单，而是会更懂你、专业、实时陪伴的那种。

例如，百度集团副总裁、百度集团首席信息官李莹和同事在现场演示了一句话完成请假：

下周五我要休一天假，去参加社区公益活动。

更复杂的，如申请差旅，也是可以一句话搞定了：

我后天上午去上海研发中心开会，当天返回北京，请帮我规划行程。

不仅为已有日程让出时间，就连机酒组合也一并奉上，还不用操心报销问题，秒级完成操作。

另外，找文档、学知识、查文献，在文心一言的加持下，现在也都简化成了一句话搞定：

除此之外，聚焦到开发者，百度程序员都在用的编程助手Comate，也基于文心一言来了个大升级——发布X版本，覆盖研发全生命周期、全场景，全面帮助工程师“想”“写”“改”代码，已支持30+语言，十多种IDE。

同样是一句话，李莹和同事现场一分钟便开发出了邀测激活码功能代码：

用Java写一个方法，来生成唯一的激活码。

同样的，在Comate X中也可以继续追问，例如“解释这段代码”、“生成注释”、“生成测试”等。

不仅如此，这届WAVE SUMMIT还推出了开发套件Comate Stack，让更多、更大的开发项目变得越发容易。

例如若是想在超级助理里开发一个休假政策的插件，那么现在只需两个步骤即可：第一步对Prompt做评估，第二步用iPlayground少量配置即可完成。

一套操作下来之后，也是让网友们惊叹于开发的简易与高效：

那么在纵览这波技术“肌肉秀”之后，随即而来的一个问题便是：

怎么做到的？

左手文心大模型，右手飞桨，这便是此次能力升级背后的秘笈。

正如刚才王海峰所述，现在文心产业级知识增强大模型已经具备了理解、生成、逻辑、记忆四项能力。

至于它们的获得方式，我们不妨以文心一言为例来窥知一二。

文心一言首先从数万亿数据和数千亿知识中融合学习得到预训练大模型。

在此基础上采用有监督精调、人类反馈的强化学习和提示等技术，并具备知识增强、检索增强和对话增强等技术优势。

进一步地，通过多种策略优化数据源及数据分布、基础模型长文建模、多类型多阶段有监督精调、多任务自适应有监督精调、多层次多粒度奖励模型等技术创新，全面提升基础通用能力。

在检索增强和知识增强的基础上，通过知识点增强，提升对世界知识的掌握和运用；通过大规模逻辑数据构建、逻辑知识建模、多粒度语义知识组合以及符号神经网络，提升逻辑能力；通过构建数据、内容、模型和系统安全的全面安全体系，保障大模型的安全性。

也正因如此，文心一言自3月份开放测试以来的短短5个月，技术和应用效果都在大幅提升。

吴甜在此次大会中也公布了一组数据：

过去5个月“文心一言”成长迅速，现在已经熟练掌握的创作体裁超过了200个。内容丰富度是发布初期的1.6倍，给用户提供了更加丰富、言之有物的文案书写。大语言模型非常让人欣喜的一个能力是它的逻辑思考能力，通过思维链长度的提升，今天的“文心一言”思维链长度已经是发布初期的2.1倍，思维链长度使得“文心一言”思考的过程具备了更好的深度。同时通过知识点覆盖的加强，使得“文心一言”在给大家提供帮助的时候有更广阔的思维，如今知识点覆盖达到了发布初期的8.3倍。