通用大模型向左，角色大模型向右

最新推荐文章于 2024-10-08 20:27:53 发布

PaperWeekly

最新推荐文章于 2024-10-08 20:27:53 发布

阅读量1.7k

点赞数 22

文章标签：人工智能

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/135516729

版权

本文介绍了角色大模型相对于通用大模型的特性，重点关注其在拟人化、共情力方面的优势。角色大模型在游戏、影视等领域的应用日益广泛，如Character.AI和通义星尘等平台提供了个性化角色定制服务。RoleEval和CharacterEval等评测基准的出现，为评估角色模型的性能提供了标准。百川智能的Baichuan-NPC模型在角色扮演领域表现出色，通过‘角色增强基座’和‘角色思维链对齐’技术解决了身份一致性问题，成为中文角色扮演的领先者。

摘要由CSDN通过智能技术生成

引言：角色大模型，更像栩栩如生的人

以 ChatGPT、GPT-4 为代表的通用大模型正涌现出人工智能模型前所未有的智能水平，为最终构建通用人工智能（AGI）奠定了坚实的基础，让我们无限憧憬奇点时刻的到来。同时，在大模型技术的激涌潮流中，基于角色大模型的类人智能体技术（Humanoid Agent）的崛起也引起了广泛的关注 [1] [2]。

相较于通用大模型对智商的追求，角色大模型的研究者们专注于打造更加拟人化、具备强大共情力的角色智能体。这些智能体不再仅仅是冰冷的数据处理工具和问答机器人，而是各有人设、栩栩如生，宛如一位位良师益友。它们具备与用户建立深厚而长久连接的能力，为用户提供更加个性化、沉浸式的体验。

▲ Character.AI的“Books”类目中为用户提供了赫敏、哈利波特等耳熟能详的角色，和书中之人交谈不再是梦。

大模型技术的颠覆性发展使得角色深度个性化定制成为可能，正在为社交、游戏、影视等泛娱乐行业带来深刻的变革。在游戏领域，智能 NPC 的崛起使得游戏体验更加丰富，玩家可以与更智能、更具自主意识的虚拟角色进行更深层次的互动。

而在影视和网络文学行业，扮演 IP 角色的智能体使得用户心爱的角色摆脱原有情节的框架，在用户自定义的新场景中为其提供新鲜体验和持久陪伴。一些行业探索者，如 Character.AI [3] 和通义星尘 [4] 等，已经成功开发出初具规模的角色大模型定制平台。这些平台不仅提供数百个预定义的人设，还支持用户自定义全新的角色，给用户提供了更个性化、丰富多彩的虚拟互动体验，为下一代 UGC 社交内容平台的形态提供了丰富的想象空间。

▲ 大热番剧《间谍过家家》的女主约尔太太，在Character.AI上对新用户还是像在剧里当刺客时一样高冷。

与强调问答的准确性、安全性，旨在构建“高智商通用助手”的通用大模型研发不同，角色大模型的研究更注重让模型“像栩栩如生的人”，立得住人设、陪得了用户。这要求模型不仅具备深厚的角色知识，保持一致的对话风格，还能够生动演绎角色的魅力，为用户提供充满新鲜感和情感价值的互动体验。对于角色模型所需的这些能力，国内甚至全球范围内尚缺乏系统、全面的评测基准。因此，角色大模型在训练和评测技术上面临着与通用大模型领域不同的独特挑战。

近日，在模型训练方面，百川智能的 Baichuan-NPC 和智谱的 CharacterGLM [5] 等在角色扮演领域的大模型研究工作，为业界带来了新的对齐技术；而在性能评测方面，RoleEval [6]、CharaceterEval [7] 等基准数据集的发布为系统评估角色大模型的角色一致性、吸引力、对话能力和性格测试等细粒度属性提供了丰富的资源。

本文将详细探讨这些角色大模型研究的最新进展，并通过在 RoleEval 与 CharacterEval 这两个基准上的评测结果，全面比较前沿大模型在角色扮演领域的性能。

值得注意的是，我们发现百川智能最新发布的 Baichuan-NPC 角色大模型，在其独特的“角色增强底座+角色思维链对齐”技术支撑下，在多个评测维度上表现出色，其中文角色扮演能力显著优于通用大模型的翘楚 OpenAI GPT-4 以及 MiniMAX、通义星尘等其他角色大模型，成为中文角色扮演领域的领先者。

据悉，百川智能不仅发布了角色大模型，还推出了包括角色创建平台、搜索增强知识库等配套生态体系，支持用户以零代码的方式轻松调试和部署角色大模型，为角色大模型的基础技术发展和产业应用做出了开创性的贡献。