亚马逊云科技生成式AI服务赋能游戏行业出海

e18fdcaec27200587286746d43e0243a.jpeg

关键字: [出海日城市巡展, Bedrock, 大语言模型, 游戏开发, 代码生成, 知识库构建, 智能巡检]

本文字数: 3100, 阅读完需: 16 分钟

导读

在这场演讲中,讲者讨论了如何将生成式AI应用于游戏行业的各个环节,包括创意策划、代码开发、运维监控等。他解释了大语言模型可以用于生成剧本、代码、知识库等内容,图像生成模型可以用于生成游戏角色、场景等图像素材,语音生成模型可以用于生成游戏配音等。讲者还介绍了亚马逊云科技在生成式AI领域提供的各种产品和解决方案,帮助游戏公司快速应用这些新技术,提高开发效率和用户体验。

演讲精华

以下是小编为您整理的本次演讲的精华,共2800字,阅读时间大约是14分钟。

谢谢大家,

前面校方老师的话已经很好地引入了这个话题。我不好意思,先插入一个小插曲,肖峰老师是我们全国游戏行业的首席架构师,他更多地分享了一些全球客户的经验。而我这部分的内容会稍微下沉一些,我会下沉到在我们本地的游戏开发商在做开发时,如何将深层次AI与具体场景相结合进行落地。

我的内容分为两部分:首先,我们会深入探讨这些场景,因为有时候光说有场景并不等于真正有场景。我们必须从用户出发,这是亚马逊的一个理念,称之为”backward”。其次,我会讲解在落地过程中,亚马逊除了提供现成的托管产品,如肖峰老师所说的生成式AI产品外,我们还有原型团队和解决方案团队,他们会提供一些开源的解决方案。

在场景方面,我将深层次AI大致分为两类:一类是大语言模型,比如GPT、LaMa Three等标准的LLM,以及国内流行的像”悟空”、“ChatGPT”这样的模型。另一类除了大语言模型之外,还包括图像生成模型,最出名的就是Stable Diffusion、MediaJourney等;还有声音生成模型,如SoulBeta、Soul系列;以及视频生成模型。

这张图与肖峰老师的图基本一致,只是我会进一步具体地逐步解释。

首先是大语言模型能做什么?打个比方,我昨天做了一个动手训练营,来的都是企业嘉宾。我向他们解释说,大语言模型对于企业来说,可以做以下几件事:

第一,构建企业知识库。企业需要写合同、审合同,这些大语言模型都可以做到。

对于游戏行业来说,大语言模型首先可以用于写小说。比如我昨天做了一个演示,虽然今天没有演示环节,但如果你感兴趣的话,可以后续联系我们。我当时请大模型以古龙的风格写一篇300字的名侦探柯南小说,结果生成的内容就像是古龙的风格,描写了一个少年在日本街头的场景,带有一些古风的感觉。现在头部的大语言模型,尤其是GPT、拉玛莎等,对多语种的支持已经非常强大了。

如果在座的有策划,那你可能在立项之前就需要写一些小策划的内容,天马行空地构思游戏的架构。比如我要写一个类似于《刺客信条》的架构,那我总要有一些语料,大语言模型就可以为我生成这些语料。

从全球角度来看,海外的很多大大小小的公司对生成式AI的反应更加迅速。这里举了育碧公司的例子,他们公布了一个自己的AI工具GhostWriter。育碧旗下有很多工作室,需要写复杂的剧本,比如在《刺客信条》系列中,法国大革命时期的背景资料,传统做法是查阅大英百科全书等,但现在可以让大语言模型根据你提供的一些详细信息,快速为你生成剧本大纲。育碧就是将这一功能做成了一种工具,因为很多游戏开发公司都在打造自己的制造和游戏管线,不仅包括3D渲染等,还包括剧本、语音等,都可以用上大语言模型。

同样的,像米哈游这样的公司也在大量尝试,比较简单的就是音色克隆,除了剧本之外,还包括他们的二次元角色,看是否能衍生出更多的内容。

除了创意阶段,如果在座的是码农或软件工程师,当你要写代码时,我们经常说组成代码有一套祖传代码,有些代码可能存在于89年。如果你发现了bug,而这个代码社区支持力度不足,你可能就要自己修bug。传统做法是组成带着几个普通程序员自己解决。但现在,如果你有一些代码片段,可以尝试与大语言模型交互。

最左边这张图是一家初创公司Diven的案例,虽然有人说它是作假,但不重要,重要的是现在有很多开源的解决方案,如OpenDiven、普林斯顿大学的SWSwEAgent等,它们能做什么?你给它一个GitHub的issue链接,它会自动读取那个issue,并尝试自动修复它。根据最新数据,在头部大语言模型的数据集上,它们可以在完全没有人工干预的情况下自动修复15%的问题,这已经很吓人了。如果再加上人工辅助,修复率可能会达到20%或更高。

所以对于有一套祖传代码的团队来说,你可以把代码丢给大语言模型,让它形成一个大纲,帮助新程序员了解这套代码。当新程序员修bug时,在提交代码前,你可以与大模型交互,编写一个review的prompt,根据你的代码风格规范,快速检查代码是否符合规范。这一块已经有很多公司在做了。

中间这一部分则偏向分析和游戏公司的平台。很多游戏公司除了客户端、服务器后端之外,还有平台,提供诸如登录、支付等公共服务。这种平台通常有大量的API需要集成。这时如果你把这些API的代码仓库以文档的形式存入向量数据库中,就可以对新员工提供增强检索的功能。比如一个新员工要使用支付API,他只需说”我需要写支付模块”,然后通过自然语言就可以搜索到相关的文档,并且不仅如此,大语言模型还可以直接为他生成代码,这就是所谓的RAG(Retrieve and Generate)。除了代码之外,还可以做一些数据洞察,比如分析某个用户当前的游戏状态等。

对于游戏公司的SRE或IT人员来说,他们需要保证游戏在用户量增多时正常运行。这里我举了两个例子,第一个例子是我们的智能巡检解决方案。假设你的公司使用Kubernetes容器服务,你可以使用我们的K8s GPT工具对其进行诊断,这个工具虽然名字里有GPT,但实际上是接入了我们的服务。你只需将它配置好,不需要编写复杂的prompt,它就可以获取Kubernetes的各种状态指标,如Deploy、Pod等,并与大模型交互,最终判断巡检是否通过。这个通过与否的条件是你自己预先设置的,比如CPU不超过60%、连接数不超过1000等。

第二个例子是,很多客户会采用Grafana作为标准的Dashboard,并使用Prometheus收集指标。但IT人员在正常情况下不会关注这些指标,一旦出现问题就需要查看大量的图表来找到根因。这时我们可以使用图像识别,将Grafana中的图表识别为向量,再丢给大模型进行智能巡检,从而自动化这个过程。

除了平台运营,我们还可以做舆情分析、敏感内容识别等,这部分我的同事严军会在下一个话题中详细讲解。

知识库的应用我前面已经说过了,如果你有对外的知识库或者对内的知识库,可以快速使用亚马逊的托管服务进行搭建。

接下来讲一下自问题,即角色扮演的应用场景。现在很多人喜欢这种带有背景的聊天机器人,比如夸夸机器人,不管你说什么它都会夸你。你可能会觉得这很无聊,但每个人在情绪低落的时候都可能需要这种情感陪伴。这种应用其实很多,这里放了一个牧童的例子,它大量使用了生成式AI的内容。

再讲一下远光巴士的案例,它在多个场景中使用了深层AI,远光巴士的主程张欣和我们分享了一系列博客,你可以在公告上查看详情。

远光巴士最初也是抱着怀疑态度尝试的,他们先是让我们搭建了一个飞书机器人,接入了他们的知识库,用于问答。用了之后他们觉得还不错,于是一步步地从简单的指令查询,发展到构建FAQ专家、提升用户体验、代码生成等。比如他们需要快速生成一些小的运营工具的网页代码,就可以用大模型生成。

然后他们开始形成流程助手,最开始做的就是自动化巡检。我前面讲过,他们使用了我们的DocumentDB服务,这是一个兼容MongoDB协议的数据库。他们会将Grafana中的图表通过插件截取下来,丢给大模型进行诊断,诊断出是否通过巡检。

除了大语言模型,我们还介绍了图像、声音和视频的应用。前面徐晓鹏老师已经说了,我相信现在每家游戏公司都至少有一个美术在使用生成式AI工具,不管是自己搭建的还是使用在线服务。

为什么需求如此普遍?因为在创意阶段你可能需要大量的原始图像,但你只有一些线稿,这时就需要通过风格迁移的方式,将你的草图直接变成理想的风格图像,然后与策划讨论是否符合预期。另外,当游戏需要更新时,如果你已经有了几百张物品图标等,你可以基于这些图标训练出自己的风格,然后快速生成新的图标,不再需要从零开始绘制。

很多大厂如网易、腾讯都有内部的图像生成流水线,前提是他们可能会针对自身需求对模型进行微调。除了静态图像,现在也流行生成漫画、动画等。这里放了一个沙雕视频,它实际上是通过人物视频捕捉和风格迁移的技术,将真人视频转换成动画风格。这种技术比较适合游戏的营销素材生成,因为传统做法成本较高,尤其是制作质量较好的视频。

所以亚马逊经常提到”生成式AI的普及或普惠”,意思是我们不要求每个人都掌握算法细节,但现在已经有大量的开源模型和工具,可以帮助我们快速地完成这些任务。比如你只需要做简单的营销素材,就可以将真人视频通过模型转换成期望的风格。

我们的一家客户娱之前做的是甜色游戏,他们有很多线稿图,就选择了我们的解决方案,基于这些线稿图生成了风格相近的图像,并采用了免维护的托管服务模式。另一家客户海艺互娱每天的生成图像量达到50万张,他们在平台上系统地提供了这种角色设计的功能,你可以选择背景图、参考图,设计姿势,它就会提取骨架,再加上你选择的风格,最终可以生成8K分辨率的影视级图像。除了静态图像,它们还可以生成四格漫画等。

生成式AI的例子实在太多了,因为从Stable Diffusion模型发布到现在已经有几年时间。

那么如何开始使用亚马逊的生成式AI服务呢?第一步是找到你的需求场景,比如写剧本、做角色扮演等。第二步是联系我们的商务拓展经理,我们可以为你做一个PoC验证,基本上不会产生太多成本。如果你的需求是简单的,比如翻译,我们会为你准备一个简单的prompt;如果是复杂一点的,比如构建对外或对内的知识库,你需要提供一些API文档,我们会将它们导入数据库,然后通过增强检索的方式为你服务。

如果你已经是某个品类的领先者了,需要保持自己的风格并大量生成内容,那可能就需要对模型进行微调了。当然,如果你已经是个巨头,打算自己训练模型,那也是可以的。但就我们目前在成都的情况来看,大部分游戏公司还停留在微调的阶段,主要集中在使用我们的大模型服务。

如果你想自己尝试训练一个小模型,这里有一个小例子,前提是你有一个亚马逊云科技账户。

在大语言模型方面,我们经常会讲到智能体(Agent)的概念。智能体实际上就是一个自动化程序。这里我分享了我们在两家大厂做的一个PoC案例,它是一个用户评论分析的应用。传统做法是使用大数据技术,而我们尝试使用语言模型来做。你可以输入我们继续讲下去。你可以输入一个应用名称,比如”我的世界”,然后这个智能体就会调用相关的服务,从原始数据中提取评论,并由大语言模型对这些评论进行总结和分析。

这个分析的重点来自于你的需求,比如你作为运营人员,经常关注用户反映游戏体验是否流畅、内容是否好玩,或者对付费点是否有不满意的地方。我们就会将这些需求转化为prompt,输入给大模型。你会看到,有的用户的确反映说虽然入门价格只有0.99美元很便宜,但实际上花费已经达到50美元了。这些评论都是真实的,只不过我们通过大模型可以快速提取和分析。

相比传统的大数据方案,这种做法对于3天内的数据量是完全可以承受的,不需要Hadoop、Spark的系统,可以直接在大模型上运行。

在图像生成方面,我们也有一些开源的解决方案,比如将Stable Diffusion部署到EKS容器服务上的解决方案。虽然这个方案看起来有点复杂,但实际上相当简单,就是利用异步推理的方式快速部署模型。我们还部署了ETL流程,因为ETL在扩缩容方面比较灵活。

好,我这边就是这些内容。再次感谢大家!

总结

生成式人工智能正在赋能游戏行业的各个环节,从创意构思到代码开发,再到运维监控和用户反馈分析。大语言模型可以辅助游戏策划撰写剧本、生成游戏背景和角色设定,也能帮助程序员生成和审查代码。在运维方面,AI可以智能诊断系统异常,并通过分析用户评论洞悉用户体验。此外,生成式AI还能快速制作大量营销素材,如漫画、视频等。

亚马逊云科技提供了多种生成式AI产品和解决方案,如Bedrock大语言模型、Stable Diffusion图像生成模型等,并支持客户根据需求进行模型微调和部署。通过低门槛试用和渐进式采用,游戏公司可以逐步融入生成式AI,提高效率、降低成本,为玩家带来更富创意和更佳体验的游戏产品。

生成式AI正在推动游戏行业的变革,游戏公司应当抓住这一机遇,与时俱进,在创意、开发和运营等环节充分利用AI的力量,保持竞争优势。亚马逊云科技将一如既往地为游戏行业提供强有力的AI支持和服务。

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值