亚马逊云科技:基础模型在文本生成领域的热门应用场景

关键字: [亚马逊云科技中国峰会2024, 生成式Ai应用场景, 提示词最佳实践, 数据隐私安全合规, 大语言模型微调, 内容安全过滤]

本文字数: 3900, 阅读完需: 20 分钟

导读

在”亚马逊云科技中国峰会2024”上,申绍勇从亚马逊产品团队介绍了AmazonBedrock中的基础模型”FoundationModel”的热门用例。他讨论了生成式AI在文本生成、总结、创意等方面的应用,以及如何选择合适的模型、优化提示词、确保数据隐私和安全等最佳实践。此外,海艺互娱分享了他们在游戏、电商、出版等行业中利用生成式AI打造创意场景的实践经验,并展望了未来与Bedrock大语言模型的结合应用。

演讲精华

以下是小编为您整理的本次演讲的精华,共3600字,阅读时间大约是18分钟。

在当今时代,企业内部存在着大量的非结构化数据,包括文本文档、表格、图像、视频和音频等多种形式。根据戛纳和麦肯锡的研究显示,企业中绝大多数资料或数据都属于非结构化的类型,高达80%左右。为了更好地利用这些数据,生成式人工智能(Generative AI)应运而生,它能够帮助企业处理这些非结构化数据,从中提取有价值的信息和见解。

生成式人工智能在企业中的应用场景主要包括三个方面:首先,它可以提升客户体验。通过生成式AI,企业可以为客户提供更加实时和个性化的支持服务,例如智能客服助手、个性化推荐系统等。这些系统能够7*24小时全天候为客户提供服务,快速响应客户的各种需求,从而提升客户的满意度和忠诚度。无论客户使用何种语言提出问题,智能助手都能够快速理解并给出准确的回复。它还可以从业务系统中提取相关信息,为客户提供更加个性化和高效的服务。目前,生成式AI已经支持全球100多种标准的常见语言,任何用户都可以用自己熟悉的语言进行查询和交互。

其次,生成式AI可以提高员工的工作效率和生产力。它能够帮助员工自动完成一些重复性的工作,如文档撰写、会议记录总结等,从而让员工能够将更多的精力集中在更有价值的工作上。同时,生成式AI也可以为员工提供创意灵感和辅助,帮助他们更好地完成创新性的工作。例如,当员工需要撰写一份重要文档或创意方案时,生成式AI可以根据提供的大纲或要点,快速生成初稿,为员工节省大量时间。员工也可以将生成式AI用于总结会议记录,快速提取每个人的工作安排和时间点,生成结构化的会议纪要。在展会现场,还有专门的表格解析功能,可以从会议记录中整理出各个部门或人员需要完成的工作,为后续的任务分配和跟踪提供了便利。

第三,生成式AI可以优化企业的业务流程和运营。通过自动化和智能化的方式,生成式AI能够帮助企业简化复杂的流程,提高效率,降低成本。例如,它可以自动生成报告、合同等文档,并进行智能审核和分析,从而加快决策过程。根据麦肯锡的预测,到2030年,生成式AI有望为企业创造约4.4万亿美元的利润增长。因此,越来越多的公司开始投入生成式AI的研发和应用,以期从这些非结构化的数据中挖掘出更多价值。

在实际应用中,生成式AI的用例非常丰富。例如,它可以作为智能客服助手,为客户提供7*24小时的服务支持。无论客户使用何种语言提出问题,智能助手都能够快速理解并给出准确的回复。它还可以从业务系统中提取相关信息,为客户提供更加个性化和高效的服务。如果客户打电话过来,坐席人员与客户的对话记录都会被记录下来。传统的做法是人工整理这些记录,效率低下且容易出错。而现在,生成式AI可以快速将这些文本记录转化为结构化数据,如表格、JSON或Markdown格式,并按照需求提取关键信息,整理准确度大大提高。

另一个典型应用是内容创作辅助。生成式AI可以根据提供的大纲或要点,自动生成博客文章、新闻报道、营销文案等内容。对于需要大量内容输出的企业来说,这无疑是一个极大的助力。它还能够对已有的内容进行优化和迭代,为用户生成多个备选大纲,用户可以选择最满意的版本,或在此基础上进一步修改和优化,直到达到满意的效果。

此外,生成式AI也可以用于会议记录的总结和分析。它能够快速梳理会议内容,提取每个人的工作安排和时间点,并生成结构化的会议记录,大大提高了工作效率。在展会现场,还有专门的表格解析功能,可以从会议记录中整理出各个部门或人员需要完成的工作,为后续的任务分配和跟踪提供了便利。

除了文本处理,生成式AI在数据提取和分析方面也有广泛的应用。它可以从文档、合同等非结构化数据中提取关键信息,并进行智能判断和分析。例如,判断合同是否正常执行、是否存在违约情况,并给出相应的理由和建议。这种自动化的分析能够极大地提高工作效率,降低人工错误的风险。

在选择生成式AI模型时,企业需要综合考虑多个因素,包括业务场景、模型的功能和性能、支持的语种、自定义选项、价格等。亚马逊云科技公司的Bedrock服务提供了7家供应商的29种基础模型,涵盖了闭源模型如Cloudera,以及开源模型如Llama、Cohere、Meta AI、Anthropic等。这些模型支持文本、图像、音频等多模态输入输出,包括文本生成、文本到图像、嵌入等不同任务。用户可以根据自身需求,选择最适合的模型。例如,在医疗领域,需要选择能够理解专业术语的模型;在游戏等特定领域,则需要对模型进行微调,以支持该领域的知识和语料。

提示词(Prompt)是与生成式AI模型交互的关键。不同的模型对提示词格式有不同的要求,因此需要针对具体模型优化提示词模板。一个典型的提示词设计流程包括:首先设计提示词模板,然后在不同的任务场景中进行测试,得到一个相对稳定的模板,再将其应用到产品中。在产品上线后,需要持续监控模型的输出,发现错误案例时及时优化提示词模板,形成一个闭环的迭代过程。

在实际应用中,提示词的设计需要遵循一些最佳实践。例如,对于元数据的Llama 2模型,如果按照标准的”用户-助手”角色,并使用特殊符号(如<>)圈出关键信息,模型的输出会更加准确和简洁。随着模型的不断进化,未来的生成式AI将变得更加智能和易用,能够更好地理解自然语言的提示词。目前,亚马逊已经开发了一款名为Compare的开源工具,它可以同时支持多个模型(如CloudAI 3、Llama 2、Llama 3等),只需输入自然语言的提示词,工具就会自动进行格式转换,大大提高了使用体验。

安全和合规是企业在使用生成式AI时需要重点考虑的问题。亚马逊云科技提供了一种名为Argil的内容过滤和审核机制,可以从四个角度对模型的输入和输出进行控制:

  1. 限制话题范围,例如只允许讨论特定的主题,如客户服务等。
  2. 内容过滤,屏蔽包含争议、暴力等不当内容的输出。
  3. 敏感信息保护,通过正则表达式等方式,过滤包含个人信息、产品密码等敏感数据的输出。Argil支持设置1万个单词的过滤库。
  4. 单词过滤,构建禁止词库,屏蔽特定的词语或短语。

当检测到不当内容时,Argil可以直接阻止模型输出,或者对关键信息进行掩码处理,从而保护数据安全和隐私。此外,亚马逊云科技还提供了云踪迹(Cloud Trail)服务,可以全面监控对Bedrock服务的每一次API调用,包括调用时间、IP地址、操作内容等,以满足企业的审计需求。

接下来,我们将听到一个来自游戏行业的客户案例,了解生成式AI在实践中的应用。这位客户是海艺互娱,一家总部位于成都的全球性AI生成内容平台。作为全球第四大生成内容平台,海艺互娱在国内排名第一,主攻图像生成领域,未来还将拓展到视频生成。

海艺互娱拥有超过1000万活跃用户,模型调用次数超过1.5亿次。它不仅是一个生成内容的平台,同时也是一个庞大的素材库,收录了超过10亿张优质图像素材,为设计师提供了丰富的资源。

为了提升图像生成的质量和效率,海艺互娱自主研发了海翼2.0和2.1两款模型。相比于开源的稳定扩散模型,这两款模型在语义理解、图像质量和场景构建方面都有显著的提升。尤其是对于中文的理解能力,海艺互娱进行了专门的优化,使模型能够更好地理解中文提示词。

除了自研模型,海艺互娱还与外部实验室开展合作,引入了日本AnyManager实验室的二次元模型、华为方舟实验室的Pix2模型和SD3模型等,进一步提升了图像生成的质量和多样性。另外,海艺互娱还资助了一些实验室,如与MiJourney的对比实验显示,海艺互娱的图像生成质量可以达到MiJourney的55%左右。

海艺互娱为用户提供了一个低门槛、易上手的图像生成工具。用户只需在提示词框中输入想要生成的内容,在副标签框中输入不希望出现的内容,然后选择合适的模型和风格,就能够快速生成所需的图像。整个过程非常简单,就像是选择一道菜的主料和调味料一样。

为了提高图像生成的可控性,海艺互娱还提供了参数调节功能。由于底层采用的是扩散模型,生成的图像往往会与用户的预期存在一定差异。通过调节参数,用户可以更好地控制最终输出,使生成的图像更符合预期。

在游戏行业中,海艺互娱的图像生成工具可以极大地提高内容生成的效率。以往,游戏公司需要耗费3到5天的时间,才能为一个新角色生成展示图片。而现在,通过海艺互娱的AI画板工具,只需2到3个小时,就能完成同样的工作,效率提升了10倍以上。

该工具的使用流程如下:首先,从海艺互娱的素材库中选择一张参考图片。然后,在AI画板上随意勾画一些草稿,输入相应的提示词,如”这是一个沙滩场景”。工具会实时渲染出对应的图像。接下来,可以调节各种参数,如选择一个已有角色的姿态,生成相同姿态的新角色。最后,将新生成的角色拖拽到背景图像中,通过内置的图像融合功能,就能够生成最终的成品图片。

除了游戏行业,海艺互娱的生成式AI工具还被广泛应用于电商、广告设计、出版等多个领域。它们还与亚马逊云科技的Bedrock服务深度整合,在日常推理过程中引入了大语言模型,用于提示词优化、多语种支持和智能客服等场景。例如,在展会现场,海艺互娱演示了如何利用大语言模型回答有关医学专业术语的问题,如”心脏病和二尖瓣的关系”。如果现有模型无法很好地理解这些专业术语,企业就需要选择更合适的模型,或者对模型进行微调,以满足特定领域的需求。

未来,海艺互娱计划在Bedrock上构建在线知识库和智能数据分析功能,进一步拓展生成式AI的应用场景。通过与亚马逊云科技的紧密合作,海艺互娱将继续推动生成式AI技术在各行业的创新应用,助力企业提高效率,释放数据价值。

总的来说,生成式人工智能正在为企业带来前所未有的机遇。它能够帮助企业更好地利用非结构化数据,提升客户体验、员工生产力和业务运营效率。通过与亚马逊云科技等领先公司的合作,企业可以获得成熟的生成式AI解决方案,并根据自身需求进行定制和优化,从而在激烈的市场竞争中获得竞争优势根据麦肯锡的预测,到2030年,生成式AI有望为全球企业创造高达4.4万亿美元的利润增长,可见其巨大的商业价值和发展前景。

生成式AI在企业中的应用场景可以进一步细分为以下几个方面:

首先,它可以帮助企业提供更优质的客户服务。传统的客服人员需要7*24小时值班,而现在企业可以通过生成式AI构建智能客服助手,为客户提供全天候的支持和查询服务。这种AI助手能够快速从业务系统中提取相关信息,根据客户的问题给出准确的解答,大大提升了服务效率和客户体验。

其次,生成式AI可以辅助企业进行内容创作和营销。企业往往需要大量的营销文案、新闻稿、博客文章等内容输出,而生成式AI可以根据提供的大纲或要点,自动生成初稿,节省大量的人力成本。此外,它还能对现有内容进行优化迭代,为企业生成多个备选方案,帮助企业选择最佳的营销策略。

再次,生成式AI可以用于会议记录和文档处理。它能够快速总结会议内容,提取每个人的工作安排和时间点,生成结构化的会议纪要,提高工作效率。在展会现场,还可以利用表格解析功能,从会议记录中整理出各部门需要完成的任务,为后续的工作分配和跟踪提供便利。

此外,生成式AI在数据分析和决策支持方面也有重要应用。它可以从海量的非结构化数据(如合同文本)中提取关键信息,并进行智能分析和判断,例如判断合同是否存在违约风险,为企业的决策提供有力支持。

在模型选择方面,亚马逊Bedrock服务提供了多家供应商的29种基础模型,覆盖了文本、图像、音频等多模态输入输出,用户可以根据具体需求进行选择。例如,在医疗领域,需要选择能够理解专业术语的模型;而在游戏等特定领域,则需要对通用模型进行微调训练,以支持该领域的知识和语料。

提示词的优化是与生成式AI模型交互的关键环节。不同模型对提示词格式有不同要求,因此需要针对具体模型设计优化提示词模板。一个典型的流程是:首先设计提示词模板,在不同场景中测试,得到稳定的模板后应用到产品中。产品上线后,需持续监控模型输出,发现错误案例时及时优化提示词,形成闭环迭代。

在提示词设计的最佳实践中,例如对于Meta的Llama 2模型,如果按”用户-助手”角色设计,并用特殊符号圈出关键信息,模型输出会更准确简洁。随着模型进化,未来的AI将更好地理解自然语言提示词。亚马逊已开发Compare工具,支持多模型,只需输入自然语言提示词,工具会自动转换格式,提高易用性。

生成式AI的安全合规问题也受到高度重视。亚马逊的Argil机制可从四个角度控制模型输入输出:限制话题范围、内容过滤、敏感信息保护和单词过滤。它支持设置1万个单词的过滤库,并可直接阻止或掩码不当输出,保护数据安全隐私。此外,云踪迹服务可全面监控对Bedrock的API调用,满足审计需求。

接下来,我们继续了解海艺互娱在游戏等行业的生成式AI应用实践。作为全球第四大内容生成平台,海艺互娱拥有1000万活跃用户,调用量超过1.5亿次。它不仅是内容平台,还是一个拥有10亿素材的庞大素材库。

海艺互娱自研了海翼2.0和2.1模型,在语义理解、图像质量和场景构建方面都有突出表现,尤其优化了对中文的理解能力。同时还引入了外部二次元模型、Pix2模型等,使图像生成质量可达MiJourney 55%水平。

它为用户提供了低门槛易用的图像生成工具。用户只需输入提示词和副标签,选择模型风格,即可快速生成所需图像,就像选择菜肴的主料和调味料一样简单。工具还提供参数调节功能,使生成图像更符合预期。

在游戏行业中,海艺互娱的AI画板工具可将角色图片生成效率提高10倍以上,从过去的3-5天缩短至2-3小时。用户可从素材库选取参考图片,在画板上勾画草稿并输入提示词,工具会实时渲染背景。然后调节参数生成新角色,最后将角色拖拽到背景中,通过图像融合功能生成成品图。

除游戏外,该工具还广泛应用于电商、广告设计、出版等领域。海艺互娱还将Bedrock的大语言模型整合到日常推理过程中,用于提示词优化、多语种支持和智能客服等场景。

在展会现场,海艺互娱演示了如何利用大语言模型回答医学专业术语问题。如果现有模型无法理解,企业就需选择合适模型或对模型进行微调,满足特定领域需求。

未来,海艺互娱计划在Bedrock上构建在线知识库和智能数据分析功能,进一步扩展生成式AI的应用场景,与亚马逊云科技紧密合作,推动该技术在各行业的创新实践,助力企业提高效率,释放数据价值。

生成式AI正在为企业带来前所未有的机遇,帮助企业更好利用非结构化数据,提升客户体验、员工生产力和业务运营效率。通过与亚马逊云科技等领先公司合作,企业可获得成熟的生成式AI解决方案,并根据需求进行定制优化,在市场竞争中获得优势。根据预测,到2030年,该技术有望为全球企业创造高达4.4万亿美元的利润增长,展现出巨大的商业价值和广阔的发展前景。

下面是一些演讲现场的精彩瞬间:

亚马逊云科技中国峰会2024:介绍mcn barrock基础模型及相关应用

亚马逊云科技中国峰会2024上,演讲者详细介绍了embson bear rock图中的7家模型提供商和29个基础模型,包括闭源和开源模型,涵盖文声文、文声图、embedding和生成图等多种类型,供客户根据业务场景选择最适合的模型。

22c2b797077ea333a5049bc28fe174f7.jpeg

亚马逊云科技中国峰会2024:大语言模型的未来趋势是变得越来越智能、简单和便捷,可以快速准确地回答问题,并提供开源工具帮助用户使用不同模型。

bd8e25cee1df94e2ada6fca0fc980e5a.jpeg

亚马逊云科技中国峰会2024:通过持续迭代和监控,确保提示词模板(Prompt Engineering)与业务需求保持一致,实现优化的产品体验。

5026162db1e6b250b0dd0d9eb1584811.jpeg

亚马逊云科技中国峰会2024上,演讲者通过生动形象的做菜比喻,解释了AI模型和风格之间的区别及其对最终生成图像的影响。

14e37fd1d549dc7af3b1e5c9ee7b6d56.jpeg

通过实时画板和草稿成图功能,用户可以随手勾勒草图,并利用文本提示生成相应的图像内容,解决了画工不佳的问题。

a09c117b8323da49c5110302b8fbc672.jpeg

亚马逊云科技中国峰会2024上,演讲者概述了公司未来的发展方向,包括在BedRock平台上分享在线知识库,以及进行智能数据分析等。

a17801696f9f351c784a00daf79ea625.jpeg

总结

亚马逊云科技中国峰会2024上,亚马逊云科技探讨了基础模型”FoundationModel”在文本生成的热门应用场景。主要内容包括:

  1. 生成式AI在企业中的应用前景广阔,可提高客户体验、员工效率和业务流程优化。常见应用场景包括智能客服、文档总结、创意大纲生成等。
  2. 选择合适的基础模型对业务至关重要,需考虑模型大小、语言支持、上下文长度、定制能力等因素。亚马逊云科技提供多种基础模型选择,并支持模型微调。
  3. 提示词(Prompt)设计是关键,需遵循不同模型的最佳实践,形成标准化模板,并持续优化和迭代。亚马逊云科技提供工具简化提示词管理。
  4. 安全合规是重中之重,亚马逊云科技提供多层数据保护、加密、审计和内容过滤机制,确保企业数据和输出内容的安全。
  5. 游戏公司海艺互娱分享了生成式AI在游戏行业的应用,如角色设计、场景创作等,大幅提高效率。他们自研了基础模型并与亚马逊云科技合作,提升语义理解和图像质量。

2024年5月29日,亚马逊云科技中国峰会在上海召开。峰会期间,亚马逊全球副总裁、亚马逊云科技大中华区总裁储瑞松全面阐述了亚马逊云科技如何利用在算力、模型、以及应用层面丰富的产品和服务,成为企业构建和应用生成式 AI 的首选。此外,活动还详细介绍了亚马逊云科技秉承客户至尚的原则,通过与本地合作伙伴一起支持行业客户数字化转型和创新,提供安全、稳定、可信赖的服务,以及持续深耕本地、链接全球,助力客户在中国和全球化发展的道路上取得成功。

  • 23
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值