以负责任的方式利用Amazon Bedrock的防护措施构建生成式AI应用


关键词: [Amazon Web Services生成式AI Campaign, Amazon Bedrock防护措施, 生成式AI应用程序, 负责任AI策略, 防护措施, 基础模型, 内容过滤器, 拒绝主题, 敏感信息, 词语过滤器, 有害内容, 应用要求]

本文字数: 1300, 阅读完需: 6 分钟

导读

演讲者在 亚马逊云科技 的活动中介绍了”以负责任的方式构建生成式AI应用程序,并为Amazon Bedrock设置防护措施”。在这个演讲中,演讲者讨论了如何通过Amazon Bedrock的防护措施来实现以下目标:具体解释了可以通过配置拒绝主题、内容过滤、敏感信息遮蔽和词语过滤等功能,来避免生成不当内容、有害内容、泄露隐私信息和传播有害成见。该演讲重点介绍了Amazon Bedrock如何让您能够实现内容审查、保护隐私和防止偏见等好处,从而构建符合您组织要求和负责任AI原则的生成式AI应用程序。这是亚马逊云科技公司的一次演讲。

演讲精华

以下是小编为您整理的本次演讲的精华,共1000字,阅读时间大约是5分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。

在生成式AI的领域,模型拥有生成大量跨领域信息的巨大能力,组织面临着一系列新的挑战。来自亚马逊云科技的首席解决方案架构师Rodgebottec深入探讨了这些挑战,并介绍了Amazon Bedrock的保护措施,这是一种使组织能够实施保护措施、定制应用程序要求并遵守负责任AI政策的解决方案。

Rodgebottec强调了避免组织应用程序中不希望出现或不相关主题的需求,以及防止生成有害或有毒内容的必要性,涉及六大类别:仇恨、侮辱、性内容、暴力和不当行为。为了与负责任的AI策略保持一致,组织必须保护用户的隐私和敏感数据,同时避免传播有害的偏见或陈规定型观念。

尽管Bedrock上的许多基础模型提供商已经内置了保护措施,但这些机制通常是特定于模型的。组织可能需要根据其独特的使用案例或政策进行定制。此外,在使用多个基础模型时,确保保护措施的一致性至关重要,可加快开发周期。

为解决这些挑战,Amazon Web Services引入了Amazon Bedrock的保护措施,这是一项与Bedrock上的基础模型无缝协作的功能,提供了强大的功能集,无需额外的API调用。组织可以配置阈值来根据应用程序和组织需求过滤掉有害内容,利用简单的语言定义拒绝主题并阻止不希望的交互。

保护措施还可以让组织掩盖或阻止个人身份信息(PII)和组织特定的敏感数据,以及阻止用户输入或模型输出中的亵渎词语或短语。这种全面的解决方案可确保应用程序遵守负责任的AI原则,同时保护敏感信息。

Rodgebottec解释道,保护措施是通过拦截输入和基础模型生成的输出,并根据一组预定义的策略对其进行评估来运作的。这些策略包括拒绝主题、内容过滤、编辑和词语过滤。如果触发了任何配置的策略,原始输出将被阻止,并向用户提供经过修改的、符合要求的输出,确保遵守组织的保护措施。

为了说明保护措施的强大功能,Rodgebottec介绍了一个涉及虚构的”“Doctor Tongue’s Ophthalmology Clinic”“眼科诊所的用例。在这种情况下,生成式AI应用程序旨在帮助患者预约就诊并获取有关诊所的一般信息,同时确保不提供医疗建议,也不讨论与眼科无关的具体医疗状况或治疗。

Rodgebottec逐步演示了创建保护措施的过程,配置内容过滤器以确保助手避免参与有害交互。演示中显示,除了”Prompt Attack”外,所有必需主题的过滤强度都设置为高,代表对提示和响应进行严格的标签过滤。

然后,演示定义了两个拒绝主题:提供医疗建议或诊断,以及讨论与眼科无关的医疗状况。Rodgebottec展示了如何通过为每个主题提供名称、定义和示例短语来添加这些拒绝主题,确保助手专注于预约就诊和提供一般诊所信息的预期用途。

此外,保护措施配置包括词语过滤器以阻止亵渎内容。虽然可以手动添加自定义词语或短语、从本地文件上传或从S3对象中获取,但演示重点是阻止亵渎内容,以保持专业和适当的诊所用例语气。

敏感信息过滤器配置为掩盖加拿大医疗服务号码,展示了组织如何掩盖或阻止特定类型的PII,或为组织特定的敏感数据定义自定义正则表达式模式,从而保护用户隐私和敏感信息。

Rodgebottec还强调了定义被阻止消息的能力,该消息将在触发保护措施时显示给用户。在演示中,针对被阻止的提示和被阻止的响应指定了相同的消息,当交互违反定义的策略时,可提供一致和适当的响应。

在审查完配置后,Rodgebottec创建了保护措施,并使用”prophet-cloud”模型和提示模板进行测试:“What’s wrong?”。

第一个测试提示”A patient is talking about their eyes being red and feeling really itchy. What’s wrong?“触发了保护措施,由于检测到医疗建议或诊断主题,响应在提示级别被阻止。相反,系统提供了批准的消息,防止助手参与未经授权的医疗建议。

第二个提示”A patient has been having some stomach pain, and they ask us for a local family doctor recommendation”也被保护措施阻止,因为它属于与眼科无关的医疗状况主题,确保助手专注于预期范围。

然而,对于”The patient just needs to book a follow-up appointment and give us all the required information that they have”这一提示,并未触发保护措施,因为它符合预约就诊和收集必要信息的预期用途。

有趣的是,模型响应中包含一个加拿大医疗服务号码,该号码被保护措施成功掩盖,证明了它能够在提供相关响应的同时保护敏感信息。

通过这个全面的演示,Rodgebottec强调了Amazon Bedrock保护措施在使组织能够定制生成式AI应用程序的安全性和保护方面的强大作用。通过配置拒绝主题、内容过滤器、编辑和词语过滤器,组织可以根据需要定制其应用程序,避免不希望的内容、保护敏感数据,并防止传播有害的偏见或陈规定型观念,确保遵守组织特定要求和负责任的AI原则。

在不断发展的生成式AI领域,Amazon Bedrock的保护措施成为一种关键解决方案,使组织能够发挥这些模型的巨大潜力,同时坚定地致力于负责任的AI实践,并保护敏感信息。

下面是一些演讲现场的精彩瞬间:

罗德格博特克(Rodgebottec)是亚马逊云科技的首席解决方案架构师,在这段视频中,他将讨论亚马逊Bedrock的防护措施,帮助您实施保护措施、定制应用程序要求和负责任的人工智能政策。

37d7c5adb0fae901e188ae4a707b703d.jpeg

为了应对这些风险,Bedrock 中的许多基础模型提供商都内置了保护措施,并将这些技术直接纳入基础模型中。

3251dc230861facc448bdabee73bf752.jpeg

但所有这些保护机制都是特定于模型的,很多时候我们需要根据自己的使用案例或组织政策对其进行定制。

8c32440f24d0dbe5dd54f9d4563d2c5b.jpeg

而且,如果我们使用多个基础模型,我们希望确保所有的保护措施都是一致的,这将有助于加快我们的开发周期。

49a6d4d6aec140c0ab88749f5c2e77ec.jpeg

防护栏通过拦截输入和基础模型生成的输出,并根据预先定义的策略进行评估,从而实现对生成内容的控制和过滤。

a3a4ae073cd27cad155b44ae6f9b74f1.jpeg

现在让我们深入探讨这些防护栏配置。

2f278a082de1d3f005a4221e60231be2.jpeg

第一个配置是”拒绝主题”,它充当生成式AI应用程序的拒绝列表,将阻止检测到的任何属于该主题的交互。

816669aecca5618717531061c2fc387c.jpeg

总结

在亚马逊云科技的 Bedrock Guard Rails 下导航负责任的人工智能景观

随着生成式人工智能模型获得巨大的力量,组织在确保负责任和伦理部署方面面临新的挑战。亚马逊云科技的 Bedrock Guard Rails 提供了一个坚固的解决方案,使组织能够根据应用需求和负责任的人工智能政策定制保护措施。这项创新功能赋予组织实施最先进的保护措施,以防止有害内容、敏感数据暴露,以及有偏见或刻板印象的输出。

Guard Rails 会拦截输入和模型输出,并根据组织定义的全面政策集评估它们。这些政策包括拒绝主题、内容过滤器、编辑和词语过滤器,确保对不希望的互动进行多层防御。通过配置拒绝主题,组织可以阻止特定的主题或对话,而内容过滤器则可以基于可调的严格度级别防止有毒或有害内容。编辑功能可以掩盖或阻止个人身份识别信息(PII)和其他敏感数据,词语过滤器则可以阻止亵渎语言或自定义短语。

通过一个用户友好的控制台,组织可以无缝创建和管理 Guard Rails,根据他们独特的需要进行定制。演示展示了 Guard Rails 的实际效力,有效地阻止了对于一家虚构眼科诊所的医疗建议、非眼科病状的讨论,并掩盖了敏感的健康信息。这个多功能的解决方案赋予组织在坚持其伦理原则和法规合规性的同时,构建负责任和可信赖的生成式人工智能应用。

随着生成式人工智能景观的不断发展,亚马逊云科技的 Bedrock Guard Rails 为组织提供了必要的工具,负责任地驾驭这一变革性技术,同时在推动创新的同时优先考虑安全、隐私和伦理考量。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值