亚马逊云科技Amazon Bedrock Guardrails保护生成式AI应用安全

最新推荐文章于 2024-09-13 23:46:33 发布

taibaili2023

最新推荐文章于 2024-09-13 23:46:33 发布

阅读量630

点赞数 5

文章标签： aws

本文链接：https://blog.csdn.net/weixin_46812959/article/details/142236357

版权

关键字: [Amazon Bedrock]

本文字数: 400, 阅读完需: 2 分钟

导读

在这段视频中,Raj Botek探讨了Amazon Bedrock的护栏功能如何能够根据应用程序需求和负责任的AI政策实施定制的防护措施。他阐释道,护栏允许配置内容过滤器,以阻挡有害或有毒的内容;拒绝主题,以防止特定的交互;敏感信息过滤器,以掩盖个人身份信息或自定义的敏感数据;词语过滤器,以阻止脏话或自定义词语;以及相关性和准确性检查,以确保模型响应是相关和真实的。该演示重点阐述了Amazon Bedrock的护栏如何能够实现负责任的AI实践、保护敏感信息,并生成相关和真实的响应。

演讲精华

内容过滤器,用于过滤有害和有毒内容,可配置阈值来过滤不同程度的有害内容,适用于提示和模型响应。
拒绝主题,充当生成式人工智能应用程序的拒绝机制,可定义主题名称、主题定义和示例短语,阻止与该主题相关的交互。
敏感信息过滤器,用于阻止个人身份信息(PII)和自定义敏感信息场景泄露,支持多种PII类型,可定义正则表达式模式。
词语过滤器,允许配置需要检测或阻止的自定义词语,并定义和阻止不当语言使用。
上下文理解和相关性检查,允许定义阈值,验证模型响应是否基于参考源进行理解,并确保模型响应与用户查询相关。

接下来是Guardrails产品演示,演示了如何为一家虚构的眼科诊所创建Guardrail,包括配置内容过滤器、拒绝主题、词语过滤器、敏感信息过滤器以及上下文理解和相关性检查。演示展示了Guardrails如何在提示和模型响应级别进行干预,阻止不当内容、不相关主题、敏感信息泄露,并确保响应基于实事求是的信息且与用户查询相关。

感谢各位观看,亚马逊期待大家体验 Amazon Bedrock 的 Guardrails。

简要概括:本视频介绍了Amazon Bedrock 的 Guardrails 功能,它允许用户为生成式人工智能应用程序定义自定义的保护措施和负责任的人工智能政策。Guardrails 可以过滤有害内容、阻止特定主题、掩盖敏感信息、过滤无关响应,并确保响应基于事实和相关性。视频还演示了如何配置和使用 Guardrails 来满足特定组织的需求。

总结

生成式人工智能(Generative AI)的强大功能伴随着风险,例如生成不当内容、参与有害互动或泄露敏感信息。为了减轻这些风险,Amazon Bedrock的GUARDRAILS功能允许组织根据其特定需求和负责任的人工智能政策定义自定义防护措施。这些防护措施包括内容过滤器、禁止主题、敏感信息过滤器、词语过滤器以及上下文理解和相关性检查。

GUARDRAILS功能会扫描用户输入和模型响应,在必要时介入以阻止或掩盖有害、无关或事实错误的内容。它确保互动保持在期望的范围内,保护用户并维护组织价值观。通过GUARDRAILS,组织可以自信地部署生成式人工智能应用程序,同时对其负责任和道德的人工智能实践保持控制。

通过全面的演示,该演讲展示了GUARDRAILS实际运作的能力,演示了它如何有效过滤医疗建议、掩盖敏感信息,并确保响应植根于事实来源并与用户查询相关。GUARDRAILS使组织能够发挥生成式人工智能的潜力,同时坚持负责任和道德的人工智能实践承诺。

亚马逊云科技（Amazon Web Services）是全球云计算的开创者和引领者。提供200多类广泛而深入的云服务，服务全球245个国家和地区的数百万客户。亚马逊云科技致力于成为企业构建和应用生成式AI的首选，通过生成式AI技术栈，提供用于模型训练和推理的基础设施服务、构建生成式AI应用的大模型等工具、以及开箱即用的生成式AI应用。深耕本地、链接全球 -- 在中国，亚马逊云科技通过安全、稳定、可信赖的云服务，助力中国企业加速数字化转型和创新，并深度参与全球化市场。