每日一看大模型新闻（2023.11.21）用深度催眠诱导LLM「越狱」，香港浸会大学初探可信大语言模型；77%开发者使用ChatGPT辅助开发；gpt crawler:从URL爬取网站生成结构化知识

超爱玩大模型

已于 2024-01-12 17:00:29 修改

阅读量2.8w

点赞数 35

文章标签：语言模型人工智能自然语言处理 prompt 数据分析 chatgpt embedding

于 2024-01-12 16:53:13 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liuxiuxiu3/article/details/135557217

版权

1.产品发布

1.1 Kyligence 升级其 AI 产品

发布日期：2023.11.21

革新突破！智能指标平台引领时代，国产大模型与企业级部署的完美结合

主要内容：11月21日，跬智信息（Kyligence）圆满召开了线上数智论坛暨产品发布会，升级智能一站式指标平台 Kyligence Zen 及 AI 数智助理 Kyligence Copilot 的一系列企业级能力，包括正式支持智谱 AI、百川智能等在内的多款国产大模型、支持企业级私有部署等多种部署方式，以及指标全生命周期管理、数据权限管控、智能缓存等多项能力，帮助企业构建安全、可靠的企业级指标平台，以“大数据+大模型双剑合璧”助力企业加速实现数据驱动的决策智能。

体验网站：

2.技术更新

2.1用深度催眠诱导LLM「越狱」，香港浸会大学初探可信大语言模型

发布日期：2023.11.21

用深度催眠诱导LLM「越狱」，香港浸会大学初探可信大语言模型

主要内容：尽管大语言模型 LLM (Large Language Model) 在各种应用中取得了巨大成功，但它也容易受到一些 Prompt 的诱导，从而越过模型内置的安全防护提供一些危险 / 违法内容，即 Jailbreak。深入理解这类 Jailbreak 的原理，加强相关研究，可反向促进人们对大模型安全性防护的重视，完善大模型的防御机制。不同于以往采用搜索优化或计算成本较高的推断方法来生成可 Jailbreak 的 Prompt，本文受米尔格拉姆实验（Milgram experiment）启发，从心理学视角提出了一种轻量级 Jailbreak 方法：DeepInception，通过深度催眠 LLM 使其成为越狱者，并令其自行规避内置的安全防护。

论文链接：https:/

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。