每日一看大模型新闻(2023.11.21)用深度催眠诱导LLM「越狱」,香港浸会大学初探可信大语言模型;77%开发者使用ChatGPT辅助开发;gpt crawler:从URL爬取网站生成结构化知识

1.产品发布

1.1 Kyligence 升级其 AI 产品

发布日期:2023.11.21

革新突破!智能指标平台引领时代,国产大模型与企业级部署的完美结合

主要内容:11月21日,跬智信息(Kyligence)圆满召开了线上数智论坛暨产品发布会,升级智能一站式指标平台 Kyligence Zen 及 AI 数智助理 Kyligence Copilot 的一系列企业级能力包括正式支持智谱 AI、百川智能等在内的多款国产大模型、支持企业级私有部署等多种部署方式,以及指标全生命周期管理、数据权限管控、智能缓存等多项能力,帮助企业构建安全、可靠的企业级指标平台,以“大数据+大模型双剑合璧”助力企业加速实现数据驱动的决策智能。

体验网站:

Kyligence Zen

2.技术更新

2.1用深度催眠诱导LLM「越狱」,香港浸会大学初探可信大语言模型

发布日期:2023.11.21

用深度催眠诱导LLM「越狱」,香港浸会大学初探可信大语言模型

主要内容:尽管大语言模型 LLM (Large Language Model) 在各种应用中取得了巨大成功,但它也容易受到一些 Prompt 的诱导,从而越过模型内置的安全防护提供一些危险 / 违法内容,即 Jailbreak。深入理解这类 Jailbreak 的原理,加强相关研究,可反向促进人们对大模型安全性防护的重视,完善大模型的防御机制。不同于以往采用搜索优化或计算成本较高的推断方法来生成可 Jailbreak 的 Prompt,本文受米尔格拉姆实验(Milgram experiment)启发,从心理学视角提出了一种轻量级 Jailbreak 方法:DeepInception,通过深度催眠 LLM 使其成为越狱者,并令其自行规避内置的安全防护。

论文链接:https:/

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值