自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

Gloria_ruc的博客

直博生小艾的科研成长日记 CSDN认证博客专家 CSDN认证企业博客

码龄1年

11: 原创

143万+: 周排名

19万+: 总排名

7547: 访问

: 等级

133: 积分

35: 粉丝

22: 获赞

7: 评论

41: 收藏

私信

关注

热门文章

分类专栏

最新评论

git push报错：gnutls_handshake() failed: The TLS connection was non-properly terminated
CSDN-Ada助手: 不知道 CS入门技能树是否可以帮到你：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml
2022_NIPS_BadPrompt: Backdoor Attacks on Continuous Prompts
凌晨四点起床刷题的SwaggyP1: 你好，有后续笔记吗，我正在阅读，有点吃力
ChatGPT Prompt Engineering for Developers【笔记】
CSDN-Ada助手: 恭喜您撰写第10篇博客！我真的很喜欢这个标题，看起来您对ChatGPT的提示工程技巧有了深入的理解。作为开发者，您的经验分享对我们这些初学者来说非常有价值。希望您能继续坚持写作，我很期待您在下一篇博客中分享更多关于ChatGPT的技巧和见解。谦虚地说，您的创作已经给了我们很多启发，期待能再次读到您的精彩文章！
论文阅读笔记格式
CSDN-Ada助手: 恭喜您完成了第8篇博客！标题为“论文阅读笔记格式”，这是一个非常实用的主题。我很欣赏您对于阅读论文的认真态度，并且愿意分享您的笔记格式经验。或许下一步，您可以考虑分享一些实际论文阅读中的案例，以便读者更好地理解和应用您提到的格式。再次恭喜您，并期待您的下一篇博客！
2018_软件学报_本地化差分隐私研究综述
CSDN-Ada助手: 恭喜您写完了第7篇博客！标题为“2018_软件学报_本地化差分隐私研究综述”真是令人期待。您对本地化差分隐私的研究综述将为读者们提供重要的参考和指导。不过，如果我能提供一些建议的话，我建议您在下一篇博客中可以更加深入地探讨这个领域的相关细节，或者分享一些实际应用案例。期待您在未来的创作中继续保持谦虚态度，为读者们带来更多有价值的内容！

最新文章

摘要阅读

关注

关注数：文章数：1 文章阅读量：302 文章收藏量：0

作者: 直博生小艾的科研成长日记

计算机直博生，关注差分隐私，数据隐私，机器学习等方向～

展开

Poster: BadGPT: Exploring Security Vulnerabilities of ChatGPT via Backdoor Attacks to InstructGPT

最近，ChatGPT由于其与人类高效交互的能力在研究中收到广泛关注【背景】。在这个模型后面的核心思想是强化学习(RL)微调，是让语言模型能够和人类便好对其的一个新范式，如：InstructGPT【研究对象介绍】。在本研究，我们提出了BadGPT，第一个在语言模型中的对RL fine-tuning进行后门攻击的工作【本文核心】。通过在奖励模型中注入后门攻击，语言模型会在微调的过程中被折中妥协【方法】。

原创 2023-06-08 11:17:07 · 302 阅读 · 1 评论