直播预告 | 香港中文大学王文轩博士：可信大模型的测试与评估

PaperWeekly

于 2024-12-18 13:32:11 发布

阅读量106

点赞数

原文链接：https://mp.weixin.qq.com/s?__biz=MzIwMTc4ODE0Mw==&mid=2247697082&idx=4&sn=79f10a27389e9e5673b39a1107d97234&chksm=97a2c820aa7f8290e360574d079b039d9c069ff9ede7f906e411f178644f9acf3b105f9c3fb6&scene=126&sessionid=0

版权

AI安全说第11期

嘉宾在线解读✔️

在线实时Q&A✔️

直播主题

可信大模型的测试与评估：

正确性，无毒性和公平性

直播嘉宾

王文轩

香港中文大学计算机系博士

直播时间

2024年12月21日（周六）

20:00-21:00

观看方式

PaperWeekly视频号

PaperWeekly B站直播间

一键预约直播

▼

报告介绍

01

可信大模型的测试与评估

以 ChatGPT 为首的大模型迅速渗透到了人们的学习，工作和生活中。其表现出强大的通用人工智能能力让它们获得“人类历史上用户增长最快的软“1980年以来最大的技术革命”“第四次工业革命的件”开始”等诸多称号。可以说大语言模型将会成为下一代人工智能的重要基座模型，以及下一代智能软件的智能核心。

然而，大模型的输出并不是完全可靠的，经常会输出带有事实型错误，偏见，毒性的内容。考虑到其巨大的用户数量和广阔的应用场景，这种不可靠的回复将会产生诸多严重负面影响，尤其是将其应用到医疗，金融，法律和智能代码等领域。

本次报告介绍了作者最近两年对大模型可靠性和安全性方向的探索工作，分别从自动化软件测试和自然语言处理两个角度，研究了大语言模型的错误，毒性和偏见内容的检测和修复。

嘉宾介绍

王文轩

香港中文大学计算机系博士

王文轩，于2024年11月在香港中文大学计算机系取得博士学位，导师为吕荣聪教授。研究方向为人工智能大模型可靠性和安全性，研究课题包含大模型的错误，毒性和偏见的检测和修复方法。近五年发表顶会论文二十余篇。发表论文获ACM Distinguished Paper Award，谷歌学术引用一千九百余次。

技术交流群

扫码备注「LLM安全」

立刻加入技术交流群

一键预约直播

▼

🔍

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

·

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。