直播预告 | 香港中文大学王文轩博士:可信大模型的测试与评估

outside_default.png

86600cd682c5e878894948de068c6530.png

 AI安全说 第11期 

嘉宾在线解读✔️

在线实时Q&A✔️

 直播主题 

可信大模型的测试与评估:

正确性,无毒性和公平性

 直播嘉宾 

王文轩

香港中文大学计算机系博士

 直播时间 

2024年12月21日(周六)

20:00-21:00

 观看方式 

PaperWeekly视频号

PaperWeekly B站直播间

一键预约直播

5439a0bb39c47e62074cddd1c30cab31.png

 报告介绍 

01

可信大模型的测试与评估

以 ChatGPT 为首的大模型迅速渗透到了人们的学习,工作和生活中。其表现出强大的通用人工智能能力让它们获得“人类历史上用户增长最快的软“1980年以来最大的技术革命”“第四次工业革命的件”开始”等诸多称号。可以说大语言模型将会成为下一代人工智能的重要基座模型,以及下一代智能软件的智能核心。

然而,大模型的输出并不是完全可靠的,经常会输出带有事实型错误,偏见,毒性的内容。考虑到其巨大的用户数量和广阔的应用场景,这种不可靠的回复将会产生诸多严重负面影响,尤其是将其应用到医疗,金融,法律和智能代码等领域。

本次报告介绍了作者最近两年对大模型可靠性和安全性方向的探索工作,分别从自动化软件测试和自然语言处理两个角度,研究了大语言模型的错误,毒性和偏见内容的检测和修复。

ec04448c7d0b6fe00fc7eb9c084e2426.png 嘉宾介绍 

76bc931ac1052d2aec4923e44bb338f3.jpeg

王文轩

香港中文大学计算机系博士

王文轩,于2024年11月在香港中文大学计算机系取得博士学位,导师为吕荣聪教授。研究方向为人工智能大模型可靠性和安全性,研究课题包含大模型的错误,毒性和偏见的检测和修复方法。近五年发表顶会论文二十余篇。发表论文获ACM Distinguished Paper Award,谷歌学术引用一千九百余次。

b267d82ab7fc713fabcac86f9fb58c88.png

ccb977de79357ba34a9fd9507b52b01d.jpeg

技术交流群

扫码备注「LLM安全」

立刻加入技术交流群

一键预约直播

🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

·

13a86b7b07c9ff4e76dfa09d12b8debd.jpeg

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值