直播预告 | Evaluation in the New AIGC Era

本文介绍了滑铁卢大学的陈文虎教授关于在大模型时代如何全面评估生成式AI的报告,包括TIGERScore和VIEScore等可解释指标的提出,以及GenAIArena的创建,鼓励社区共同参与模型的评判和基准设定。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

点击蓝字

d65cc1f9b3004ee415e3dda59521982b.jpeg

关注我们

AI TIME欢迎每一位AI爱好者的加入!

fefda17b15a28002a4d54067295473ab.jpeg

哔哩哔哩直播通道

扫码关注AITIME哔哩哔哩官方账号预约直播

北京时间 2月26日 10:30-12:00

a8259ba4a93181f71b8770271227db2b.jpeg

476e1ced0f09d064e93e78e8dfa413ab.png

讲者

2269f2cb4ad6a88043b45d7b76b912d1.png

陈文虎,滑铁卢大学助理教授,加拿大 CIFAR AI Chair,任职向量学院,同时也在 Google Deepmind 兼职高级研究员。陈文虎的科研兴趣主要集中在自然语言处理,深度学习,大模型,多模态。他感兴趣如何用大语言模型解决复杂的问题,包含逻辑推理问题和数学问题。他曾经获得过 AACL Area Chair Award,WACV Best Paper Honorable Mention,以及博士杰出论文奖。

7131c83ef7f9992d2e5528dbc0da79d2.png

报告题目

6b5215e8a7c5aa7811f0a442936e34cc.png

Evaluation in the New AIGC Era

98fe6238f206a87f68271092473a7aef.png

报告简介

f26a0817fc3448a3fdcf0da77835c096.png

随着现在大模型的推进,生成式AI成为了现在的主流,比如文本生成,图片生成,视频生成。现在的大模型不断迭代,不断更新,一个难题就是如何去衡量这些模型的好坏来更加全面,更加系统地了解这些大模型的进步和发展。其所在的实验室在文本生成上推出了 TIGERScore 作为一种可解释的生成式指标。实验室在图片生成上推出了 VIEScore 作为一种可解释的生成式指标。最近,他们提出了 GenAI Arena 来让整个 Community 的人来帮助参与评判来帮助 Benchmark 模型的排名。这些新推出的指标将不断地进化来帮助大模型的下一步发展。

添加“AI TIME小助手(微信号:AITIME_HY)”,回复“大模型”,将拉您进“AI TIME 交流群”!

AI TIME微信小助手

ab78d2cfa113622b06937d49622ad129.jpeg

往期精彩文章推荐

eee5615d10500e0213215d48672ae5fc.jpeg

记得关注我们呀!每天都有新知识!

 关于AI TIME 

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了1700多位海内外讲者,举办了逾600场活动,超700万人次观看

02fa6b249afa12cea68205188b9c85cc.png

我知道你

在看

~

5327d2b7e7052b239e475fdc0dab8d48.gif

点击 阅读原文 预约直播!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值