直播预告 | Evaluation in the New AIGC Era

AITIME论道

于 2024-02-21 18:30:14 发布

阅读量866

点赞数

文章标签： AIGC

原文链接：https://mp.weixin.qq.com/s?__biz=MzIzOTAxOTk3Nw==&mid=2247522166&idx=1&sn=e1fea649669af2e81aa3a84b61af3e44&chksm=e8b64e1f18b7c3f9bce137de2e0b25d1486771e50178b41a7b7b0990920b37930cb858510204&scene=126&sessionid=0

版权

本文介绍了滑铁卢大学的陈文虎教授关于在大模型时代如何全面评估生成式AI的报告，包括TIGERScore和VIEScore等可解释指标的提出，以及GenAIArena的创建，鼓励社区共同参与模型的评判和基准设定。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入！

哔哩哔哩直播通道

扫码关注AITIME哔哩哔哩官方账号预约直播

北京时间 2月26日 10:30-12:00

讲者

陈文虎，滑铁卢大学助理教授，加拿大 CIFAR AI Chair，任职向量学院，同时也在 Google Deepmind 兼职高级研究员。陈文虎的科研兴趣主要集中在自然语言处理，深度学习，大模型，多模态。他感兴趣如何用大语言模型解决复杂的问题，包含逻辑推理问题和数学问题。他曾经获得过 AACL Area Chair Award，WACV Best Paper Honorable Mention，以及博士杰出论文奖。

报告题目

Evaluation in the New AIGC Era

报告简介

随着现在大模型的推进，生成式AI成为了现在的主流，比如文本生成，图片生成，视频生成。现在的大模型不断迭代，不断更新，一个难题就是如何去衡量这些模型的好坏来更加全面，更加系统地了解这些大模型的进步和发展。其所在的实验室在文本生成上推出了 TIGERScore 作为一种可解释的生成式指标。实验室在图片生成上推出了 VIEScore 作为一种可解释的生成式指标。最近，他们提出了 GenAI Arena 来让整个 Community 的人来帮助参与评判来帮助 Benchmark 模型的排名。这些新推出的指标将不断地进化来帮助大模型的下一步发展。

添加“AI TIME小助手（微信号：AITIME_HY）”，回复“大模型”，将拉您进“AI TIME 交流群”！

AI TIME微信小助手