明日 19:00 大模型的视觉语言规划、量化与开源

点击蓝字

800097cd6370388323269ee68fb5dc47.jpeg

关注我们

AI TIME欢迎每一位AI爱好者的加入!

本次直播有哪些报告?

本期活动的专属体智能体,与它对话get更多干货信息吧!

bf950ca78bd7a42e6ce0e1b292b91607.jpeg

哔哩哔哩直播通道

扫码关注

AITIME哔哩哔哩官方账号

预约直播

3月20日 19:00-19:20

4d69001812a7eba779ac5300710bbda3.jpeg

81a9123912aca99f8e0ab0ca170a3746.png

讲者简介

9232b943248218f7fa7abcb39ba017d0.png

岑俊,香港科技大学博士四年级学生,导师为陈启峰教授。曾在MSRA,上海AI Lab,阿里达摩院实习。研究兴趣为多模态大模型,机器人。

75c937702846ad305409890ec558a63c.png

报告题目

6815f8a0c1246385d5b6e8fc8615b6ef.png

Using Left and Right Brains Together: Towards Vision and Language Planning

dd58f993c6127adb7b6b8c3d83a4e19a.png

报告简介

c31fbb87c89d3a3b5de658f236af4ab8.png

大型语言模型(LLMs)和多模态大模型(LMMs)在各种任务上展现出了惊人的决策能力。然而,它们本质上在语言空间内进行规划,缺乏视觉和空间想象能力。相比之下,人类在思考过程中利用大脑的左右半球进行语言和视觉规划。因此,在这项工作中,我们引入了一种新颖的视觉-语言规划框架,以对任何形式的输入任务执行并行的视觉和语言规划。我们的框架结合了视觉规划以捕捉复杂的环境细节,同时语言规划增强了整体系统的逻辑连贯性。

3月20日 19:20-19:40

4f97fed16ded8f738ee4ae8f2a6311f0.jpeg

f7ed52f20cb86b9bc1ceb406ea2512be.png

讲者简介

fac4030cf11af4badcd114de919124f5.png

李师尧,清华大学电子系博士四年级学生,导师为汪玉教授。研究兴趣为模型压缩、软硬件系统设计。

143096faa977136d7edd9ec58e7d54d3.png

报告题目

6d766b373a3cf59784dd7ab822896b1e.png

Evaluating Quantized Large Language Models

68679abec70f12e93779cecf8f78c034.png

报告简介

b7d7f7faa8a94ac096bff3a9cdde7ba9.png

量化是减少大语言模型的存储和计算开销的一种常用技术。为了满足不同场景下的高效性和性能要求,对量化大语言模型进行全面评估对于指导量化方法的选择至关重要。这项工作评估了量化对11个模型族(包括OPT、LLaMA2、Falcon、Bloomz、Mistral、ChatGLM、Vicuna、LongChat、StableLM、Gemma和Mamba,参数范围从125M到180B)的Weight、Activation和KV Cache的影响。评估涵盖了五种类型的任务:基本自然语言处理、涌现能力、可信度、对话任务以及长文本任务。此外,本工作还评估了最新的量化方法以展示其适用范围。本工作系统性地总结了量化带来的影响,提出了量化技术的使用建议,并指出了未来的研究方向。

3月20日 19:40-20:00

2e2988ea4918587d7a11dac13c171344.jpeg

11e977278d9aead88199920e62fbe3e7.png

讲者简介

08a90dd8bf8f733d3a87be1b3aba4afa.png

李好洋,中国人民大学博士三年级学生,导师为李翠平教授与张静教授。

dfbccb0a6d81610b0205fca89e96b1f7.png

报告题目

7637116f8664460baef0d0e3ecabced3.png

CodeS: Towards Building Open-source Language Models for Text-to-SQL

2ca5faa46aa2505f531506fa78040d0b.png

报告简介

a46b8788e9a316f815cf50c2705a1988.png

近年来,语言模型(Language Model)在text-to-SQL任务上展现出了令人印象深刻的性能。然而,该领域大多数SOTA方法依赖于强大但闭源的大型语言模型,如GPT-3.5和GPT-4,这可能带来模型架构不清晰、数据隐私风险和昂贵的推理开销等限制。为了解决这些限制,我们提出了CodeS,一系列专为text-to-SQL任务预训练的、参数量从1B到15B不等的语言模型。CodeS是一个完全开源的语言模型,它以更小的参数规模实现了更高的准确率。此外,我们提出了一种新的prompt构造策略以实现更精准的模式链接,并提出了一种新型的双向数据增强技术,以便快速适应不同领域。我们在多个数据集上进行了全面评估,包括但不限于广泛使用的Spider基准,新发布的BIRD基准等。实验结果显示,我们的CodeS在几乎所有具有挑战性的text-to-SQL基准测试上都达到了新的SOTA准确率和鲁棒性。

3月20日 20:00-20:45

4efaf96087fc2b080a903693839b7aff.jpeg

6b6b7692b9b320eb5b875119d7fa219f.png

Panel 主持人

fe8ddc5946afb77d8215f1a387552c53.png

姚云志,浙江大学博士三年级学生,导师为陈华钧和张宁豫教授。研究兴趣为语言模型知识增强研究兴趣为语言模型知识增强与知识编辑。

454547807f7a476c963bbcc0bc7903d8.png

Panel 主题

3482a4154d5667f5759dc845dbf47eff.png

智能体视角下的语言模型:泛化与幻觉的辨析,知识表达与应用的探讨

添加“AI TIME小助手(微信号:AITIME_HY)”,回复“大模型”,将拉您进“AI TIME 大模型交流群”!

AI TIME微信小助手

f3c7129da479666bc3e7633c54a7e03b.jpeg

往期精彩文章推荐

540d31dc30ef97a855a38daabcd02560.jpeg

记得关注我们呀!每天都有新知识!

 关于AI TIME 

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了1700多位海内外讲者,举办了逾600场活动,超700万人次观看

d7681f18857a49a2a3abe60a5554e877.png

我知道你

在看

~

4b57d983e0217e8d054857942fb260b7.gif

点击 阅读原文 预约直播!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值