
每周Talk上架
文章平均质量分 88
TechBeat人工智能社区
这个作者很懒,什么都没留下…
展开
-
Talk|新加坡国立大学赵轩磊:Pyramid Attention Broadcast - 通向视频模型的实时生成
本期为TechBeat人工智能社区第612期线上Talk!北京时间7月25日(周四)20:00,新加坡国立大学博士生—赵轩磊的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“Pyramid Attention Broadcast - 通向视频模型的实时生成”,他向大家介绍了能够实现实时视频生成的算法PAB,它可以在几乎不损失质量的前提下大幅提升效率,且无需额外训练。这一突破性进展为视频生成技术的实际应用开辟了新的可能性。原创 2024-07-26 12:00:00 · 814 阅读 · 0 评论 -
Talk|上海交通大学庞祥鹤:大模型社会模拟器MATRIX,价值对齐胜过GPT4
本期为TechBeat人工智能社区第611期线上Talk!北京时间7月24日(周三)20:00,上海交通大学博士生—庞祥鹤的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“大模型社会模拟器MATRIX,价值对齐胜过GPT4”,他向大家介绍了一种能够模拟语言模型答案的社会影响,并允许语言模型在模拟社会中自我评估并修正行为的社会模拟器MATRIX。该工作已入选ICML 2024Spotlight。原创 2024-07-25 12:00:00 · 1169 阅读 · 0 评论 -
Talk|OSU汪博石:Transformer模型能否进行隐式的推理?关于Grokking和泛化的深入探索
本期为TechBeat人工智能社区第609期线上Talk。北京时间7月17日(周三)20:00,俄亥俄州立大学博士生—汪博石的Talk已经准时在TechBeat人工智能社区开播!他与大家分享的主题是: “Transformer模型能否进行隐式的推理?关于Grokking和泛化的深入探索”,在本次Talk中,他系统性地研究Transformer是否可以获得隐式推理的能力。并通过一系列实验和对于模型内部的分析揭示了Grokking对于获得隐式推理能力的重要性,其背后的过程和原因,以及Transforme原创 2024-07-18 12:00:00 · 1145 阅读 · 0 评论 -
Talk|清华大学袁天远:PreSight - 利用NeRF先验帮助自动驾驶场景在线感知
本期为TechBeat人工智能社区第605期线上Talk。北京时间7月3日(周三)20:00,清华大学博士生—袁天远的Talk已经准时在TechBeat人工智能社区开播!他与大家分享的主题是:“PreSight - 利用NeRF先验帮助自动驾驶场景在线感知”,他向大家介绍了新的感知框架PreSight,其通过构建城市级NeRF有效地从历史观测数据中提取先验知识,以帮助下游感知任务。该工作已入选ECCV 2024。原创 2024-07-14 16:00:00 · 1203 阅读 · 0 评论 -
Talk|北京大学PKU-DAIR余昭辰:从多模态理解到生成 - 从LLM到Diffusion Model
本期为TechBeat人工智能社区第603期线上Talk。北京时间6月26日(周三)20:00,北京大学PKU-DAIR实习生—余昭辰的Talk已经准时在TechBeat人工智能社区开播!他与大家分享的主题是: “从多模态理解到生成 - 从LLM到Diffusion Model”,在本次Talk中,他向大家介绍了PKU-DAIR课题组在大语言模型和扩散模型两个领域上的最新研究成果,并提出将LLM和Diffusion Model进行结合的新思路。原创 2024-06-27 12:00:00 · 1178 阅读 · 0 评论 -
Talk|CityU 助理教授马佳葳: CVPR 2024, 基于多模态理解的混合数据专家模型
本期为TechBeat人工智能社区第604期线上Talk。北京时间6月27日(周四)20:00,香港城市大学助理教授—马佳葳的Talk已经准时在TechBeat人工智能社区开播!他与大家分享的主题是:“基于多模态理解的混合数据专家模型”,他向大家介绍了混合数据专家模型MoDE,在理解数据的基础上,通过分治法来指导多个小模型的训练,提升下游任务表现并降低训练成本。该工作已入选CVPR 2024 Oral & ICLR 2024 Spotlight。原创 2024-06-28 12:00:00 · 1102 阅读 · 0 评论 -
Talk|北京大学张嘉曌:NaVid - 视觉语言导航大模型
本期为TechBeat人工智能社区第602期线上Talk。北京时间6月20日(周四)20:00,北京大学博士生—张嘉曌的Talk已经准时在TechBeat人工智能社区开播!原创 2024-06-21 12:00:00 · 1831 阅读 · 0 评论 -
Talk|香港科技大学冯宸:高效自主的大尺度场景空中覆盖与重建
本期为TechBeat人工智能社区第601期线上Talk。北京时间6月19日(周三)20:00,香港科技大学冯宸博士生—冯宸的Talk已经准时在TechBeat人工智能社区开播!他与大家分享的主题是: “高效自主的大尺度场景空中覆盖与重建”,他围绕团队在利用无人机进行大尺度场景下的快速自主覆盖与重建方面取得的进展和思考展开。该工作已入选ICRA 2024 Finalist for Best Paper Award on UAV。原创 2024-06-20 12:00:00 · 1832 阅读 · 0 评论 -
Talk|新加坡国立大学贾鑫宇:适用于高自由度机器人的运动控制器
本期为TechBeat人工智能社区第600期线上Talk。北京时间6月13日(周四)20:00,新加坡国立大学博士生—贾鑫宇的Talk已经准时在TechBeat人工智能社区开播!他与大家分享的主题是: “适用于高自由度机器人的运动控制器”,向大家系统地介绍了如何通过三维表征的设计来帮助三维网格的重建与生成。原创 2024-06-14 12:00:00 · 966 阅读 · 0 评论 -
Talk|CVPR‘24 Oral:超越3D - Point Transformer V3中的多模态特征提取新构想
在本次Talk中,我们将超越3D感知与表征的范畴,从多模态数据特征提取的角度介绍我们被接收为CVPR 2024 Oral的工作Point Transformer V3 (PTv3) 的思想与设计。点云作为3D表征与感知的基础模态,其本身也是高维度稀疏非结构化数据的代表。将图像的每一个像素视为点,图像本身也可被视为点云,这佐证了这类数据结构的普适性。本次Talk将通过PTv3的两个核心思想——骨干网络设计的规模准则与非结构化数据的序列化技术,探究3D点云骨干网络作为一种多模态泛用特征提取器的构想与挑战。原创 2024-06-13 12:01:43 · 1146 阅读 · 0 评论 -
Talk|Mila研究所&蒙特利尔大学刘圳:三维表征和三维网格的重建与生成
本期为TechBeat人工智能社区第580期线上Talk。北京时间3月21日(周四)20:00,Mila研究所&蒙特利尔大学博士生—刘圳的Talk已经准时在TechBeat人工智能社区开播!他与大家分享的主题是:“三维表征和三维网格的重建与生成”,向大家系统地介绍了如何通过三维表征的设计来帮助三维网格的重建与生成。原创 2024-03-22 12:00:00 · 756 阅读 · 0 评论 -
Talk|卡内基梅隆大学李博文:适用于机器人的可泛化的目标感知
本期为TechBeat人工智能社区第579期线上Talk。北京时间3月20日(周三)20:00,卡内基梅隆大学博士生—李博文的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“适用于机器人的可泛化的目标感知”,向大家系统地介绍了如何在有限的数据上学习到可泛化的,适用于机器人的目标感知模型。原创 2024-03-21 11:55:25 · 881 阅读 · 0 评论 -
Talk|加州大学洛杉矶分校鲁盼:基于大型语言模型的多模态数学推理
本期为TechBeat人工智能社区第579期线上Talk。北京时间3月14日(周四)20:00,加州大学洛杉矶分校博士生—鲁盼的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“基于大型语言模型的多模态数学推理”,向大家系统地介绍了多模态的数学推理的进展和挑战。原创 2024-03-15 12:00:00 · 1019 阅读 · 0 评论 -
Talk|麻省理工学院李晨昊:发展式腿足智能-从模仿到生成
本期为TechBeat人工智能社区第578期线上Talk。北京时间3月13日(周三)20:00,麻省理工学院博士生—李晨昊的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“发展式腿足智能-从模仿到生成”,向大家系统地介绍了专家示范(expert demonstrations)在机器人学中的作用,以及从受限演示中学习的三种创新方法,并展示它们在腿部机器人学中的成功应用。原创 2024-03-14 12:00:00 · 758 阅读 · 0 评论 -
Talk|上海交通大学&上海AI Lab:复杂图表推理多模态评测基准与基座模型
本期为TechBeat人工智能社区第577期线上Talk。北京时间3月7日(周四)20:00,上海交通大学博士生—夏纫秋以及上海人工智能实验室科研助理—叶涵诚的Talk已准时在TechBeat人工智能社区开播!他们与大家分享的主题是:“复杂图表推理多模态评测基准与基座模型”,向大家介绍了其团队在复杂图表推理方面所做的研究。原创 2024-03-08 13:15:43 · 693 阅读 · 0 评论 -
Talk|加州大学圣地亚哥分校程旭欣:视觉反馈下足式机器人的全身操作与运动
程旭欣是UCSD的一年级博士生,导师是Xiaolong Wang,他的主要研究兴趣是足式机器人的全身控制。在 CMU 读机器人硕士期间,他的主要研究方向是利用强化学习实现四足机器人的全身控制,操作和运动, Deep Whole-Body Control 曾入围 CoRL 最佳系统论文, 导师为 Deepak Pathak。附加的机械臂完成自动抓取,视觉反馈下的极限运动能力都是很有价值的探索方向。期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!原创 2024-03-07 12:31:41 · 1122 阅读 · 0 评论 -
Talk|卡内基梅隆大学熊浩宇:Open-world Mobile Manipulation-开放世界机器人学习系统
本期为TechBeat人工智能社区第575期线上Talk。北京时间2月29日(周四)20:00,卡内基梅隆大学研究生—熊浩宇的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“Open-world Mobile Manipulation-开放世界机器人学习系统”,将向大家介绍了开放世界机器人系统硬件,数据收集到模型部署的全栈方法等相关研究。原创 2024-03-01 12:00:00 · 410 阅读 · 0 评论 -
Talk|上海交通大学晋嘉睿:序列建模技术在推荐系统中的应用
本期为TechBeat人工智能社区第574期线上Talk。北京时间2月28日(周三)20:00,上海交通大学博士生—晋嘉睿的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“序列建模技术在推荐系统中的应用”,系统地介绍了他们在序列数据的建模等相关工作所做的研究。原创 2024-02-29 13:58:47 · 995 阅读 · 0 评论 -
Talk|北京理工大学陈焕然:损失函数景观与泛化性的关系
本期为TechBeat人工智能社区第573期线上Talk。北京时间2月22日(周四)20:00,北京理工大学本科生—陈焕然的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“损失函数景观与泛化性的关系”,系统地介绍了他们在发现loss landscape closeness也和泛化性强相关等相关工作所做的研究。原创 2024-02-23 11:47:47 · 1100 阅读 · 0 评论 -
Talk|北京大学杨灵:扩散模型的算法创新与领域应用
本期为TechBeat人工智能社区第572期线上Talk。北京时间2月21日(周三)20:00,北京大学博士生—杨灵的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“扩散模型的算法创新与领域应用”,系统地介绍了他的团队基于扩散模型的算法创新与领域应用等相关工作所做的研究。原创 2024-02-22 12:03:07 · 798 阅读 · 0 评论 -
Talk|香港科技大学苟耘豪:MoCLE - 指令聚类MoE+通用专家解决多模态大模型任务冲突
本期为TechBeat人工智能社区第571期线上Talk。北京时间2月8日(周四)20:00,香港科技大学博士生—苟耘豪的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“MoCLE - 指令聚类MoE+通用专家解决多模态大模型任务冲突”,系统地介绍了他的团队基于指令聚类和通用专家的MoE多模态大模型微调方法等相关工作所做的研究。原创 2024-02-09 12:00:00 · 1023 阅读 · 0 评论 -
Talk|香港中文大学(深圳)张雪遥:音频生成开源工具包Amphion的歌声转换指南
本期为TechBeat人工智能社区第570期线上Talk。北京时间2月7日(周三)20:00,香港中文大学(深圳)博士生—张雪遥的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“音频生成开源工具包Amphion的歌声转换指南”,系统地介绍他的团队提出的针对歌声转换的音频生成开源工具包Amphion,包括该任务的定义、研究发展脉络、最前沿的技术框架范式,以及Amphion对该任务的集成思路与架构设计等相关工作所做的研究。原创 2024-02-08 12:00:00 · 899 阅读 · 0 评论 -
Talk|香港科技大学刘智立:Geom-Erasing - 图像生成模型中的隐式概念删除
本期为TechBeat人工智能社区第569期线上Talk。北京时间2月1日(周四)20:00,香港科技大学博士生—刘智立的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“Geom-Erasing - 图像生成模型中的隐式概念删除”,系统地介绍了他的团队提出的基于几何位置信息的概念去除算法Geom-Erasing,以及Geom-Erasing如何有效地抑制隐含概念的产生等相关工作所做的研究。原创 2024-02-02 12:00:00 · 933 阅读 · 0 评论 -
Talk|中国科学院信息工程研究所王子泰:面向长尾学习的局部泛化分析技术
本期为TechBeat人工智能社区第568期线上Talk。北京时间1月31日(周三)20:00,中国科学院信息工程研究所博士生—王子泰的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“面向长尾学习的局部泛化分析技术”,系统地介绍了他的团队在长尾学习泛化分析等相关工作所做的研究。原创 2024-02-01 12:00:00 · 352 阅读 · 0 评论 -
Talk|北京理工大学陈焕然:扩散模型即为鲁棒分类器
本期为TechBeat人工智能社区第566期线上Talk。北京时间1月24日(周三)20:00,北京理工大学本科生—陈焕然的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“扩散模型即为鲁棒分类器”,系统地介绍了他们在使用现成的diffusion model进行鲁棒分类等相关工作所做的研究。原创 2024-01-26 11:36:54 · 838 阅读 · 0 评论 -
Talk|香港中文大学高瑞元:MagicDrive - 基于3D几何控制的自动驾驶街景数据生成
本期为TechBeat人工智能社区第565期线上Talk。北京时间1月18日(周四)20:00,香港中文大学博士生—高瑞元的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“MagicDrive - 基于3D几何控制的自动驾驶街景数据生成”,介绍了他的团队在新型街景生成框架等相关工作所做的研究。原创 2024-01-19 12:00:00 · 1992 阅读 · 0 评论 -
Talk|南洋理工大学王谭:DisCo-基于解耦控制的现实人物舞蹈生成及相关工作梳理
本期为TechBeat人工智能社区第563期线上Talk。北京时间1月11日(周四)20:00,南洋理工大学博士生—王谭的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“DisCo-基于解耦控制的现实人物舞蹈生成及相关工作梳理”,介绍了他的团队在人物动作迁移(human motion transfer)、人物图片/视频生成等相关工作所做的研究。原创 2024-01-12 12:00:00 · 522 阅读 · 0 评论 -
Talk|斯坦福大学史浩辰:学习结构化世界模型用于现实世界中柔性物体的操控
本期为TechBeat人工智能社区第562期线上Talk。北京时间1月10日(周三)20:00,斯坦福大学博士生—史浩辰的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“学习结构化世界模型用于现实世界中柔性物体的操控”,介绍了他的团队在智能机器人系统RoboCook来感知、模拟并使用各种工具操控弹塑性物体上所做的研究。原创 2024-01-11 12:00:00 · 963 阅读 · 0 评论 -
Talk | EMNLP 2023 最佳长论文:以标签为锚-从信息流动的视角分析上下文学习
本期为TechBeat人工智能社区第561期线上Talk。北京时间1月4日(周四)20:00,北京大学博士生—王乐安的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“以标签为锚-从信息流动的视角分析上下文学习”,介绍了他的团队在上下文学习相关的分析工作所做的研究。原创 2024-01-08 10:08:31 · 517 阅读 · 0 评论 -
Talk | 香港科技大学博士生陈竞晔:TextDiffuser系列让扩散模型渲染文本不再是难题
本期为TechBeat人工智能社区第560期线上Talk。北京时间1月3日(周三)20:00,香港科技大学在读博士生—陈竞晔的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“TextDiffuser系列让扩散模型渲染文本不再是难题”,介绍了他的团队在文本分割网络与大语言模型提供的显式视觉文本信息引导扩散模型所做的研究。原创 2024-01-04 10:31:52 · 961 阅读 · 0 评论 -
Talk | ACM MM 2023最佳论文,CATR:基于组合依赖和音频查询的视频分割模型
本期为TechBeat人工智能社区第558期线上Talk。北京时间12月27日(周三)20:00,浙江大学博士生—李可欣的Talk已准时在TechBeat人工智能社区开播!她与大家分享的主题是:“CATR-基于组合依赖和音频查询的视频分割模型”,介绍了她的团队在基于组合依赖和音频查询的视频分割模型所做的研究。原创 2023-12-28 12:00:00 · 577 阅读 · 0 评论 -
Talk | 北京大学博士生汪海洋:通向3D感知大模型的前置方案
本期为TechBeat人工智能社区第559期线上Talk。北京时间12月28日(周四)20:00,北京大学博士生—汪海洋的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“通向3D感知大模型的前置方案”,介绍了他的团队在3D视觉大模型的前置方案上所做的研究。原创 2023-12-29 12:00:00 · 445 阅读 · 0 评论 -
Talk | 约翰霍普金斯大学博士生魏晨: De-Diffusion-文本是不同模态的沟通桥梁
本期为TechBeat人工智能社区第557期线上Talk。北京时间12月20日(周三)20:00,约翰霍普金斯大学博士生—魏晨的Talk已准时在TechBeat人工智能社区开播!她与大家分享的主题是:“De-Diffusion-文本是不同模态的沟通桥梁题”,介绍了她的团队在如何通过文本(text) 构建一种强大的跨模态沟通桥梁 (cross-modal interface)上所做的研究。原创 2023-12-21 12:00:00 · 1001 阅读 · 0 评论 -
Talk | UCSB博士生王丹青: 大语言模型的协作学习以及个性化生成评估
本期为TechBeat人工智能社区第555期线上Talk。北京时间12月13日(周三)20:00,加州大学圣塔芭芭拉分校博士生—王丹青的Talk已准时在TechBeat人工智能社区开播!她与大家分享的主题是:“大语言模型的协作学习以及个性化生成评估”,介绍了她的团队在如何利用大语言模型进行交互式学习,并且提供个性化评估作为反馈上所做的研究。原创 2023-12-14 12:00:00 · 995 阅读 · 0 评论 -
Talk | 上海交通大学魏思哲: CoBEVFlow-解决车-车/路协同感知的时序异步问题
本期为TechBeat人工智能社区第556期线上Talk。北京时间12月14日(周四)20:00,上海交通大学硕士生—魏思哲的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“CoBEVFlow-解决车-车/路协同感知的时序异步问题”,介绍了他的团队在基于鸟瞰图流(BEV Flow)的时序异步鲁棒的协同感知系统——CoBEVFlow中缓解时序异步所做的研究。原创 2023-12-15 12:00:00 · 1279 阅读 · 0 评论 -
Talk | UCSB博士生欧阳思琦: 利用词级别对比学习实现低资源下的语音翻译
本期为TechBeat人工智能社区第553期线上Talk。北京时间12月6日(周三)20:00,加州大学圣塔芭芭拉分校·博士生—欧阳思琦的Talk将准时在TechBeat人工智能社区开播!他与大家分享的主题是:“利用词级别对比学习实现低资源下的语音翻译”,介绍了他们团队在利用词级别对比学习实现低资源下的语音翻译的一系列研究。原创 2023-12-07 12:00:00 · 1017 阅读 · 0 评论 -
Talk | 香港中文大学博士生王鸿儒: 基于大模型的对话系统的前世今生
本期为TechBeat人工智能社区第554期线上Talk。北京时间12月7日(周四)20:00,香港中文大学·博士生—王鸿儒的Talk将准时在TechBeat人工智能社区开播!他与大家分享的主题是:“基于大模型的对话系统的前世今生”,分享了他们团队在大模型对话系统上的一系列研究。原创 2023-12-08 12:00:00 · 1184 阅读 · 0 评论 -
Talk | 华为谢恩泽: PixArt-α, 基于Transformer的高质量文本到图像生成扩散模型的快速训练
本期为TechBeat人工智能社区第552期线上Talk。北京时间11月30日(周四)20:00,华为诺亚方舟实验室·AI研究员—谢恩泽的Talk将准时在TechBeat人工智能社区开播!他与大家分享的主题是:“PixArt-Alpha,基于Transformer的高质量文本到图像生成的扩散模型的快速训练”,介绍了他们团队在基于Transformer的T2I扩散模型PIXART-α的一系列研究成果。原创 2023-12-01 12:00:00 · 1256 阅读 · 0 评论 -
Talk | UCSB博士生许闻达:细粒度可解释评估初探
本期为TechBeat人工智能社区第551期线上Talk。北京时间11月29日(周三)20:00,UC Santa Barbara博士生—许闻达的Talk将准时在TechBeat人工智能社区开播!他与大家分享的主题是:“细粒度可解释评估初探”,分享了他们团队在具备解释性的细粒度评估模型的一系列研究成果。原创 2023-11-30 12:00:00 · 968 阅读 · 0 评论 -
Talk | 牛津大学博士后研究员边佳旺:SC-DepthV3-动态场景中的自监督单目深度估计
本期为TechBeat人工智能社区第550期线上Talk。北京时间11月23日(周四)20:00,牛津大学博士后研究员—边佳旺的Talk已准时在TechBeat人工智能社区开播!他与大家分享的主题是:“SC-DepthV3:动态场景中的自监督单目深度估计”,介绍了他们团队如何从大规模预训练过的模型来提取有效信息来帮助自监督算法在动态视频上进行有效训练的一系列研究成果。原创 2023-11-24 12:00:00 · 1192 阅读 · 0 评论