大模型日报
2024-06-03
大模型资讯
- 摘要: NEST(最近邻推测解码)是一种用于在推理阶段修正语言模型的方法,旨在通过最近邻推测解码来增强模型的事实性和归因能力。大规模语言模型在处理多项任务和各类应用中表现优异,NEST方法进一步提高了其性能。
- 摘要: 普林斯顿大学和华威大学的研究人员提出一种新的人工智能方法,以增强大语言模型(LLMs)作为认知模型的实用性。研究发现,LLMs在认知任务中的表现与人类相似,常常做出类似的判断。
- 摘要: OpenAI据报道正在准备在未来几个月内发布其下一代多模态大型语言模型GPT-5。
- 摘要: LLM360发布了K2,这是一款完全可复现的开源大语言模型。K2在计算能力上比Llama 2 70B高效35%,实现了更低的计算功耗和更高的性能表现。
- 摘要: 在神经网络中,理解如何在给定计算预算下优化性能至关重要。更多处理能力的投入可以显著提升性能,研究数据复杂性与尺度定律有助于优化神经语言模型的表现。
- 摘要: 本文详细介绍了RAG(检索增强生成)如何帮助Transformer模型构建可定制的大型语言模型,并探讨了自然语言处理领域的最新进展。
- 摘要: 巴黎的AI初创公司Mistral发布了其首款代码专用大型语言模型Codestral。Codestral拥有220亿参数,旨在提升代码生成和理解的能力。
- 摘要: 苹果公司可能将从以往的设备端人工智能转向云端,推出“机密计算”技术,以确保AI服务器的数据隐私。这标志着苹果在数据保护和隐私方面迈出了重要一步。
- 摘要: Denodo宣布与NVIDIA NIM推理微服务集成,提升Denodo平台,为企业客户提供更快速、更安全、完全可扩展的AI能力。
- 摘要: Inflection公司更新了其Pi聊天机器人。行业专家向PYMNTS表示,这类小型AI模型具有诸多优势,有助于提升商业的可及性和应用范围。
大模型产品
大模型论文
- 摘要: 本研究提出MotionLLM框架,通过视频和运动序列联合建模,实现人类行为理解、描述和推理。引入MoVid数据集和MoVid-Bench评估基准,实验验证其优越性。
- 摘要: 提出VLoRA方法,通过感知权重生成器将视觉信息转化为模型权重,减少输入序列长度,提高计算效率。
- 摘要: 本文介绍了RapVerse数据集,并提出同时从歌词生成3D全身动作和歌声的新任务,展示了多模态变换器在生成一致且逼真结果中的潜力。
- 摘要: Xwin-LM 提供全面的对齐方法,包括监督微调、奖励建模、拒绝采样微调和直接偏好优化,显著提升模型性能。
- 摘要: ParSEL系统通过结合大语言模型和解析编辑传播算法,实现了从自然语言请求中精确编辑高质量3D资产的功能。
- 摘要: CausalQuest 收集了13,500个自然因果问题,建立了分类体系,并训练分类器以高效识别因果问题。
- 摘要: ANAH是一个双语数据集,提供生成问答中大语言模型幻觉的细粒度标注,用于训练和评估幻觉标注器。
- 摘要: FoldFlow-2利用氨基酸序列的生物偏好,结合多模态融合和几何变换器,实现蛋白质结构的多样性和新颖性生成。
- 摘要: 研究大语言模型在WebArena基准测试中通过自我改进提升任务完成率,并提出新的评估指标。
- 摘要: 我们提出PlausiVL,一种视频-语言模型,通过引入两种目标函数来预测现实世界中可行的动作序列,并在Ego4D和EPIC-Kitchens-100数据集上验证了其有效性。
大模型开源项目
- 摘要: ChatTTS是一个用于日常对话的生成语音模型,采用Jupyter Notebook编写,提供自然流畅的语音交互体验。
- 摘要: 此项目提供一个服务,将网页上的ChatGPT转换为OpenAI API格式,使用Python语言编写。
- 摘要: 一个简单的本地网页界面,使用ChatTTS将文字转为语音,并提供API接口,基于Python开发。
- 摘要: 一个基于云的代码编辑环境,配有AI助手和实时协作功能,使用TypeScript编写。
- 摘要: V-Express通过参考图像、音频和V-Kps序列生成说话人视频。该项目使用Python语言编写。
- 摘要: VinciGit00是一个基于AI的Python爬虫工具,用于高效抓取和处理网页数据,提升数据采集效率。
- 摘要: VikParuchuri项目提供90多种语言的OCR、版面分析、阅读顺序和行检测功能,基于Python开发。
- 摘要: 这是一个用Python编写的项目,非官方实现了Novita AI的Animate Anyone功能,为任何人添加动画效果。
- 摘要: ToonCrafter是一项研究生成卡通插值的Python项目,旨在探讨如何通过生成技术实现卡通图像的平滑过渡。