大模型日报2024-06-03

大模型日报

 

2024-06-03

 

大模型资讯

 

  1. NEST:提升语言模型事实性和归因的推理时间修正方法

 

  • 摘要: NEST(最近邻推测解码)是一种用于在推理阶段修正语言模型的方法,旨在通过最近邻推测解码来增强模型的事实性和归因能力。大规模语言模型在处理多项任务和各类应用中表现优异,NEST方法进一步提高了其性能。

 

  1. 普林斯顿大学和华威大学提出新AI方法提升大语言模型认知能力

 

  • 摘要: 普林斯顿大学和华威大学的研究人员提出一种新的人工智能方法,以增强大语言模型(LLMs)作为认知模型的实用性。研究发现,LLMs在认知任务中的表现与人类相似,常常做出类似的判断。

 

  1. OpenAI即将发布先进的GPT-5模型

 

  • 摘要: OpenAI据报道正在准备在未来几个月内发布其下一代多模态大型语言模型GPT-5。

 

  1. LLM360推出K2:高效超越Llama 2 70B的开源大语言模型

 

  • 摘要: LLM360发布了K2,这是一款完全可复现的开源大语言模型。K2在计算能力上比Llama 2 70B高效35%,实现了更低的计算功耗和更高的性能表现。

 

  1. 神经语言模型中的数据复杂性与尺度定律

 

  • 摘要: 在神经网络中,理解如何在给定计算预算下优化性能至关重要。更多处理能力的投入可以显著提升性能,研究数据复杂性与尺度定律有助于优化神经语言模型的表现。

 

  1. RAG助力Transformer构建可定制的大型语言模型:综合指南

 

  • 摘要: 本文详细介绍了RAG(检索增强生成)如何帮助Transformer模型构建可定制的大型语言模型,并探讨了自然语言处理领域的最新进展。

 

  1. Mistral推出首款代码专用AI模型Codestral

 

  • 摘要: 巴黎的AI初创公司Mistral发布了其首款代码专用大型语言模型Codestral。Codestral拥有220亿参数,旨在提升代码生成和理解的能力。

 

  1. 苹果推出“机密计算”技术,保护AI服务器数据隐私

 

  • 摘要: 苹果公司可能将从以往的设备端人工智能转向云端,推出“机密计算”技术,以确保AI服务器的数据隐私。这标志着苹果在数据保护和隐私方面迈出了重要一步。

 

  1. Denodo集成NVIDIA NIM推理微服务,加速优化企业AI能力

 

  • 摘要: Denodo宣布与NVIDIA NIM推理微服务集成,提升Denodo平台,为企业客户提供更快速、更安全、完全可扩展的AI能力。

 

  1. 小型AI模型挑战GPT-4,提升商业可及性

 

  • 摘要: Inflection公司更新了其Pi聊天机器人。行业专家向PYMNTS表示,这类小型AI模型具有诸多优势,有助于提升商业的可及性和应用范围。

 

大模型产品

 

大模型论文

 

  1. MotionLLM:多模态人类行为理解

 

  • 摘要: 本研究提出MotionLLM框架,通过视频和运动序列联合建模,实现人类行为理解、描述和推理。引入MoVid数据集和MoVid-Bench评估基准,实验验证其优越性。

 

  1. VLoRA:通过模型权重感知视觉信息

 

  • 摘要: 提出VLoRA方法,通过感知权重生成器将视觉信息转化为模型权重,减少输入序列长度,提高计算效率。

 

  1. RapVerse: 从文本生成歌声与全身动作

 

  • 摘要: 本文介绍了RapVerse数据集,并提出同时从歌词生成3D全身动作和歌声的新任务,展示了多模态变换器在生成一致且逼真结果中的潜力。

 

  1. Xwin-LM: 大规模语言模型对齐方法

 

  • 摘要: Xwin-LM 提供全面的对齐方法,包括监督微调、奖励建模、拒绝采样微调和直接偏好优化,显著提升模型性能。

 

  1. ParSEL: 基于语言的可控3D形状编辑

 

  • 摘要: ParSEL系统通过结合大语言模型和解析编辑传播算法,实现了从自然语言请求中精确编辑高质量3D资产的功能。

 

  1. CausalQuest: 自然因果问题数据集

 

  • 摘要: CausalQuest 收集了13,500个自然因果问题,建立了分类体系,并训练分类器以高效识别因果问题。

 

  1. ANAH: 大语言模型幻觉的分析性标注

 

  • 摘要: ANAH是一个双语数据集,提供生成问答中大语言模型幻觉的细粒度标注,用于训练和评估幻觉标注器。

 

  1. FoldFlow-2: 条件蛋白质骨架生成模型

 

  • 摘要: FoldFlow-2利用氨基酸序列的生物偏好,结合多模态融合和几何变换器,实现蛋白质结构的多样性和新颖性生成。

 

  1. 大语言模型在Web任务中的自我改进

 

  • 摘要: 研究大语言模型在WebArena基准测试中通过自我改进提升任务完成率,并提出新的评估指标。

 

  1. PlausiVL: 现实世界中可行动作序列的预测

 

  • 摘要: 我们提出PlausiVL,一种视频-语言模型,通过引入两种目标函数来预测现实世界中可行的动作序列,并在Ego4D和EPIC-Kitchens-100数据集上验证了其有效性。

 

大模型开源项目

 

  1. ChatTTS:生成对话语音模型

 

  • 摘要: ChatTTS是一个用于日常对话的生成语音模型,采用Jupyter Notebook编写,提供自然流畅的语音交互体验。

 

  1. ChatGPT转OpenAI API服务

 

  • 摘要: 此项目提供一个服务,将网页上的ChatGPT转换为OpenAI API格式,使用Python语言编写。

 

  1. ChatTTS本地网页语音合成工具

 

  • 摘要: 一个简单的本地网页界面,使用ChatTTS将文字转为语音,并提供API接口,基于Python开发。

 

  1. 云端AI协作代码编辑器

 

  • 摘要: 一个基于云的代码编辑环境,配有AI助手和实时协作功能,使用TypeScript编写。

 

  1. 腾讯AI实验室V-Express项目

 

  • 摘要: V-Express通过参考图像、音频和V-Kps序列生成说话人视频。该项目使用Python语言编写。

 

  1. VinciGit00: AI驱动的Python爬虫

 

  • 摘要: VinciGit00是一个基于AI的Python爬虫工具,用于高效抓取和处理网页数据,提升数据采集效率。

 

  1. 多语言OCR与版面分析工具

 

  • 摘要: VikParuchuri项目提供90多种语言的OCR、版面分析、阅读顺序和行检测功能,基于Python开发。

 

  1. Animate Anyone 非官方实现

 

  • 摘要: 这是一个用Python编写的项目,非官方实现了Novita AI的Animate Anyone功能,为任何人添加动画效果。

 

  1. ToonCrafter:生成卡通插值研究

 

  • 摘要: ToonCrafter是一项研究生成卡通插值的Python项目,旨在探讨如何通过生成技术实现卡通图像的平滑过渡。

 

  • 12
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值