大模型日报2024-06-03

赛博 AI

于 2024-06-03 22:06:59 发布

阅读量872

点赞数 12

分类专栏：大模型日报文章标签：人工智能 OpenAI GPT4o Gemini gpt

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40262196/article/details/139425710

版权

大模型日报专栏收录该内容

101 篇文章

订阅专栏

大模型日报

2024-06-03

大模型资讯

NEST：提升语言模型事实性和归因的推理时间修正方法

摘要: NEST（最近邻推测解码）是一种用于在推理阶段修正语言模型的方法，旨在通过最近邻推测解码来增强模型的事实性和归因能力。大规模语言模型在处理多项任务和各类应用中表现优异，NEST方法进一步提高了其性能。

普林斯顿大学和华威大学提出新AI方法提升大语言模型认知能力

摘要: 普林斯顿大学和华威大学的研究人员提出一种新的人工智能方法，以增强大语言模型（LLMs）作为认知模型的实用性。研究发现，LLMs在认知任务中的表现与人类相似，常常做出类似的判断。

OpenAI即将发布先进的GPT-5模型

摘要: OpenAI据报道正在准备在未来几个月内发布其下一代多模态大型语言模型GPT-5。

LLM360推出K2：高效超越Llama 2 70B的开源大语言模型

摘要: LLM360发布了K2，这是一款完全可复现的开源大语言模型。K2在计算能力上比Llama 2 70B高效35%，实现了更低的计算功耗和更高的性能表现。

神经语言模型中的数据复杂性与尺度定律

摘要: 在神经网络中，理解如何在给定计算预算下优化性能至关重要。更多处理能力的投入可以显著提升性能，研究数据复杂性与尺度定律有助于优化神经语言模型的表现。

RAG助力Transformer构建可定制的大型语言模型：综合指南

摘要: 本文详细介绍了RAG（检索增强生成）如何帮助Transformer模型构建可定制的大型语言模型，并探讨了自然语言处理领域的最新进展。

Mistral推出首款代码专用AI模型Codestral

摘要: 巴黎的AI初创公司Mistral发布了其首款代码专用大型语言模型Codestral。Codestral拥有220亿参数，旨在提升代码生成和理解的能力。

苹果推出“机密计算”技术，保护AI服务器数据隐私

摘要: 苹果公司可能将从以往的设备端人工智能转向云端，推出“机密计算”技术，以确保AI服务器的数据隐私。这标志着苹果在数据保护和隐私方面迈出了重要一步。

Denodo集成NVIDIA NIM推理微服务，加速优化企业AI能力

摘要: Denodo宣布与NVIDIA NIM推理微服务集成，提升Denodo平台，为企业客户提供更快速、更安全、完全可扩展的AI能力。

小型AI模型挑战GPT-4，提升商业可及性

摘要: Inflection公司更新了其Pi聊天机器人。行业专家向PYMNTS表示，这类小型AI模型具有诸多优势，有助于提升商业的可及性和应用范围。

大模型产品

大模型论文

MotionLLM：多模态人类行为理解

摘要: 本研究提出MotionLLM框架，通过视频和运动序列联合建模，实现人类行为理解、描述和推理。引入MoVid数据集和MoVid-Bench评估基准，实验验证其优越性。

VLoRA：通过模型权重感知视觉信息

摘要: 提出VLoRA方法，通过感知权重生成器将视觉信息转化为模型权重，减少输入序列长度，提高计算效率。

RapVerse: 从文本生成歌声与全身动作

摘要: 本文介绍了RapVerse数据集，并提出同时从歌词生成3D全身动作和歌声的新任务，展示了多模态变换器在生成一致且逼真结果中的潜力。

Xwin-LM: 大规模语言模型对齐方法

摘要: Xwin-LM 提供全面的对齐方法，包括监督微调、奖励建模、拒绝采样微调和直接偏好优化，显著提升模型性能。

ParSEL: 基于语言的可控3D形状编辑

摘要: ParSEL系统通过结合大语言模型和解析编辑传播算法，实现了从自然语言请求中精确编辑高质量3D资产的功能。

CausalQuest: 自然因果问题数据集

摘要: CausalQuest 收集了13,500个自然因果问题，建立了分类体系，并训练分类器以高效识别因果问题。

ANAH: 大语言模型幻觉的分析性标注

摘要: ANAH是一个双语数据集，提供生成问答中大语言模型幻觉的细粒度标注，用于训练和评估幻觉标注器。

FoldFlow-2: 条件蛋白质骨架生成模型

摘要: FoldFlow-2利用氨基酸序列的生物偏好，结合多模态融合和几何变换器，实现蛋白质结构的多样性和新颖性生成。

大语言模型在Web任务中的自我改进

摘要: 研究大语言模型在WebArena基准测试中通过自我改进提升任务完成率，并提出新的评估指标。

PlausiVL: 现实世界中可行动作序列的预测

摘要: 我们提出PlausiVL，一种视频-语言模型，通过引入两种目标函数来预测现实世界中可行的动作序列，并在Ego4D和EPIC-Kitchens-100数据集上验证了其有效性。

大模型开源项目

ChatTTS：生成对话语音模型

摘要: ChatTTS是一个用于日常对话的生成语音模型，采用Jupyter Notebook编写，提供自然流畅的语音交互体验。

ChatGPT转OpenAI API服务

摘要: 此项目提供一个服务，将网页上的ChatGPT转换为OpenAI API格式，使用Python语言编写。

ChatTTS本地网页语音合成工具

摘要: 一个简单的本地网页界面，使用ChatTTS将文字转为语音，并提供API接口，基于Python开发。

云端AI协作代码编辑器

摘要: 一个基于云的代码编辑环境，配有AI助手和实时协作功能，使用TypeScript编写。

腾讯AI实验室V-Express项目

摘要: V-Express通过参考图像、音频和V-Kps序列生成说话人视频。该项目使用Python语言编写。

VinciGit00: AI驱动的Python爬虫

摘要: VinciGit00是一个基于AI的Python爬虫工具，用于高效抓取和处理网页数据，提升数据采集效率。

多语言OCR与版面分析工具

摘要: VikParuchuri项目提供90多种语言的OCR、版面分析、阅读顺序和行检测功能，基于Python开发。

Animate Anyone 非官方实现

摘要: 这是一个用Python编写的项目，非官方实现了Novita AI的Animate Anyone功能，为任何人添加动画效果。

ToonCrafter：生成卡通插值研究

摘要: ToonCrafter是一项研究生成卡通插值的Python项目，旨在探讨如何通过生成技术实现卡通图像的平滑过渡。

博客等级

码龄8年

203
原创

2681
点赞

2084
收藏

1876
粉丝

关注

私信

热门文章

分类专栏

大模型日报 101篇
2024WAIC 2篇
Python 1篇
C语言 1篇
R语言 3篇
面试准备 1篇
论文翻译 2篇

展开全部收起

最新评论

大模型日报 2024-07-04
阿J~: 学到了，一起加油。欢迎回赞哦！
大模型日报 2024-08-27
普通网友: 这篇文章是优质之作，内容充实，结构明晰，语言流畅且通俗易懂，适合广大读者阅读。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
大模型日报 2024-08-26
普通网友: 这篇文章真是一篇佳作!作者运用了生动有趣的语言,将枯燥的理论知识娓娓道来,让人如沐春风。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
大模型日报 2024-08-24
普通网友: 优质好文，支持支持。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
大模型日报 2024-08-27
普通网友: 写的很好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。