大模型空间站-CSDN博客

原创大模型日报10月21日

为解决此问题，研究者提出了新的理论方案，建议将指导原则从“不要做我不会做的事”改为“不要做我可能不会做的事”，以增强智能体在新环境中的谨慎性。KL正则化在限制智能体行为方面的作用有限，尤其是在复杂的对话任务中，较小的KL预算虽然能使智能体的行为更复杂，但仍无法完全避免简单化和不理想的行为。基于这些发现，研究者训练了一个名为Fluid的随机顺序自回归模型，该模型在MS-COCO 30K上的零样本FID达到了6.16的新最佳状态，并在GenEval基准测试中获得了0.69的总体得分。欧洲博士的质疑与反思。

2024-10-21 20:05:32 1004

原创大模型日报3月19日

s=20今天是我们在物理世界中解决具身AGI的登月计划的开始。我非常兴奋地宣布GR00T项目,这是我们创建人形机器人学习通用基础模型的新倡议。GR00T模型将使机器人能够理解多模态指令,如语言、视频和演示,并执行各种有用的任务。我们正在与世界各地许多领先的人形机器人公司合作,以便GR00T可以在不同的机器人之间转移,并帮助生态系统繁荣发展。GR00T诞生于NVIDIA的深度技术堆栈。

2024-03-20 09:20:46 1554

原创大模型日报3月18日

大语言模型如 ChatGPT 和 GPT-4 在各个领域对人们的生产和生活带来便利，但其误用也引发了关于虚假新闻、恶意产品评论和剽窃等问题的担忧。本文提出了一种新的，直接使用开源小语言模型检测各种大语言模型生成的文本内容。Fast-DetectGPT 将检测速度提高了，将检测准确率相对提升了，成为新的 SOTA。在广泛使用的 ChatGPT 和 GPT-4 生成文本的检测上，均。Fast-DetectGPT 同时做到了高准确率、高速度、低成本、通用，扫清了实际应用的障碍！

2024-03-19 14:18:41 1489

原创大模型日报3月16日-17日

大语言模型（Large Language Models, LLMs）在过去两年内迅速发展，涌现出一些现象级的模型和产品，如 GPT-4、Gemini、Claude 等，但大多数是闭源的。研究界目前能接触到的大部分开源 LLMs 与闭源 LLMs 存在较大差距，因此提升开源 LLMs 及其他小模型的能力以减小其与闭源大模型的差距成为了该领域的研究热点。LLM 的强大能力，特别是闭源 LLM，使得科研人员和工业界的从业者在训练自己的模型时都会利用到这些大模型的输出和知识。

2024-03-19 09:09:26 1683

原创大模型日报3月15日

s=20我浏览了GitHub上最受欢迎的AI仓库,对它们进行了分类,并研究了它们的增长轨迹。以下是一些发现:GitHub上有845个具有至少500个星标的生成式AI仓库。它们由超过20,000名开发人员的贡献构建而成,提交了近100万次。我将AI技术栈分为四层:应用层、应用开发层、模型开发层和基础设施层。2023年,应用层和应用开发层的增长最为显著。基础设施层保持相对稳定。增长最快的类别包括AI界面、推理优化和提示工程。该领域在2022年末爆发,但自2023年9月以来似乎已经平静下来。

2024-03-19 09:00:49 1487

原创大模型日报 3月14日

视频游戏是 AI 系统的重要试验场。与现实世界一样，游戏也是丰富的学习环境，具有反应灵敏的实时设置和不断变化的目标。从早期与雅达利游戏的合作，到人类大师级水平的《星际争霸 II》系统 AlphaStar，谷歌 DeepMind 在人工智能和游戏领域陆续推出过不少影响力研究。刚刚，谷歌宣布了又一项里程碑式研究：SIMA（Scalable Instructable Multiworld Agent），一种适用于 3D 虚拟环境的通用 AI 智能体。

2024-03-19 08:52:25 1527

原创大模型日报 3月13日

信息革命产生了数字世界，数字世界为大模型的诞生提供了数据，也最容易实现通用人工智能（AGI）。向数字世界 AGI 迈进，北京智源人工智能研究院、新加坡南洋理工大学、北京大学携手提出，即智能体需要像人一样在过去很长一段时间里，人工智能研究以游戏为场景，而 GCC 将为通用人工智能研究提供场景，也将进一步促进大模型和 AI Agents 的落地与产业化。为此，研究团队提出，使智能体不依赖任何内部 API 直接控制键盘、鼠标和任何软件交互，无论开源还是闭源，甚至能玩《荒野大镖客 2》这样的商业 3A 游戏大作！

2024-03-14 13:41:50 1876

原创大模型日报 3月12日

2024 开年，OpenAI 就在生成式 AI 领域扔下了重磅炸弹：Sora。这几年，视频生成领域的技术迭代持续加速，很多科技公司也公布了相关技术进展和落地成果。在此之前，Pika、Runway 都曾推出过类似产品，但 Sora 放出的 Demo，显然以一己之力抬高了视频生成领域的标准。在今后的这场竞争中，哪家公司将率先打造出超越 Sora 的产品，仍是未知数。这篇文章将介绍来自字节跳动智能创作团队的 9 项研究，涉及文生图、文生视频、图生视频、视频理解等多项最新成果。

2024-03-13 10:42:02 4345

原创大模型日报3月11日

# 资讯## 研究### 前端不存在了？盲测64%的人更喜欢GPT-4V的设计，杨笛一等团队新作https://mp.weixin.qq.com/s/uQ8T4VS9hyD-R-CNytFZcA将视觉设计实现成执行功能的代码是一项颇具挑战性的任务，因为这需要理解视觉元素和它们的布局，然后将它们翻译成结构化的代码。这个过程需要复杂的技能，也因此让很多普通人无法构建自己的网络应用，即便他们已经有了非常具体的构建或设计思路。不仅如此，由于这个过程需要不同领域的专业知识，因此往往需要

2024-03-12 17:34:11 1203

原创大模型日报 3月9日 — 3月10日

随着 GPT-4 等大型语言模型与机器人研究的结合愈发紧密，人工智能正在越来越多地走向现实世界，因此具身智能相关的研究也正受到越来越多的关注。在众多研究项目中，谷歌的「RT」系列机器人始终走在前沿。如今，这个机器人又进化了。最新版的 RT 机器人名叫「RT-H」，它能通过将复杂任务分解成简单的语言指令，再将这些指令转化为机器人行动，来提高任务执行的准确性和学习效率。

2024-03-11 17:26:30 3103

原创大模型日报 3月1日

s=20在接下来的几周内，Grok 将在国会通过这些庞大的法律之前对它们进行总结，以便你了解它们的真正目的。

2024-03-03 12:40:56 844

原创大模型日报 2月29日

近年来，基于神经网络的偏微分方程求解器在各领域均得到了广泛关注。其中，量子变分蒙特卡洛方法（NNVMC）在量子化学领域异军突起，对于一系列问题的解决展现出超越传统方法的精确度 [1, 2, 3, 4]。

2024-03-01 16:33:50 2961

原创大模型日报 2月28日

来自腾讯的研究者们做了一个关于 agent 的scaling property（可拓展性）的工作。发现：通过简单的采样投票，大语言模型（LLM）的性能，会随着实例化agent数量的增加而增强。其第一次在广泛的场景下验证了该现象的普遍性，与其他复杂方法的正交性，以及研究了其背后的原因，并提出进一步促成scaling发挥威力的办法。

2024-02-29 17:22:23 2467

原创大模型日报2月27日

在移动设备上运行 LLM？可能需要 Meta 的一些技巧。」刚刚，图灵奖得主 Yann LeCun 在个人社交平台表示。他所宣传的这项研究来自 Meta 最新论文《 MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases 》，在众多作者中也有我们熟悉的来自 Meta FAIR 田渊栋。

2024-02-28 22:20:20 1723

原创大模型日报2月26日

s=20可靠的函数调用技术已经激发了AI代理的巨大潜力。我们向超过150名黑客发起挑战，展示他们的才能。在@aiengfoundation举办的RAG+函数调用黑客马拉松中，AgentOps等多个团队脱颖而出。Alex Reibman介绍了几个引人注目的项目： AB Agent利用@FireworksAI_HQ工具进行自动化A/B测试，通过自然语言查询生成统计测试参数。Orakul是一个AI硬件监听设备，可以整合生活中的各种数据（如Gmail, Dropbox等），让用户能与自己的数据进行交流。

2024-02-27 10:55:29 1536

原创大模型日报 2月24-25日

AAAI 2024杰出论文奖揭晓，西安电子科技大学获奖。田渊栋团队提出Searchformer提升Transformer规划能力。中国人民大学提出VDT视频生成框架。新加坡国立大学团队用扩散模型生成神经网络参数。浙江大学和华中科技大学开发GLCN-DTA药物靶标亲和力预测模型。英伟达成立GEAR研究小组，谷歌Gemini关闭生图功能，Mamba论文被拒。投融资方面，Figure AI、Weitu AI和Finpilot获得投资。学术研究探讨Sora模型和开源世界的学术问题。

2024-02-26 08:51:01 1216

原创大模型日报2月22日

资讯研究爆火Sora背后的技术，一文综述扩散模型的最新发展方向https://mp.weixin.qq.com/s/sxaahA116ivqksJa38e9Ig 为了使机器具有人类的想象力，深度生成模型取得了重大进展。这些模型能创造逼真的样本，尤其是扩散模型，在多个领域表现出色。扩散模型解决了其他模型的限制，如 VAEs 的后验分布对齐问题、GANs 的不稳定性、EBMs 的计算量大和 NFs 的网络约束问题。因此，扩散模型在计算机视觉、自然语言处理等方面备受关注。扩散模型由两个

2024-02-23 13:54:35 1351