大模型日报
2024-05-13
大模型资讯
- 摘要: 生成式人工智能正在改变我们与技术的互动方式。谷歌最近推出了名为Gemini的新平台,该平台代表了其在生成式AI领域的最新进展。Gemini平台集成了一系列先进的工具和功能,旨在为用户提供更加智能和直观的技术体验。
- 摘要: Meta公司最近发布了其人工智能模型的新版本,并决定将其开放给公众使用。该公司声称,与OpenAI推出的免费版ChatGPT相比,Meta的AI聊天机器人在性能上更加强大。这一举措可能会在AI领域引发更激烈的竞争。
- 摘要: 根据DataHorizzon研究所发布的报告,2023年大型语言模型市场估值为41亿美元。预测显示,到2032年,该市场规模将显著增长至539亿美元,显示出在未来十年中该行业的巨大增长潜力。
- 摘要: 清华大学的研究人员提出了一种名为ADELIE的新模型,旨在通过与大型语言模型的对齐,提升以人为中心任务的信息提取性能。ADELIE模型通过与人类的交互和认知过程更紧密地结合,能够更有效地处理和理解大量数据,从而在信息提取领域实现新的突破。
- 摘要: 日本的研究者团队最近发布了一款名为“Fugaku-LLM”的大型语言模型,该模型在日本国内领先的超级计算机“Fugaku”上进行训练,具备了增强的日语处理能力。这标志着日本在人工智能领域的语言处理技术迈出了重要一步。
- 摘要: KnowHalu是一种新颖的人工智能技术,专门用于识别大型语言模型(LLMs)生成的文本中的幻觉现象。这种方法旨在提高文本生成系统的可靠性与准确性,对于避免误导信息和提升自然语言处理的质量具有重要意义。
- 摘要: 据报道,微软正在开发一款新的内部AI模型,该模型的参数量可能高达5000亿,这将使其能够与谷歌等公司开发的开源模型相匹敌。这一消息表明微软在人工智能领域的竞争力将得到显著增强。
- 摘要: 加州大学伯克利分校的研究者们创新性地提出了一种名为Learnable Latent Codes as Bridges(LCB)的人工智能方法。该方法整合了大型语言模型的抽象推理能力与低层次的动作策略,旨在克服机器人领域中模块化层级策略与端到端策略之间的长期摇摆不定。
- 摘要: 自动驾驶技术公司Wayve宣布,在其C轮融资中成功筹集了1.05亿美元资金。该公司是基于Embodied AI技术的自动驾驶领域的市场领导者,此次融资将进一步促进其自动驾驶技术的研发和商业化进程。
- 摘要: 随着人工智能(AI)和自然语言处理(NLP)领域的显著进步,大型语言模型的发展正受到前所未有的关注。最新研究聚焦于如何在NLP中利用语言学专家知识,特别是一个名为RELIES的系统,它在大型语言模型上的应用可能对未来的AI语言理解和生成产生深远影响。
大模型产品
大模型论文
- 摘要: 大型语言模型(LLMs)能流畅生成文本,但仍需语言学支持。本文探讨NLP领域中语言学的六大贡献:资源、评估、低资源环境、可解释性、解释和语言研究。
- 摘要: OpenBA-V2是一种基于多阶段压缩和持续预训练的3.4B模型,从原始的15B OpenBA模型衍生而来。该模型实现了77.3%的高压缩比,同时保持了最小的性能损失,并在常识推理和命名实体识别等下游任务中展现出与15B原模型相当的性能。
- 摘要: 本文深入探讨了多模态大型语言模型(MLLMs)在自动驾驶领域的应用,通过实验发现其在动态驾驶环境中存在诸多挑战,特别是在连贯性和逻辑性方面的不足。
- 摘要: 本文介绍了Smurfs框架,通过将常规大型语言模型转变为协同多智能体集合,无需额外训练即可增强任务分解和执行能力。实验表明,Smurfs在复杂工具使用场景中优于现有模型。
- 摘要: 本文提出了CuMo,一种通过共同升级混合专家模块来扩展多模态大型语言模型(LLMs)的方法。CuMo在视觉编码器和MLP连接器中集成了稀疏门控混合专家块,提高了模型性能,同时保持了低推理成本。在开源数据集上的训练超越了当前最先进的多模态LLMs。
- 摘要: 本文提出TrustGAIN模型,旨在6G网络环境下确保AI生成内容(AIGC)的安全、隐私和公平性。探讨了AIGC系统面临的对抗性攻击、隐私威胁及保护措施,并强调移动生成服务的无偏性和公平性的重要性。
- 摘要: 研究表明,通过微调向大型语言模型引入新知识可能导致其产生错误幻觉。实验发现,模型吸收新知识较慢,但随着学习,幻觉倾向线性增加。
- 摘要: 本研究提出了Co-driver,一个基于视觉语言模型的自动驾驶助手系统,旨在通过理解复杂路况来调整驾驶行为。系统整合了CARLA模拟器及ROS2,并在实际驾驶数据集中展现出高成功率。
- 摘要: 本文介绍了利用生成式AI通过自然语言实现无人机快速编队控制的首创方法。该方法通过大型语言模型界面,使用户直观地指挥任意大小的无人机群体构成预期几何形态。用户研究结果表明,即使是无经验者也能快速构建复杂图形,并准确识别。
- 摘要: 本文提出了一个名为'Robots Can Feel'的机器人伦理推理框架,通过模拟情感与逻辑相结合的方式,在道德复杂情境中做决策。研究表明,情感权重系数对决策产生显著影响。
大模型开源项目
- 摘要: mustafaaljadery推出的Gemma 2B项目,采用Infini-attention技术,可处理高达10M的上下文长度,基于Python语言编写,是AI领域的一次创新。
- 摘要: harry0703项目通过AI大模型技术,实现了一键生成高清短视频的功能。该工具使用Python语言编写,能够快速方便地为用户制作出高质量的视频内容。
- 摘要: Hydra是一款使用TypeScript编写的游戏启动器,具备内置的bittorrent客户端和自动管理的游戏重打包资源抓取功能。
- 摘要: Open-WebUI(原名Ollama WebUI)是一个用户友好的Web界面,专为大型语言模型(LLMs)设计,采用Svelte语言编写,旨在提升用户交互体验。
- 摘要: Bisheng是一个用Python编写的开源LLM DevOps平台,旨在为下一代AI应用提供强大支持和便捷的开发运维体验。
- 摘要: 1Panel-dev是一个基于大型语言模型(LLM)的知识库问答系统,易于集成,由1Panel官方推出,使用Python开发。
- 摘要: nashsu开发的FreeAskInternet是一个免费、私密的搜索聚合器,可在本地运行,结合多个LLMs生成答案,无需GPU。它能将搜索结果与LLM结合,生成基于搜索的答案,全程免费使用,使用Python编写。
- 摘要: lllyasviel是一个用Python编写的Github趋势AI项目,专注于图像再照明技术。该项目通过算法改善图片光照效果,提升视觉体验。
- 摘要: Roboflow是一个用Python编写的Github趋势AI项目,旨在提供可复用的计算机视觉工具,帮助开发者简化视觉项目的构建过程,提高开发效率。
- 摘要: OpenDevin项目旨在减少编码工作量,提高开发效率。该项目使用Python语言编写,通过简化的编程接口,使开发者能够更快地创建和部署应用程序。