大模型日报2024-05-10

最新推荐文章于 2024-06-12 09:43:43 发布

赛博 AI

最新推荐文章于 2024-06-12 09:43:43 发布

阅读量998

点赞数 23

分类专栏：大模型日报文章标签：人工智能 AIGC gpt

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40262196/article/details/138681207

版权

大模型日报专栏收录该内容

71 篇文章 6 订阅

订阅专栏

大模型日报

2024-05-10

大模型资讯

阿里巴巴发布新AI语言模型Qwen2.5，超越OpenAI的GPT-4

摘要: 阿里巴巴集团旗下的阿里云推出了新型大型语言模型Qwen2.5。据称，在语言生成能力上超过了OpenAI的GPT-4，尽管在其他领域也有出色表现。该模型的发布进一步加剧了全球AI领域的竞争。

alt.ai启动建设具有万亿参数的大型语言模型

摘要: alt Inc.近日开始建设一种新的大型语言模型，该模型拥有万亿级别的参数数量。公司旨在通过这一举措追求全球最佳的速度和成本效能，进一步推动人工智能技术的发展边界。

阿里巴巴推出新版大型语言模型以满足强劲的AI需求

摘要: 阿里巴巴云计算在周四宣布，其大型语言模型已在跨行业的公司中部署超过90000次，以应对不断增长的人工智能需求。该模型的最新版本旨在提供更高效的智能语言处理服务。

运用博弈论提高AI的正确性和效率

摘要: 研究人员正借鉴博弈论的理念来优化大型语言模型，使其表现更为一致。通过这种跨学科的方法，AI的决策过程将变得更加精确，同时提高处理信息的效率，有望在多种应用场景中推动人工智能技术的发展。

开发者致力于构建支持非英语语种的AI模型

摘要: 目前，开发者正在推动构建能够原生支持非英语语言的人工智能模型。尽管许多人使用西班牙语或法语，但现有的大型语言模型可能并不擅长处理这些语言。这一努力旨在改善AI技术对多语言的理解与交流能力。

微软开发新型AI大模型MAI-1以竞争市场

摘要: 微软正在内部开发一种名为MAI-1的新型大型语言模型，旨在与市场上一些最大的模型竞争。尽管微软与其他公司有合作关系，但该公司决定自主研发这一AI技术，显示出微软在人工智能领域的雄心和持续的投资承诺。

新AI论文发布：HalluVault用于检测大型语言模型中的事实冲突幻觉

摘要: 近期，一篇AI论文介绍了名为HalluVault的技术，旨在检测大型语言模型产生的与事实冲突的幻觉。在机器学习和数据科学领域，高效的数据处理技术至关重要，这些领域极度依赖快速的数据处理能力。HalluVault的提出，可能对提升模型的准确性和可靠性有着重要影响。

评估大型语言模型对常见问题的响应

摘要: 随着大型语言模型（LLMs），例如ChatGPT-4、Gemini和Microsoft Copilot，在多个领域发挥重要作用，近期的研究开始聚焦于评估这些模型对频繁提出的问题的响应能力。这些模型的应用表明，人工智能在理解和生成自然语言方面取得了显著进展。

俄罗斯宣传网络使用大型语言模型作为信息战新武器

摘要: 近期，一个与俄罗斯联系的宣传网络使用大型语言模型（LLMs）引起了对信息战新手段的担忧。这些先进的语言处理工具被认为是在网络上传播有偏见或操纵性信息的有效工具。

Enkrypt推出新工具评估LLMs安全性

摘要: Enkrypt公司开发了一种新工具，旨在帮助企业团队识别和评估流行的大型语言模型（LLMs）的安全性。该工具将提供一个安全性列表，使企业能够深入了解每个LLM的优势和劣势，从而更好地选择和使用这些模型。

大模型产品

大模型论文

THRONE: 针对大型视觉语言模型的幻觉基准测试

摘要: 本文提出THRONE框架，用于定量评估大型视觉语言模型(LVLMs)自由形式输出中的Type I幻觉。研究表明，改进现有指标并不能减少Type I幻觉，并提出了一种简单有效的数据增强方法作为减少Type I和Type II幻觉的基线。

YOCO：一种高效的语言模型缓存机制

摘要: 本文提出了一种名为YOCO的解码器架构，通过自解码器和交叉解码器的组合，实现了一次性缓存键值对。该设计显著减少了GPU内存需求，并保持了全局注意力能力。实验结果显示，YOCO在扩展模型规模和训练令牌数量方面，相较于传统Transformer模型有更好的性能表现。

开源语言模型辅助学习反馈研究

摘要: 本研究利用GPT-4评估开源语言模型在编程课程中生成的反馈质量。结果表明，某些开源模型的反馈与专有模型相媲美，展现了在教育领域的应用潜力。

大型语言模型的多议题博弈谈判

摘要: 研究利用大型语言模型（LLMs）的AI代理在多议题谈判游戏中的表现。通过模拟实验，分析了性格特质如开放性、责任心和神经质与公平、理性倾向及攻击性的关系，并提出了基于博弈论和计算社会科学的谈判行为评估框架。

SuFIA：手术机器人辅助增强灵巧性

摘要: 本文介绍了SuFIA框架，它是首个利用自然语言指导的手术机器人辅助增强灵巧性系统。该系统结合了大型语言模型的推理能力和感知模块，实现了无需学习的手术任务执行，并在模拟环境和实验室的物理手术机器人平台上进行了验证。

Conv-Basis：变换器高效注意力推理

摘要: 本文提出了一种新的Conv-Basis系统，利用卷积矩阵高效近似注意力机制计算，通过快速傅里叶变换（FFT），显著降低了变换器的计算复杂度，使其可以应用于更长的上下文。

MIDGARD：结构化常识推理自洽性

摘要: 本研究通过大型语言模型从自然语言输入生成推理图，提出了MIDGARD方法。该方法基于最小描述长度原理，从多样化的推理图样本中识别一致性属性，有效提高了结构化推理任务的性能。

AirGapAgent：保护隐私的会话代理

摘要: 本文提出了AirGapAgent，一种新型隐私保护会话代理，通过限制访问仅与特定任务相关的数据，有效预防敌手利用上下文漏洞窃取私密信息。实验结果表明，AirGapAgent能显著提高数据保护效率，抵御上下文劫持攻击。

数学选择题自动生成干扰项的改进

摘要: 研究提出了一种新方法，通过生成-排序技术提升数学选择题干扰项的质量。通过训练模型预测学生选择干扰项的可能性，实验结果表明该方法能更贴近人工编写的干扰项。

NLI在需求工程任务中的应用

摘要: 研究了自然语言推理（NLI）在自动化需求工程任务中的应用。通过对比不同模型，证明NLI在需求分析中超越传统NLP方法。

大模型开源项目

VinciGit00：AI驱动的Python爬虫

摘要: VinciGit00是一个Github上的热门AI项目，采用Python语言编写。该项目专注于利用人工智能技术提高网络爬虫的效率和准确性。

AFFiNE：超越Notion的知识库

摘要: AFFiNE是一款开源的下一代知识库，以隐私为先，集规划、整理与创作于一体。使用TypeScript编写，自定义性强，即装即用。

IvanGlinkin：创新定位追踪项目

摘要: IvanGlinkin项目通过集成Telegram API，利用开源设计提供精确的位置追踪服务。它能实现50-100米范围内的精准定位，实时监控适用于物流或安全领域，用JavaScript编写，为我们的导航方式带来变革。

Skyvern-AI：智能浏览器自动化工具

摘要: Skyvern-AI是一个用Python编写的开源项目，结合了大型语言模型(LLMs)和计算机视觉技术，旨在自动化浏览器中的工作流程。该项目通过模仿人类用户的行为，提高了自动化任务的效率和准确性。

Huggingface：机器学习领域机器人项目

摘要: Huggingface项目推出了LeRobot，这是一个基于Pytorch的实用机器学习库，专注于现实世界的机器人应用开发，使用Python语言编写。

Blealtan：高效的KAN纯PyTorch实现

摘要: Blealtan是一个Github上的AI项目，用纯PyTorch实现了Kolmogorov-Arnold网络（KAN），旨在提供高效、可扩展的深度学习模型解决方案。

HqWu-HITCS: 开源中文大语言模型整理

摘要: HqWu-HITCS项目聚焦开源中文大语言模型，选取小规模、低成本、易部署模型进行整理，涵盖底座模型、垂直领域微调、应用实例、数据集和教程。

AdityaNG: 基于KANs的GPT实现

摘要: AdityaNG项目是一个用PyTorch实现的GPT语言模型，采用Kolmogorov-Arnold网络（KANs）进行生成预训练，完全使用Python语言编写。

基于GPT的在线研究智能代理

摘要: assafelovic是一个Github上的AI趋势项目，利用GPT模型构建的自主代理，能够对任何给定主题进行全面的在线研究。该项目使用Python语言编写。

commaai开源驾驶辅助系统

摘要: commaai的openpilot是一款开源驾驶辅助系统，能够为250多种车型提供自动车道居中和自适应巡航控制功能。该项目使用Python语言编写。

关注

23
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
大模型日报2024-05-10

2024-05-10。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。