大模型日报 2024-06-27

大模型日报

2024-06-27

大模型资讯

1.OpenAI计划打造“大语言模型操作系统”,收购Rockset和Multi

OpenAI计划建立一个名为LLMOS(Large Language Model Operating System)的大语言模型操作系统,类似于Windows和MacOS,旨在成为未来人机交互的新模式。OpenAI已经在逐步完善LLMOS的功能,包括浏览互联网、使用现有软件基础设施、理解语言和视频、进行复杂思考、自我提升能力、下载应用和拥有文件系统等。为填补LLMOS中的短板,OpenAI最近收购了Rockset和Multi两家公司,分别负责信息检索和多Agent交互。Multi作为一个独立的智能体,在协作中展现了对AI的理解和设计能力。此外,Multi背后的投资方与OpenAI有着千丝万缕的联系,这也是OpenAI选择Multi的关键因素之一。

2.讯飞发布讯飞星火4.0,超越GPT-4 Turbo在国际权威测试集中位居第一 科大讯飞发布了讯飞星火4.0,这款国产大模型在逻辑推理和空间推理方面具有更强的能力。除此之外,讯飞还发布了语音大模型、医疗大模型和智能批阅机等应用。此次发布展示了讯飞在大模型领域的实力和创新能力。讯飞还推出了个人空间和智能体,为用户提供个性化的AI助手。

3.字节跳动发布“豆包MarsCode”智能开发工具,面向国内开发者免费 字节跳动发布了一款名为“豆包MarsCode”的智能开发工具,此工具基于豆包大模型,旨在提供高效的开发环境和工具支持。豆包MarsCode的功能包括项目问答、代码补全、单元测试生成、Bug修复等。通过完整场景演示,展示了该工具在日常工作中的优秀落地能力。此外,豆包MarsCode团队计划通过成立用户组和开展各类开发者活动等方式,助力开发者探索AI编程新范式。豆包MarsCode向国内开发者免费开放。

大模型论文

  1. MG-LLaVA: 多粒度视觉指令调优
  • 摘要: MG-LLaVA通过多粒度视觉流增强视觉处理能力,集成高分辨率编码器和对象级特征,显著提升模型感知能力。
  1. BMIKE-53:跨语言知识编辑研究
  • 摘要: 本文介绍了BMIKE-53基准,用于评估跨语言知识编辑,并提出了无梯度方法MIKE,在53种语言上进行评估。
  1. CaLMQA: 23种语言的长篇问答研究
  • 摘要: CaLMQA数据集涵盖23种语言,包含复杂文化问题。研究发现,LLM在低资源语言和文化特定问题上的表现较差。
  1. TrialMind:加速临床证据合成的AI系统
  • 摘要: TrialMind利用大语言模型进行医学系统综述,显著提升文献回顾效率,支持高质量临床证据合成。
  1. 大语言模型生成说服性语言的能力评估
  • 摘要: 研究大语言模型生成说服性文本的能力,构建Persuasive-Pairs数据集,训练模型预测文本对的说服性评分,并探讨不同系统提示对说服性的影响。
  1. LLM对弱势用户表现不佳
  • 摘要: 研究发现,LLM在信息准确性和真实性方面对低英语水平、低教育水平及非美国用户表现较差。
  1. FedBiOT:资源高效的联邦学习LLM微调方法
  • 摘要: FedBiOT通过服务器生成压缩LLM并对齐性能,客户端微调重要部分,解决数据分布差异问题,显著减少资源消耗。
  1. 大语言模型对齐的分布变化研究
  • 摘要: 研究对齐过程对大语言模型输出分布的影响,发现对齐后信息多样性减少,但有助于信息聚合和质量控制。
  1. VarBench:通过动态变量扰动提升语言模型评估
  • 摘要: 本文提出VarBench,通过变量扰动方法动态生成测试用例,评估四个数据集上的大语言模型,解决数据泄露问题,提升评估准确性。
  1. 大型语言模型心理测评基准研究
  • 摘要: 研究提出了评估LLM心理属性的框架,涵盖人格、价值观、情绪等六大维度,揭示LLM自我报告与实际行为的差异。

大模型开源项目

  1. modelscope:探索扩散模型的魔力
  • 摘要: modelscope是一个用Python编写的项目,旨在让用户体验和享受扩散模型的神奇效果。
  1. RAGFlow:深度文档理解引擎
  • 摘要: RAGFlow是一个基于深度文档理解的开源RAG引擎,采用Python语言编写,用于增强生成任务的检索功能。
  1. CISO助手:一站式GRC管理工具
  • 摘要: CISO助手涵盖风险、应用安全和审计管理,支持全球46+框架,使用Python编写,助力合规管理。
  1. Claude Opus智能编排框架
  • 摘要: Doriandarko是一个用Python编写的框架,用于智能编排和管理Claude Opus的子代理。

以上就是2024-06-27的大模型日报,很高兴为你服务!

本文由 mdnice 多平台发布

  • 23
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值