大模型日报 2024-06-28

大模型日报

2024-06-28

大模型资讯

1.寒武纪1号诞生:谢赛宁Yann LeCun团队发布最强开源多模态LLM
谢赛宁 Yann LeCun 团队发布了寒武纪1号,这是一个开源的多模态LLM模型。该模型以视觉为中心,探索了多种不同的视觉编码器及其组合,并设计了一种动态且可感知空间的新型连接器,将视觉特征与LLM整合在一起。团队还开发了一个以视觉为中心的基准评测工具CV-Bench。该模型在多个基准上表现出色,尤其擅长以视觉为中心的任务。

🔗:https://www.jiqizhixin.com/articles/2024-06-28-5

  1. 炸裂!讯飞现场大秀强干扰语音识别,星火4.0霸榜八个榜单,74种语言自由交流
    科大讯飞的星火4.0在语音识别和个性化AI助手方面取得了突破。语音识别在强干扰场景下的准确率达到了91%,并且支持74种语言的自由交流。个性化AI助手基于用户画像和个人资料进行增强学习,提供个性化的表达和内容。此外,科大讯飞还在医疗和教育领域应用中取得了进展,提供医疗问答、学生学习辅导等功能。讯飞星火APP已经成为人们日常生活中使用的工具之一,具备写作、编程、工作、学习等多种实用功能。

🔗:http://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247736139&idx=2&sn=cbdba96b6db088f5d670be14221c1c6d&chksm=e9e9a6d640489c7bab01363c6d666a6589725c088d350cf5e80cdf5c0b4ea3e446cea54765b2&scene=0#rd

  1. 字节大模型团队Depth Anything V2模型入选苹果最新CoreML模型
    苹果公司在HuggingFace上发布了20个新的Core ML模型和4个数据集,其中字节大模型团队的单目深度估计模型 Depth Anything V2入选。该模型在细节处理上更精细,鲁棒性更强,并且速度上有显著提升。经过工程优化后,在iPhone 12 Pro Max上的推理速度达到了31.1毫秒。该模型可以应用在自动驾驶、3D建模、增强现实、安全监控以及空间计算等领域。

🔗:https://www.jiqizhixin.com/articles/2024-06-28-11

  1. 谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
    谷歌发布了Gemini家族的新成员Gemma 2,提供了90亿和270亿参数的两个版本,具有卓越的性能和高效的推理能力。Gemma 2在同等体积类别中表现出色,能够与体积超过其两倍的模型竞争。它还具有低成本、高速推理和易于部署等特点。谷歌提供了广泛的框架兼容性,使其能够轻松与主要的AI框架结合。开发者可以在Google Cloud上轻松部署和管理Gemma 2,并通过Gemma Cookbook获取实用示例和指南。谷歌还向开发者开放了Gemini 1.5 Pro的200万token上下文窗口访问权限。

🔗:https://www.jiqizhixin.com/articles/2024-06-28-15

大模型论文

  1. 符号学习助力自进化智能体
  • 摘要: 本文提出符号学习框架,使语言智能体能自主优化,模仿连接主义学习算法,实现自进化。
  1. 大规模提示探索用于评估LLM的研究
  • 摘要: 本文介绍了PrExMe,通过720多种提示模板评估开源LLM在机器翻译和摘要数据集上的表现,揭示提示策略的稳定性和变化性。
  1. CharXiv:多模态LLM图表理解评估
  • 摘要: CharXiv提供2323个复杂图表,评估多模态大语言模型在图表理解中的表现,揭示现有模型的不足。
  1. ChatGPT与教授谁更擅长解释?
  • 摘要: 研究比较了LLMs与人类在对话中解释能力,采用5-Levels数据集评估GPT4的解释效果,并通过人类评审进行验证。
  1. 语言模型对强化学习代理的心智建模研究
  • 摘要: 本文探讨大型语言模型能否通过推理建立强化学习代理的心智模型,发现其尚需进一步创新来实现全面建模。
  1. 上下文学习是否为梯度学习的一种?
  • 摘要: 研究发现大型语言模型在上下文学习中表现出逆频率效应,支持其为梯度驱动学习的一种形式。
  1. 角色扮演零样本提示的多语言对话模型
  • 摘要: 本研究探讨通过角色扮演零样本提示,利用多语言LLMs实现高效开放域对话,表现超越微调模型。
  1. 基于大语言模型的显著事件图生成
  • 摘要: 提出CALLMSAE框架,通过生成摘要识别显著事件,迭代代码优化生成事件关系图,提升生成图的准确性。
  1. 基于LLMs的企业数字化转型评估方法
  • 摘要: 本研究提出了一种基于大语言模型的创新评估方法,通过分析4407家上市公司年报,构建全面的数字化转型指标,发现数字化转型显著提升公司财务表现。
  1. IRCAN:通过识别和重加权上下文感知神经元缓解知识冲突
  • 摘要: IRCAN框架通过识别和重加权上下文感知神经元,解决LLM生成中的知识冲突问题,提升上下文处理能力。

大模型开源项目

  1. Modelscope:探索扩散模型的魔力
  • 摘要: Modelscope项目使用Python语言编写,带你体验扩散模型的神奇魅力。
  1. Claude Opus智能子代理框架
  • 摘要: Doriandarko是一个用Python编写的框架,用于智能地协调Claude Opus的子代理。
  1. CISO助手:一站式GRC管理工具
  • 摘要: CISO助手涵盖风险、应用安全和审计管理,支持46+框架,使用Python编写,适用于全球多种合规标准。
  1. Lepton AI:对话式搜索演示
  • 摘要: Lepton AI项目使用TypeScript构建快速对话式搜索演示,展示了高效的搜索功能和友好的用户交互体验。

以上就是2024-06-28的大模型日报,很高兴为你服务!

本文由mdnice多平台发布

  • 21
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值