大模型日报
2024-06-28
大模型资讯
1.寒武纪1号诞生:谢赛宁Yann LeCun团队发布最强开源多模态LLM
谢赛宁 Yann LeCun 团队发布了寒武纪1号,这是一个开源的多模态LLM模型。该模型以视觉为中心,探索了多种不同的视觉编码器及其组合,并设计了一种动态且可感知空间的新型连接器,将视觉特征与LLM整合在一起。团队还开发了一个以视觉为中心的基准评测工具CV-Bench。该模型在多个基准上表现出色,尤其擅长以视觉为中心的任务。
🔗:https://www.jiqizhixin.com/articles/2024-06-28-5
- 炸裂!讯飞现场大秀强干扰语音识别,星火4.0霸榜八个榜单,74种语言自由交流
科大讯飞的星火4.0在语音识别和个性化AI助手方面取得了突破。语音识别在强干扰场景下的准确率达到了91%,并且支持74种语言的自由交流。个性化AI助手基于用户画像和个人资料进行增强学习,提供个性化的表达和内容。此外,科大讯飞还在医疗和教育领域应用中取得了进展,提供医疗问答、学生学习辅导等功能。讯飞星火APP已经成为人们日常生活中使用的工具之一,具备写作、编程、工作、学习等多种实用功能。
- 字节大模型团队Depth Anything V2模型入选苹果最新CoreML模型
苹果公司在HuggingFace上发布了20个新的Core ML模型和4个数据集,其中字节大模型团队的单目深度估计模型 Depth Anything V2入选。该模型在细节处理上更精细,鲁棒性更强,并且速度上有显著提升。经过工程优化后,在iPhone 12 Pro Max上的推理速度达到了31.1毫秒。该模型可以应用在自动驾驶、3D建模、增强现实、安全监控以及空间计算等领域。
🔗:https://www.jiqizhixin.com/articles/2024-06-28-11
- 谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
谷歌发布了Gemini家族的新成员Gemma 2,提供了90亿和270亿参数的两个版本,具有卓越的性能和高效的推理能力。Gemma 2在同等体积类别中表现出色,能够与体积超过其两倍的模型竞争。它还具有低成本、高速推理和易于部署等特点。谷歌提供了广泛的框架兼容性,使其能够轻松与主要的AI框架结合。开发者可以在Google Cloud上轻松部署和管理Gemma 2,并通过Gemma Cookbook获取实用示例和指南。谷歌还向开发者开放了Gemini 1.5 Pro的200万token上下文窗口访问权限。
🔗:https://www.jiqizhixin.com/articles/2024-06-28-15
大模型论文
- 摘要: 本文提出符号学习框架,使语言智能体能自主优化,模仿连接主义学习算法,实现自进化。
- 摘要: 本文介绍了PrExMe,通过720多种提示模板评估开源LLM在机器翻译和摘要数据集上的表现,揭示提示策略的稳定性和变化性。
- 摘要: CharXiv提供2323个复杂图表,评估多模态大语言模型在图表理解中的表现,揭示现有模型的不足。
- 摘要: 研究比较了LLMs与人类在对话中解释能力,采用5-Levels数据集评估GPT4的解释效果,并通过人类评审进行验证。
- 摘要: 本文探讨大型语言模型能否通过推理建立强化学习代理的心智模型,发现其尚需进一步创新来实现全面建模。
- 摘要: 研究发现大型语言模型在上下文学习中表现出逆频率效应,支持其为梯度驱动学习的一种形式。
- 摘要: 本研究探讨通过角色扮演零样本提示,利用多语言LLMs实现高效开放域对话,表现超越微调模型。
- 摘要: 提出CALLMSAE框架,通过生成摘要识别显著事件,迭代代码优化生成事件关系图,提升生成图的准确性。
- 摘要: 本研究提出了一种基于大语言模型的创新评估方法,通过分析4407家上市公司年报,构建全面的数字化转型指标,发现数字化转型显著提升公司财务表现。
- 摘要: IRCAN框架通过识别和重加权上下文感知神经元,解决LLM生成中的知识冲突问题,提升上下文处理能力。
大模型开源项目
- 摘要: Modelscope项目使用Python语言编写,带你体验扩散模型的神奇魅力。
- 摘要: Doriandarko是一个用Python编写的框架,用于智能地协调Claude Opus的子代理。
- 摘要: CISO助手涵盖风险、应用安全和审计管理,支持46+框架,使用Python编写,适用于全球多种合规标准。
- 摘要: Lepton AI项目使用TypeScript构建快速对话式搜索演示,展示了高效的搜索功能和友好的用户交互体验。
以上就是2024-06-28的大模型日报,很高兴为你服务!
本文由mdnice多平台发布