本周LLM新鲜事

LLM Weekly 2024-5-W5

🎉 新品速递

  1. Baichuan 4:百川智能发布的新一代基座大模型,结合首款AI助手「百小应」,具备多轮搜索和定向搜索能力,可以解决各种问题,并将搜索结果嵌入回答中。Baichuan 4在SuperCLUE评测中以80.64分登顶国内第一,文科任务更是全球第一。

  2. 日日新5.0粤语版:商汤科技发布的日日新5.0粤语版,继4月发布「日日新SenseNova 5.0」后的迭代。在中文大模型测评基准SuperCLUE中,成为首个超越GPT-4 Turbo的国产大模型;在OpenCompass的基准表现中,客观评测超过GPT-4 Turbo,主观评测已超过GPT-4o位列第一。

  3. 九天智能基座:中国移动自研的全栈国产化生态大模型,包括万卡算力、千亿模型及百汇平台三部分。

  4. 可图大模型产品:快手自研的大模型产品“可图”(Kolors)正式对外开放,支持文生图和图生图两类功能,已上线20余种AI图像玩法。

🥳 重磅更新

  • 九天千亿多模态基座大模型:中国移动在2024年5月25日的数字中国建设峰会上发布的模型,在风趣畅聊方面堪比GPT-4o,标志着中国移动在通用大模型领域的进一步突破。
  • 建筑行业AI大模型:广联达在2024年5月26日的中国数字建筑大会上发布的模型,旨在推动建筑业的数字化转型和高质量发展,是企业数字化转型的关键技术之一。
  • 百度移动生态业务升级:百度在2024年5月30日举办的万象大会上宣布,其搜索、文心一言APP、百度文库、百度电商、文心智能体平台和百度APP等移动生态业务都基于大模型和智能体进行了能力升级,全面降低了大模型应用门槛。

🔥 热门项目

  1. ollama / ollama:一个开源项目,提供轻量级、可扩展的框架,用于在本地机器上构建和运行大型语言模型(LLMs)。支持MacOS、Linux和Windows平台,提供简单API创建、运行和管理模型,并有预构建模型库。
  2. geekan / MetaGPT:创新的元编程框架,结合大语言模型和多智能体协作系统,编码标准化操作程序(SOPs)为提示序列,提高工作效率和减少错误。提供产品文档、架构设计、任务列表、代码,以及完整的软件公司流程和SOPs。
  3. QuivrHQ / quivr:开源个人知识管理工具,通过AI技术帮助存储、检索和共享非结构化信息。支持多种文件格式,可在本地或云端部署,具备快速数据访问、安全性和跨操作系统兼容性。
  4. run-llama / llama_index:为大型语言模型(LLMs)应用构建的数据框架,支持在线加载模型,增强灵活性和实用性。
  5. mlabonne / llm-course:关于大型语言模型(LLM)的课程,从基础到高级逐步掌握LLM知识。分为LLM Fundamentals、The LLM Scientist和The LLM Engineer三部分,提供路线图和Colab笔记本,便于学习和实践。
  • 11
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值