开源之路
性能天梯
原生推理、上下文记忆、自主规划搜索能力出色
核心思路:不断反馈迭代
高质量合成数据策略:基于规则的数据构造、基于模型的数据扩充、基于反馈的数据生成
推理能力领先
大海捞针实验:0.1-1million Token文档中定位任何位置的信息效果都非常出色
解决思路:规划、拆分、搜索、整合
模型谱系
数据、预训练、微调、部署、评测、应用全链条开源
数据模态多样、数据量庞大
数据提取、数据标注工具
通过显存优化、分布式训练及优化帮助企业节省成本、提高效率
适配多种生态、多种硬件的高效微调框架,支持算法:QLoRA,LoRA……
评测表现
零显存浪费的偏好对齐训练方案
开源社区最完善的评测体系之一
工具、基准、榜单三位一体
特点:科学、领先、公平
高效的推理、可靠的量化、卓越的兼容性、便捷的服务、有状态的推理
领先的推理性能
通过与外部工具交互提高可靠性
轻量级智能体框架
Lagent demo
MindSearch demo —— 思维路径可视化
群聊场景LLM知识助手
茴香豆特性