书生·浦语大模型
- 开源体系:模型和数据共享,促进社区发展。
- 2.5版:推理和记忆大幅提升,labelLM简化标注。
数据与模型
- 数据驱动:模型性能提升的基石。
- 反馈机制:相似度对齐,强化训练优化。
- 大海捞针:处理长知识背景的测试。
- 问题分块:提升问题理解和索引效率。
Mindsearch项目
- 多方面覆盖:语言模型到部署工具。
- 工具与框架:支持开发和评测。
MinorU & XTNER
- MinorU:简化数据提取。
- XTNER:预训练优化,微调流程。
EXTINA & lmdeploy
- EXTINA:微调与评测。
- lmdeploy:模型部署,推理性能。
茴香豆与生态
- 茴香豆:企业级知识管理,思维可视化。
- 开源生态:高质量项目促进创新。