大型人工智能模型,尤其是那些拥有千亿参数的模型,因其出色的商业应用表现而受到市场的青睐。但是,直接通过API使用这些模型可能会带来数据泄露的风险,尤其是当模型提供商如OpenAI等可能涉及数据隐私问题时。私有部署虽然是一个解决办法,但昂贵的授权费用对于许多企业来说是一笔不小的开支。Orion-14B系列模型的推出,旨在解决这一难题,提供一个既经济实惠又性能卓越的选择。
Orion-14B系列特点
Orion-14B系列模型以其百亿参数规模,在多个专业场景问题解答中超越了GPT-4等千亿参数级别的模型。更令人振奋的是,该系列模型能够在普通消费级显卡上运行,显著降低了硬件成本。
关键特性包括:
- 在20B参数规模水平的模型中,Orion-14B-Base在综合评估中表现优异。
- 强大的多语言能力,尤其在日语和韩语测试集中表现突出。
- 微调模型展现出强大的适应能力,在人工标注的盲测中表现卓越。
- 长聊天版本支持极长文本,最大支持320k令牌长度。
- 量化版本将模型大小减少70%,推理速度提高30%,性能损失不到1%。
模型系列
Orion-14B系列包括以下模型:
- Orion-14B-Base:一个具有14亿参数的多语言基础模型,预训练在2.5万亿token的多样化数据集上。
- Orion-14B-Chat:在高质量语料库上微调的聊天模型,旨在为大型模型社区的用户提供卓越的交互体验。
- Orion-14B-LongChat:长文本版本,擅长处理极长文本。
- Orion-14B-Chat-RAG:在自定义检索增强生成数据集上微调的聊天模型,检索增强生成任务中表现卓越。
- Orion-14B-Chat-Plugin:专为插件和功能调用任务量身定制的聊天模型,适用于代理相关场景。
- Orion-14B-Base-Int