大模型主要分类
- 专用模型:针对特定任务,一个模型解决一个问题,如:AlphaGo、语音识别、人脸识别、图像识别等。
- 通用大模型:一个模型多种任务、多钟模态。
7B轻便便宜,20B中量型模型
- internLM2-base是模型基座,internLM2 chat是对话交互
- 多维度数据价值评估;高质量语料数据富集;针对性数据补齐
- 主要亮点:超长上下文(20万token),综合性能提升;对话和创作能力;工具调用(搭建复杂智能体);突出数理分析能力;性能对比全方位提升。
- 一些应用场景展示:
模型自定义回复风格;安排行程路线规划;有想象力的创作,可以创作剧本;工具调用能力,可以调用代码,计算,完成复杂任务。
- 计算多步的运算,复杂运算和求解。配合代码解释器,20B模型可以完成部分微积分任务了;GSM8K和MATH数据集;
- 数据分析功能,上传表格进行分析文件,可以自己写代码,画出趋势分析图,使用机器学习算法进行预测。
模型到应用
智能客服、个人助手、行业应用
模型选型-业务场景评估-算力评估-训练微调-调整环境交互-构建智能体-模型部署。
预训练模型使使用便捷、可扩展、兼容主流。
internLM2性能处于中等靠前
部署支持多种主流接口