AI
文章平均质量分 76
人工智能相关
区块链架构师之路
AI and blockchain will change the world!
展开
-
【大模型学习】Baichuan2-13B源码解析-3
这段代码的整体作用是创建和运行一个基于预训练的大型语言模型( “baichuan-inc/Baichuan2-13B-Chat”)的对话系统。它允许用户通过命令行与模型进行交互式对话。原创 2023-12-20 16:27:53 · 142 阅读 · 1 评论 -
【大模型学习】Baichuan2-13B源码解析-2
这个配置文件是为深度学习训练过程中的优化和性能分析而设置的。它包含了多个参数,用于控制批处理大小、梯度累积、模型保存时的权重处理等。原创 2023-12-20 16:18:35 · 131 阅读 · 1 评论 -
【大模型学习】Baichuan2-13B源码解析-1
这段代码是一个使用库进行有监督训练的脚本。它定义了模型参数、数据参数、训练参数的数据类,一个自定义的数据集类,以及一个训练函数。以下是对代码中每个方法的逻辑解析,以及相应的Markdown格式注释。原创 2023-12-20 15:56:02 · 131 阅读 · 1 评论