前言
在使用大模型时候,我们经常遇到参数传参问题,如何构建一个参数方法,即可使用默认参数,也可使用命令方式传参,是大模型构建的第一步。而大模型经常使用HfArgumentParser+parser.parse_args_into_dataclasses+transformers.TrainingArguments等方式来实现。介于此,我解读了大模型通用构建方法,重在方法掌握,而参数如何构建可通过你自己的想法。
一、parser.parse_args_into_dataclasses
1、parse_args_into_dataclasses的原理
parser.parse_args_into_dataclasses() 是 Hugging Face Transformers 库中的一个方法,用于解析命令行参数并将其转换为 Python 的数据类(dataclass)。在Hugging Face的transformers库中,这个方法通常用于处理模型训练、评估、预测等任务的命令行参数。这些参数可以包括模型类型、训练步数、学习率、数据集路径等。这个方法的工作原理是,它会查找当前模块或父模块中定义的任何数据类(使用@dataclas