大模型推理:transformers中的generate函数参数配置

一、主要参数

参数 推荐值 简介 定义
temperature 0.95 这个值越大生成内容越随机,多样性更好 这个参数控制着生成的随机性。较高的温度值(如 1.2)会增加文本的多样性和创造性,但可能会牺牲一些准确性或连贯性。具体地,temperature 会调整概率输出的softmax概率分布,如果 temperature 的值为1,则没有任何调整;如果其值比1大,则会生成更加随机的文本;如果其值比1小,则生成的文本更加保守。
top_p 0.95 单步累计采用阈值,越大越多token会被考虑 如果累计概率已经超过0.95,剩下的token不会被考虑例如有下面的token及其概率,a:0.9,b:0.03,c:0.03,d:0.015,e… 。则只会采用用abc,因为已经是0.96超过了0.95
top_k 50 单步采用token的数量,越大采用token会越多 单步中最多考虑的token数量
max_length 512 最大采样长度 模型生成的文本最大长度,超过的话会做截断,512是参考值,这个依赖于实际情况自己设置
num_beams 1 beam搜索数量,越大文本质量越高 想象一棵树,这个树在每一层的叶子节点数量都是num_beams个,正常模型推理时设置成1就行啦;
  • 24
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
`transformers` 是一个基于 PyTorch 和 TensorFlow 的自然语言处理模型库,它提供了丰富的函数和类,可以用于构建、训练和使用各种预训练的语言模型。下面列举一些常用的函数: - `AutoTokenizer.from_pretrained(model_name_or_path, *args, **kwargs)`: 根据模型名称或路径创建一个 tokenizer 对象,用于将文本转换为模型可以处理的输入格式。 - `AutoModel.from_pretrained(model_name_or_path, *args, **kwargs)`: 根据模型名称或路径创建一个模型对象,用于进行文本的编码、解码和生成等操作。 - `AutoConfig.from_pretrained(model_name_or_path, *args, **kwargs)`: 根据模型名称或路径创建一个配置对象,用于配置模型的参数和超参数。 - `Trainer(model, args, train_dataset, eval_dataset=None, data_collator=None, tokenizer=None, compute_metrics=None, callbacks=None, optimizers=None, lr_scheduler=None, model_init=None, **kwargs)`: 创建一个训练器对象,用于对模型进行训练、评估和预测等操作。 - `pipeline(task, model=None, tokenizer=None, framework='pt', **kwargs)`: 创建一个管道对象,用于对输入文本进行特定任务的处理,例如文本分类、实体识别、问答等。 - `set_seed(seed)`: 设置随机数种子,用于确保实验的可重复性。 - `get_linear_schedule_with_warmup(optimizer, num_warmup_steps, num_training_steps, last_epoch=-1)`: 创建一个学习率调度器对象,用于在训练过程动态调整学习率。 - `AdamW(params, lr=1e-3, betas=(0.9, 0.999), eps=1e-8, weight_decay=0.0, correct_bias=True)`: 创建一个 AdamW 优化器对象,用于优化模型的参数。 - `get_cosine_schedule_with_warmup(optimizer, num_warmup_steps, num_training_steps, num_cycles=0.5, last_epoch=-1)`: 创建一个余弦退火学习率调度器对象,用于在训练过程动态调整学习率。 - `get_polynomial_decay_schedule_with_warmup(optimizer, num_warmup_steps, num_training_steps, lr_end=0.0, power=1.0, last_epoch=-1)`: 创建一个多项式衰减学习率调度器对象,用于在训练过程动态调整学习率。 这些函数只是 `transformers` 提供的众多函数的几个常用函数,具体使用方式和参数可以参考 `transformers` 的文档。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值