huggingface
文章平均质量分 79
jieshenai
这个作者很懒,什么都没留下…
展开
-
BERT 多分类实战:从训练到评估的完整指南
使用 transformers.Trainer 自动训练模型,使用训练完成的模型进行预测,评估模型训练的效果。原创 2024-09-30 16:24:43 · 1199 阅读 · 0 评论 -
使用Bert模型优化Padding策略:加速文本分类训练
本文探讨了如何通过优化Padding策略,提高基于Bert的文本分类模型的训练速度。我们比较了两种不同的Padding方式:一种是将输入数据统一填充到最大长度512,另一种是只将每个Batch中的数据填充到Batch中最长的样本长度。通过实验结果证明,后者显著减少了训练时间,且不影响模型的性能。原创 2024-09-10 21:20:05 · 857 阅读 · 0 评论 -
使用 Bert 做文本分类,利用 Trainer 框架实现 二分类,事半功倍
介绍了如何使用 `transformers` 库的 `Trainer` 进行Bert模型的自动微调,无需手动调整损失函数和参数更新。导入必要的库和数据集,文章展示了加载中文Bert模型并对文本进行分类的过程。文中详细讲解了如何将数据集转换为Bert模型可处理的格式,并通过 `TrainingArguments` 和 `Trainer` 设置训练参数和执行训练。使用 `Trainer` 不仅节省时间,还能保证模型效果。使用 `wandb` 记录和可视化训练过程,可视化查看模型训练过程。原创 2024-09-06 17:00:43 · 651 阅读 · 0 评论 -
datasets库一些基本方法:filter、map、select等
本文介绍了使用datasets库在Python中高效处理数据集的方法。文中展示了如何安装和导入huggingface数据集,并详细说明了使用filter、map和select方法对数据集进行筛选、转换和采样的具体步骤,同时解决了因网络问题导致的连接难题。还展示了如何通过map方法转换数据集样式,实现数据集的定制化处理。原创 2024-08-21 11:11:06 · 918 阅读 · 0 评论 -
HuggingFace 国内下载 阿里云盘下载速度20MB/s
国内使用阿里云盘下载huggingface模型权重。海外服务器上传模型到阿里云盘。原创 2023-10-25 20:03:31 · 2038 阅读 · 0 评论 -
transformer.HfArgumentParser案例以及Debug
HfArgumentParser可以将类对象中的实例属性转换成转换为解析参数。类对象是@dataclass()创建的类对象。本文提供了Pycharm的参数输入方式,可用作Debug原创 2023-06-15 16:02:18 · 3889 阅读 · 1 评论 -
huggingface transformers loadset 导入本地文件
表示导入的本地文件是 json文件。原创 2023-06-27 20:03:50 · 916 阅读 · 0 评论