【备份】HuggingFace（持续更新）

Prof_JG

已于 2023-08-06 02:31:33 修改

阅读量46

点赞数

文章标签：深度学习人工智能

于 2023-08-06 02:29:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_55787059/article/details/132126848

版权

1、in-graph tokenizer

看到TFBertTokenizer提到的，官网解释为：

This is an in-graph tokenizer for BERT. It should be initialized similarly to other tokenizers, using the from_pretrained() method. It can also be initialized with the from_tokenizer() method, which imports settings from an existing standard tokenizer object.

In-graph tokenizers, unlike other Hugging Face tokenizers, are actually Keras layers and are designed to be run when the model is called, rather than during preprocessing. As a result, they have somewhat more limited options than standard tokenizer classes. They are most useful when you want to create an end-to-end model that goes straight from tf.string inputs to outputs.

当前理解是，里面一些参数如padding的设定可以根据训练过程中的batch进行调整（无需设定死），其结果会根据batch数据的不同而发生变化。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
【备份】HuggingFace（持续更新）

的设定可以根据训练过程中的batch进行调整（无需设定死），其结果会根据batch数据的不同而发生变化。我的理解是，里面一些参数如。
复制链接

扫一扫

Prof_JG CSDN认证博客专家 CSDN认证企业博客

码龄3年

2: 原创

187万+: 周排名

32万+: 总排名

270: 访问

: 等级

32: 积分

0: 粉丝

0: 获赞

2: 评论

0: 收藏

私信

关注

热门文章

最新评论

【备份】HuggingFace（持续更新）
CSDN-Ada助手: 评论：非常欣喜看到您持续更新HuggingFace的备份博客！您的努力和热情鼓舞了很多读者，包括我在内。请继续保持创作，分享您的见解和经验。与HuggingFace相关的一个扩展知识是Fine-tuning（微调）技术。Fine-tuning是指在已经经过预训练的模型基础上，通过在特定任务上进行少量训练，从而适应该特定任务的模型参数。这个技术可以帮助我们在自然语言处理等领域中取得更好的性能。此外，还有一项相关技能是数据增强（Data Augmentation）。数据增强是通过对训练数据进行一系列变换和扩充，从而增加数据样本的多样性，提高模型的泛化能力。在使用HuggingFace进行模型训练时，数据增强可以是一个非常有用的技巧。谦虚地说，我相信您已经对HuggingFace有了很深入的了解，但我还是想分享这些相关的扩展知识和技能，希望对您有所启发。期待您继续分享更多有趣的内容！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

【知识抽取】UniRE解码及简化版竞赛小结

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。