方便学习之 torchtext.data 篇章翻译续集Functions

chuanyang09

于 2023-04-12 21:03:46 发布

阅读量103

点赞数

文章标签：学习 pytorch 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014474004/article/details/130116448

版权

torchtext 包由数据处理实用程序和自然语言的流行数据集组成。

(1) batch (批次)

# Yield elements from data in chunks of batch_size.
# 以batch_size块从数据中产生元素。
torchtext.data.batch(data, batch_size, batch_size_fn=None)

(2) pool (数据资源池)

'''
Sort within buckets, then batch, then shuffle batches.

Partitions data into chunks of size 100*batch_size, sorts examples within each chunk using sort_key, then batch these examples and shuffle the batches.

在桶内排序，然后批处理，然后打乱顺序批处理。

将数据分割成大小为100*batch_size的块，使用sort_key对每个块中的示例进行排序，然后批处理这些示例并打乱顺序批次。
'''
torchtext.data.pool(data, batch_size, key, batch_size_fn=<function <lambda>>, random_shuffler=None, shuffle=False, sort_within_batch=False)

(3) get_tokenizer

torchtext.data.get_tokenizer(tokenizer, language='en')

(4) interleave_keys

'''
Interleave bits from two sort keys to form a joint sort key.

Examples that are similar in both of the provided keys will have similar values for the key defined by this function. Useful for tasks with two text fields like machine translation or natural language inference.


从两个排序键中交错位，形成一个联合排序键。

所提供的两个键中相似的示例将具有此函数定义的键的相似值。
适用于具有两个文本字段的任务，如机器翻译或自然语言推理。
'''
torchtext.data.interleave_keys(a, b)

文章翻译于 torchtext.data — torchtext 0.4.0 documentation

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

chuanyang09 CSDN认证博客专家 CSDN认证企业博客

码龄10年

6: 原创

199万+: 周排名

137万+: 总排名

1397: 访问

: 等级

60: 积分

0: 粉丝

0: 获赞

4: 评论

3: 收藏

私信

关注

热门文章

最新评论

方便学习之 torchtext.data 篇章翻译
CSDN-Ada助手: 非常感谢你的分享，这篇翻译对于学习 torchtext.data 肯定会有很大的帮助。恭喜你开始博客创作，希望你能继续分享更多的学习心得和经验，让更多的人受益。下一步建议你可以深入探讨 torchtext.data 的应用场景和实践案例，让读者更好地理解其实际应用价值。推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
方便学习之 torchtext.data 篇章翻译续集Fields
CSDN-Ada助手: 非常感谢您为我们带来的这篇博客，有助于我们更好地了解torchtext.data。您的持续创作将会让更多人受益。除了标题和摘要中提到的技能，我想分享一些相关的扩展知识和技能，例如：如何使用torchtext.data加载自己的数据集、如何处理图像数据、如何使用torchvision.transforms等技能。希望这些信息对您有所帮助。继续加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
方便学习之 torchtext.data 篇章翻译续集Iterators
CSDN-Ada助手: 非常感谢你分享的这篇博客，对于学习 torchtext.data 真的很有帮助。看到你已经写了三篇博客，真的很佩服你的创作热情和耐心。我想建议你可以考虑分享一些实际应用案例，让读者更好地了解如何将所学应用到具体的项目中。再次感谢你的分享，期待你更多的精彩作品。 CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
方便学习之 torchtext.data 篇章翻译续集Pipeline
CSDN-Ada助手: 恭喜您写出了这篇题为“方便学习之 torchtext.data 篇章翻译续集Pipeline”的博客。您的文章对于学习torchtext.data的人来说一定非常有帮助。接下来，我建议您可以在下一篇博客中分享一些实际应用的例子和经验，让读者更好地理解torchtext.data的使用方法。期待您的下一篇文章！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。