2021SC@SDUSC-山东大学软件工程与实践-Senta(十)

最新推荐文章于 2023-04-08 20:39:28 发布

Caster0920

最新推荐文章于 2023-04-08 20:39:28 发布

阅读量150

点赞数

文章标签： python

本文链接：https://blog.csdn.net/Casterrrrrrrr/article/details/122182887

版权

本文深入剖析了SENTA中BaseDataSetReader的实现，它负责将数据转换为py_reader所需的tensor格式。核心功能包括读取文本文件，将内容转为id，通过py_reader生成lod-tensor，用于后续的embedding计算。文章详细介绍了必要的参数和方法，如初始化py_reader、构造字段id及embedding，以及数据生成器的设置。

摘要由CSDN通过智能技术生成

本篇对SENTA中的BaseDataSetReader进行源码分析。
在这里插入图片描述

BaseDataSetReader:将样本中数据组装成一个py_reader, 向外提供一个统一的接口。
核心内容是读取明文文件，转换成id，按py_reader需要的tensor格式灌进去，然后通过调用run方法让整个循环跑起来。 py_reader拿出的来的是lod-tensor形式的id，这些id可以用来做后面的embedding等计算。

class BaseDataSetReader(object):

    def __init__(self, name, fields, config):
        self.name = name
        self.fields = fields
        self.config = config  # 常用参数，batch_size等，

最低0.47元/天解锁文章

Caster0920

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2021SC@SDUSC-山东大学软件工程与实践-Senta(十)

本篇对SENTA中的BaseDataSetReader进行源码分析。BaseDataSetReader:将样本中数据组装成一个py_reader, 向外提供一个统一的接口。核心内容是读取明文文件，转换成id，按py_reader需要的tensor格式灌进去，然后通过调用run方法让整个循环跑起来。 py_reader拿出的来的是lod-tensor形式的id，这些id可以用来做后面的embedding等计算。class BaseDataSetReader(object): def __
复制链接

扫一扫