利用小trick加速tensorflow的训练

最新推荐文章于 2024-05-17 03:28:57 发布

零落_World

最新推荐文章于 2024-05-17 03:28:57 发布

阅读量357

点赞数

分类专栏： tensorflow 深度学习文章标签： tensorflow 自然语言处理深度学习

本文链接：https://blog.csdn.net/cdj0311/article/details/105531033

版权

深度学习同时被 2 个专栏收录

26 篇文章 2 订阅

订阅专栏

tensorflow

15 篇文章 1 订阅

订阅专栏

tensorflow ==1.13.1

1. tf.data并行读取tfrecord数据

def parse_exp(example):
    features = {}
    """ tfrecord解析代码 """
    return features

def input_fn(filenames = "./train_data/*.tfrecord", batch_size=128):
    files = tf.data.Dataset.list_files(filenames)
    dataset = files.apply(tf.contrib.data.parallel_interleave(lambda filename:         
    tf.data.TFRecordDataset(files), buffer_output_elements=batch_size*20, cycle_length=10))
    dataset = dataset.shuffle(batch_size*4)
    dataset = dataset.map(parse_exp, num_parallel_calls=8)
    dataset = dataset.repeat().batch(batch_size).prefetch(1)
    return dataset

2. 在进行分布式训练时，使用tf.fixed_size_partitioner参数分割，对于有较大Embedding计算的时候尤其有用，代码如下：


def model_fn(features, mode, params):
    """ 构建estimator模型 """
    with tf.variable_scope("deviceID_embedding", partitioner=tf.fixed_size_partitioner(8, axis=0)):
        deviceID_input = tf.feature_column.input_layer(features, params["deviceID"])

    """ 构建自己的代码逻辑 """
    net = ...
    output = tf.layers.dense(net, units=1)
    return output

其中tf.fixed_size_partitioner(8, axis=0)的 8代表ps个数。

零落_World

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
利用小trick加速tensorflow的训练

tensorflow ==1.13.11. tf.data并行读取tfrecord数据def parse_exp(example): features = {} """ tfrecord解析代码 """ return featuresdef input_fn(filenames = "./train_data/*.tfrecord", batch_size=1...
复制链接

扫一扫