【Tensorflow2.0】9、tf.data与keras数据读取方式速度对比

最新推荐文章于 2022-10-30 17:39:28 发布

牛andmore牛

最新推荐文章于 2022-10-30 17:39:28 发布

阅读量2.9k

点赞数 3

分类专栏： Tensorflow 文章标签： tf.data读取数据 keras读取数据 tf.data keras读数据方法 tf.data keras读数据速度对比

本文链接：https://blog.csdn.net/u011119817/article/details/103305121

版权

Tensorflow 专栏收录该内容

19 篇文章 13 订阅

订阅专栏

文章目录

本文将对比tf.data与tf.keras中keras读数据方式下那种速度快，具体有三点：

tf.data与keras生成器读数据速度对比
tf.data包装后的keras生成器与原始生成器速度对比
model.fit 与 model.fit_generator分别使用以上数据的实验

1、三种数据读取方式对比

import tensorflow as tf
import numpy as np
import time
print(tf.__version__)

2.0.0

1.1、准备本文所用数据

(train_x,train_y),(test_x,test_y) = tf.keras.datasets.fashion_mnist.load_data()
print(train_x.shape,train_y.shape,test_x.shape,test_y.shape)
train_x=np.expand_dims(train_x,-1)# keras生成器读数据要求输入形状是rank=4
test_x=np.expand_dims(test_x,-1)

(60000, 28, 28) (60000,) (10000, 28, 28) (10000,)

1.2、准备tf.data数据

train_ds = tf.data.Dataset.from_tensor_slices((train_x,train_y))
test_ds = tf.data.Dataset.from_tensor_slices((test_x,test_y))

train_ds = train_ds.shuffle(buffer_size=1000).batch(256).prefetch(buffer_size=1000).repeat()#训练数据会一直重复读
test_ds = test_ds.batch(256).prefetch(buffer_size=1000)#测试数据只读一遍，所以没有加repeat，也可以加repeat(1)

#检查数据
for data,label in test_ds.take(1):
    pass
print(data.shape,label.shape)
np.testing.assert_array_almost_equal(data,test_x[:256,...])#不返回报错信息表示数据相等
np.testing.assert_array_almost_equal(label,test_y[:256])
print(train_ds)

(256, 28, 28, 1) (256,)
<RepeatDataset shapes: ((None, 28, 28, 1), (None,)), types: (tf.uint8, tf.uint8)>

1.3、keras生成器读数据方式

gen = tf.keras.preprocessing.image.ImageDataGenerator()#不做任何数据预处理


train_flow=gen.flow(train_x,train_y,batch_size=256,shuffle=True)#与tf.data中batch相同大小，并且shuffle
test_flow=gen.flow(test_x,test_y,batch_size=256,shuffle=False)

#检查数据
data,label= next(test_flow)
np.testing.assert_array_almost_equal(data,test_x[:256,...])#不返回报错信息表示数据相等
np.testing.assert_array_almost_equal(label,test_y[:256])
print(train_flow)

<keras_preprocessing.image.numpy_array_iterator.NumpyArrayIterator object at 0x000001A031C178C8>

1.4、tf.data包装keras生成器

gen = tf.keras.preprocessing.image.ImageDataGenerator()
wrap_train_ds = tf.data.Dataset.from_generator(lambda:gen.flow(train_x,train_y,batch_size=256,shuffle=True),
    output_types=(tf.uint8, tf.uint8),
    output_shapes = ([None,28,28,1],[None])
)
wrap_test_ds = tf.data.Dataset.from_generator(lambda:gen.flow(test_x,test_y,batch_size=256,shuffle=False),
    output_types=(tf.uint8, tf.uint8),
    output_shapes = (tf.TensorShape([None,28,28,1]),tf.TensorShape([None]))#tf.TensorShape可以不用
)

#检查数据
for data,label in wrap_test_ds.take(1):
    pass
print(data.shape,label.shape)
np.testing.assert_array_almost_equal(data,test_x[:256,...])#不返回报错信息表示数据相等
np.testing.assert_array_almost_equal(label,test_y[:256])
print(wrap_train_ds)

(256, 28, 28, 1) (256,)
<DatasetV1Adapter shapes: ((None, 28, 28, 1), (None,)), types: (tf.uint8, tf.uint8)>

1.5、有了三种数据类型开始比较速度

default_timeit_steps = 5000

def timeit(ds, steps=default_timeit_steps):
    start = time.time()
    it = iter(ds)
    for i in range(steps):
        batch = next(it)
        if i%50 == 0:
            print('.',end='')
    print()
    end = time.time()

    duration = end-start
    print("{} batches: {} s".format(steps, duration))
    print("{:0.5f} samples/s".format(256*steps/duration))

timeit(train_ds)

....................................................................................................
5000 batches: 2.3002309799194336 s
556465.85546 samples/s

timeit(train_flow)

....................................................................................................
5000 batches: 9.523353099822998 s
134406.44136 samples/s

timeit(wrap_train_ds)

....................................................................................................
5000 batches: 11.126928567886353 s
115036.23774 samples/s

对比结论
显然tf.data是最快的，wrap后的生成器最慢，我们肯定是要用tf.data的。关于wrap后比原始keras读数据的方式慢的原因，可能是因为这个生成器有问题，具体不再深究，所以我们就直接用tf.data了。keras的generator读取方法速度慢可能也与tensorflow本身有关，现在tensorflow2.1rc对fit_generator,predict_generator都有做修改，并且有关generator的api都会弃用，fit便直接支持生成器。

2.对tf.data进行改进

2.1 使用AUTOTUNE

train_ds = tf.data.Dataset.from_tensor_slices((train_x,train_y))
test_ds = tf.data.Dataset.from_tensor_slices((test_x,test_y))
train_ds = train_ds.shuffle(buffer_size=1000).batch(256).prefetch(buffer_size=tf.data.experimental.AUTOTUNE).repeat()
test_ds = test_ds.batch(256).prefetch(buffer_size=tf.data.experimental.AUTOTUNE)

timeit(train_ds)

....................................................................................................
5000 batches: 2.3489813804626465 s
544917.04815 samples/s

提升看不明显，在其它数据上有试，效果会比自己随意设定的快

2.2 使用cache

train_ds = tf.data.Dataset.from_tensor_slices((train_x,train_y))
test_ds = tf.data.Dataset.from_tensor_slices((test_x,test_y))

train_ds=train_ds.cache().shuffle(buffer_size=1000).batch(256).prefetch(buffer_size=tf.data.experimental.AUTOTUNE).repeat()
test_ds = test_ds.batch(256).prefetch(buffer_size=tf.data.experimental.AUTOTUNE)

timeit(train_ds)

....................................................................................................
5000 batches: 1.4627950191497803 s
875037.16053 samples/s

这速度的提升是惊人的，这些操作能使读取速度得到提升，但是提升多少依数据类型和其它参数的改变而改变

2.3 map的使用

train_ds = tf.data.Dataset.from_tensor_slices((train_x,train_y))
test_ds = tf.data.Dataset.from_tensor_slices((test_x,test_y))
def transfer(value1,value2):
    return value1,value2 #什么操作都不加，只是为了配合map来使用

train_ds = train_ds.cache().shuffle(buffer_size=1000).map(transfer, num_parallel_calls=tf.data.experimental.AUTOTUNE) \
                           .batch(256).prefetch(buffer_size=tf.data.experimental.AUTOTUNE).repeat()

timeit(train_ds)

....................................................................................................
5000 batches: 9.22971773147583 s
138682.46432 samples/s

需要对数据做处理时要要用到map.

说明：关于对shuffle,cache,batch,map,prefeach,repeat的顺序，排列组合情部很多，产生数据是相同的，但在数据最后一部分不够一个batch size的情况下有些许不同，但对训练没太大影响，测试数据只要全部读取就好。关于速度的影响，推荐使用上边代码的顺序。

3、对第一节中三种数据分别训练模型（fit,fig_generator的使用）

def get_model():
    model = tf.keras.models.Sequential([
      tf.keras.layers.Flatten(input_shape=(28, 28,1)),
      tf.keras.layers.Dense(128, activation='relu'),
      tf.keras.layers.Dropout(0.2),
      tf.keras.layers.Dense(10, activation='softmax')
    ])

    model.compile(optimizer='adam',
                  loss='sparse_categorical_crossentropy',
                  metrics=['accuracy'])
    return model

model= get_model()
start = time.time()
model.fit(train_ds, 
         steps_per_epoch=train_x.shape[0]//32,
         epochs=5)
print("It took {} seconds".format(time.time() - start))

Train for 1875 steps
Epoch 1/5
1875/1875 [==============================] - 7s 4ms/step - loss: 1.4856 - accuracy: 0.7065
Epoch 2/5
1875/1875 [==============================] - 6s 3ms/step - loss: 0.5632 - accuracy: 0.7833
Epoch 3/5
1875/1875 [==============================] - 6s 3ms/step - loss: 0.5069 - accuracy: 0.8000
Epoch 4/5
1875/1875 [==============================] - 7s 4ms/step - loss: 0.4743 - accuracy: 0.8127
Epoch 5/5
1875/1875 [==============================] - 7s 4ms/step - loss: 0.4544 - accuracy: 0.8211
It took 33.07719683647156 seconds

model= get_model()
start = time.time()
model.fit_generator(train_flow, 
                   steps_per_epoch=train_x.shape[0]//32,
                   epochs=5)
print("It took {} seconds".format(time.time() - start))

Epoch 1/5
1875/1875 [==============================] - 36s 19ms/step - loss: 7.8844 - accuracy: 0.5093
Epoch 2/5
1875/1875 [==============================] - 34s 18ms/step - loss: 7.2095 - accuracy: 0.55170s - loss: 7.2
Epoch 3/5
1875/1875 [==============================] - 37s 20ms/step - loss: 6.6551 - accuracy: 0.5862
Epoch 4/5
1875/1875 [==============================] - 38s 20ms/step - loss: 6.4122 - accuracy: 0.6015
Epoch 5/5
1875/1875 [==============================] - 39s 21ms/step - loss: 6.3284 - accuracy: 0.6067
It took 184.5577735900879 seconds

model= get_model()
start = time.time()
model.fit(wrap_train_ds, 
         steps_per_epoch=train_x.shape[0]//32,
         epochs=5)
print("It took {} seconds".format(time.time() - start))

Train for 1875 steps
Epoch 1/5
1875/1875 [==============================] - 13s 7ms/step - loss: 1.7270 - accuracy: 0.6645
Epoch 2/5
1875/1875 [==============================] - 13s 7ms/step - loss: 0.5929 - accuracy: 0.7829
Epoch 3/5
1875/1875 [==============================] - 13s 7ms/step - loss: 0.5159 - accuracy: 0.8131
Epoch 4/5
1875/1875 [==============================] - 13s 7ms/step - loss: 0.4788 - accuracy: 0.8262
Epoch 5/5
1875/1875 [==============================] - 13s 7ms/step - loss: 0.4607 - accuracy: 0.8320
It took 65.25635552406311 seconds

可以看出，tf.data训练要更快，并且精度高一些（这个有点不太明白，后其文章会对fit,fit_generator做更多说明）

牛andmore牛

关注

3
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
【Tensorflow2.0】9、tf.data与keras数据读取方式速度对比

文章目录1、三种数据读取方式对比1.1、准备本文所用数据1.2、准备tf.data数据1.3、keras生成器读数据方式1.4、tf.data包装keras生成器1.5、有了三种数据类型开始比较速度2.对tf.data进行改进2.1 使用AUTOTUNE2.2 使用cache2.3 map的使用说明：关于对shuffle,cache,batch,map,prefeach,repeat的顺序，排列...
复制链接

扫一扫

专栏目录