TensorFlow2.0 DataSet数据集的使用

最新推荐文章于 2023-12-20 18:19:19 发布

廷益--飞鸟

最新推荐文章于 2023-12-20 18:19:19 发布

阅读量1.2k

点赞数

分类专栏： TensorFlow

本文链接：https://blog.csdn.net/weixin_45875105/article/details/105695323

版权

TensorFlow 专栏收录该内容

70 篇文章 11 订阅

订阅专栏

TensorFlow2.0 DataSet数据集的使用

import tensorflow as tf
import numpy as np

# 模拟数据
def GenerateData(data_size=100):
    train_x = np.linspace(-1, 1, data_size)
    print(*train_x.shape)
    train_y = 2 * train_x + np.random.randn(*train_x.shape) * 0.2
    return train_x,train_y

# 生成模拟数据
train_data = GenerateData()

# 获取一个数据
def get_one(dataset):
    for elment in dataset:
        return elment

# 显示一个数据
def show_elment(elment):
    x, y = elment
    print("x shape:", x.shape)
    print("x:", x.numpy())
    print("y shape:", y.shape)
    print("y:", y.numpy())

# 显示头5个数据
def show_head(dataset, size=5):
    for step, elment in dataset.enumerate():
        show_elment(elment)
        if step >= size-1:
            break

# 以元组方式 生成Dataset数据集
batch_size = 10
dataset_tuple = tf.data.Dataset.from_tensor_slices(train_data)
db_tuple = dataset_tuple.shuffle(100).batch(batch_size)

# 显示元组数据集
elment_tuple = get_one(db_tuple)
# show_elment(elment_tuple)

show_head(db_tuple, 1)

# 以字典方式 生成Dataset数据集
dataset_dict = tf.data.Dataset.from_tensor_slices({
    "x":train_data[0],
    "y":train_data[1]
})

db_dict = dataset_dict.map(lambda data: (data["x"], data["y"]))
db_dict = db_dict.shuffle(100).repeat().batch(batch_size)

# 显示字典数据集
elment_dict = get_one(db_dict)
show_elment(elment_dict)

show_head(db_dict, 1)

廷益--飞鸟

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录