在人工智能迅速发展的今天, 已经出现了各种各样的深度学习框架, 我们知道,深度学习要基于大量的样本数据来训练模型,那么数据集的制作或选取就显得尤为重要,因此,这个专题想写一写关于tensorflow生成数据集的几种主要形式。
本实例我们将用内存中的模拟数据来生成数据集,生成的数据集直接存储在python的内存中。
具体我们分以下几步进行操作:
1、生成模拟数据,创建模拟数据生成器
2、定义占位符
3、创建session,获取显示模拟数据
4、将模拟数据可视化
不啰嗦,直接上代码:
import numpy as np
import tensorflow as tf
import matplotlib.pyplot as plt
def generate_data(batchsize=100):
# 生成-1~1之间的浮点数,linspace生成一个等差数列
train_x = np.linspace(start=-1, stop=1, num=batchsize)
# randn按照给定的shape生成数、向量或者矩阵,与shape有关,*0.3可以提高梯度下降的收敛速度
train_y = 2 * train_x + np.random.randn(*train_x.shape) * 0.3
# 返回一个生成器,每次生成指定批次batchsize个数据
yield train_x, train_y
# 定义模型的结构部分,这里只有占位符张量
x_input = tf.placeholder(dtype="float", shape=[None], nam