- 因此对于给定的输入图片 x 它代表的是数字 i 的证据可以表示为什么公式?
- 其中 什么代表权重,什么 代表数字 i 类的偏置量,什么 代表给定图片 x 的像素索引用于像素求和?
- 如何用softmax函数可以把这些证据转换成概率 y?
- 这里的softmax可以看成是一个什么函数或什么函数,把我们定义的线性函数的输出转换成我们想要的格式,也就是关于几个数字类的概率分布?
- 给定一张图片,它对于每一个数字的吻合度可以被softmax函数转换成为一个什么?
- softmax函数可以定义为:什么等式?
- 展开等式右边的子式,可以得到:
- 更多的时候把softmax模型函数定义为前一种形式:把输入值当成什么求值,再如何处理这些结果值?
- 这个幂运算表示,更大的证据对应更大的假设模型(hypothesis)里面的什么?。
- 反之,拥有更少的证据意味着在假设模型里面拥有更小的什么?
- 假设模型里的权值不可以是什么值?
- Softmax然后会如何处理这些权重值,使它们的总和等于几? 以此构造一个有效的概率分布。
- 对于softmax回归模型可以用下面的图解释:
- 对于输入的xs如何处理,再分别加上一个什么,最后再输入到softmax函数中。
- 如果把它写成一个等式,是什么样的?
- 我们也可以用什么表示这个计算过程:用什么和什么相加。这有助于提高什么?
- 如何写成更加紧凑的方式?
- 为了用python实现高效的数值计算,我们通常会使用什么?
- 什么,会把类似矩阵乘法这样的复杂运算使用其他外部语言实现。
- 从外部计算切换回Python的每一个操作,是否是一个很大的开销。如果你用GPU来进行外部计算,这样的开销是否会更大。
- 用分布式的计算方式,是否会花费更多的资源用来传输数据。
- TensorFlow也把复杂的计算放在哪里完成?
- Tensorflow是否单独地运行单一的复杂计算,而是让我们可以先用什么描述一系列可交互的计算操作,然后全部一起在哪里运行。
- 使用TensorFlow之前,首先导入它:
在这里插入代码片
- 我们通过操作什么来描述这些可交互的操作单元,可以用下面的方式创建一个:
在这里插入代码片
-
x不是一个什么,而是一个什么?
-
我们希望能够输入多少数量的MNIST图像,每一张图展平成多少维的向量?
-
我们用几维的浮点数张量来表示这些图?这个张量的形状是[几,几 ]。(这里的什么表示此张量的第几个维度可以是什么长度的。)
-
我们的模型也需要什么值和什么量,当然我们可以把它们当做是另外的输入(使用占位符),但TensorFlow有一个更好的方法来表示它们:什么?
-
一个什么代表一个可修改的什么,存在在TensorFlow的用于描述什么的图中。
-
它们可以用于计算什么,也可以在计算中被如何。
-
对于各种机器学习应用,一般都会有什么参数,可以用什么表示。
在这里插入代码片
-
我们赋予什么不同的初值来创建不同的什么?
-
在这里,我们都用全为几的张量来初始化W和b
-
因为我们要学习W和b的值,它们的初值可以怎样?
-
W的维度是[几,几],因为我们想要用几维的图片向量乘以它以得到一个几维的证据值向量,每一位对应不同数字类。b的形状是[几],所以我们可以直接把它加到输出上面。
-
我们可以实现我们的模型啦。只需要一行代码:
在这里插入代码片
-
我们用什么表示x乘以W?
-
这里x是一个几维张量拥有什么?
-
为了训练我们的模型,我们首先需要定义一个什么来评估这个模型是好的?
-
我们通常定义指标来表示一个模型是怎样的,这个指标称为什么,然后尽量怎样这个指标?
-
一个非常常见的,非常漂亮的成本函数是什么?它产生于什么技术?
-
它的定义:
-
y 是什么, y’ 是什么?
-
它是用来衡量我们的预测用于描述真相的什么。
-
我们首先需要添加一个新的占位符用于输入正确值:
在这里插入代码片
- 然后我们可以用 什么计算交叉熵:
在这里插入代码片
-
首先,用 什么计算 y 的每个元素的对数。接下来,我们把 y_ 的每一个元素和 什么的对应元素相乘。最后,用 什么 计算张量的所有元素的总和。
-
这里的交叉熵不仅仅用来衡量单一的一对预测和真实值,而是什么?
-
TensorFlow拥有一张描述什么的图,它可以自动地使用什么算法来有效地确定你的变量是如何影响你想要最小化的那个成本值的。
-
TensorFlow会用你选择的优化算法来不断地干什么?
-
train_step = tf.train.GradientDescentOptimizer
我们要求TensorFlow用什么算法以多少的学习速率最小化交叉熵。
-
TensorFlow只需将每个变量一点点地往哪个方向移动
-
我们已经设置好了我们的模型。在运行计算之前,我们需要添加一个操作来初始化我们创建的变量:
在这里插入代码片
- 现在我们可以在一个哪里面启动我们的模型,并且初始化变量:
在这里插入代码片
- 然后开始训练模型,这里我们让模型循环训练1000次
在这里插入代码片
-
该循环的每个步骤中,我们都会随机抓取训练数据中的几个批处理数据点,然后我们用这些数据点作为参数替换之前的占位符来运行什么?
-
使用一小部分的随机数据来进行训练被称为什么训练?
-
在这里更确切的说是什么训练
-
每一次训练我们可以使用不同的什么,这样做既可以减少什么,又可以最大化地学习到什么。
-
什么是一个非常有用的函数,它能给出某个tensor对象在某一维上的其数据最大值所在的索引值?
-
由于标签向量是由几组成,因此最大值几所在的索引位置就是类别标签。
-
什么返回的是模型对于任一输入x预测到的标签值,而 什么代表正确的标签?
-
我们可以用 什么来检测我们的预测是否真实标签匹配(索引位置一样表示匹配)。
在这里插入代码片
-
上面 这行代码会给我们一组什么值。为了确定正确预测项的比例,我们可以把什么值转换成什么数,然后取什么值。
-
例如,[True, False, True, True] 会变成 [什么] ,取平均值后得到 几
在这里插入代码片