目录
一、数据类型
Tensorflow是一个面向深度学习算法的科学计算库,内部数据保存在张量(Tensor)对象上,所有的运算都是基于张量对象进行的。Tensorflow中基础数据类型包括数值类型、字符串类型以及布尔类型。
1、数值类型
(1)标量(Scalar):单个实数,维度数为0,shape为[]。
(2)向量(Vector):n个实数的有序集合,维度为1,长度不定,shape为[n]。
(3)矩阵(Matrix):m行n列实数的有序集合,可根据中括号的层数判断维度,维度数为2,但每个维度长度不定,shape为[m,n]。
(4)张量(Tensor):所有维度数大于2的数组统称为张量,通常其每个维度有一定的含义。
#我使用的是2.*版本使用兼容版本,导入Tensorflow
import tensorflow.compat.v1 as tf
tf.compat.v1.disable_v2_behavior()
import numpy as np #后面会用
a = 1.2 #Python语言方式创建标量
aa = tf.constant(a)#TF方式创建标量
type(a),type(aa),tf.is_tensor(a),tf.is_tensor(aa) #查看类型及a是否为张量,a回答为False,aa回答为True
#创建一个元素的向量
a = tf.constant([1.2])
a,a.shape
#创建三个元素的向量
a = tf.constant([1,2.,3.])
a,a.shape
#创建2行2列矩阵
a = tf.constant([[1,2],[3,4]])
#创建三维张量
a = tf.constant([[[1,2],[3,4]],[[5,6],[7,8]]])
2、字符串类型
Tensorflow支持字符串(String)类型的数据,但主要以数值类型张量运算为主,故简单描述一下字符串。
#创建字符串
a = tf.constant('Hello,Deep Learning.')
#字符串转化为小写
b = tf.strings.lower(a)
b
3、布尔类型
布尔类型的张量仅需要传入Python语言支持的布尔型数据转换成Tensor即可。
#创建bool类型标量
a = tf.constant(True)
#创建bool类型向量
b = tf.constant([True,False])
b = tf.constant(True)
a is True #判断对象与True是否等价,为True
a == True #数值比较,为True
二、数据精度
对于数值类型的张量,可保存为不同字节长度的精度。显然,位越长精度越高,所占空间也越大。常用的京都类型主要包括int16,int32,int64,float16,float32,float64,且float64即为doube类型。
补充:在Tensorflow中,对于布尔类型,0视为假,非0视为真。
注意:在精度转换时,由高精度转换为低精度张量时,会有数据溢出的隐患。
#读取精度并类型转换,dtype属性可保存张量的精度
a = tf.constant(True)
print('before:',a.dtype)
if(a.dtype != tf.float32):
a = tf.cast(a,tf.float32)
print('after:',a.dtype)
#最后成功将a精度由before: <dtype: 'bool'>转换为after: <dtype: 'float32'>
三、创建张量
在Tensorflow中可通过多种方式创建张量。
1、从数组或列表对象中创建张量
Numpy Array数组和Python List列表,有些数据可通过加载至这两个容器中后,再转换为Tensor,这样也方便被其他调用。
#从列表创建张量,这两种方法均可以
tf.convert_to_tensor([1,2.])
tf.constant([1,2.])
#从数组中创建张量
tf.convert_to_tensor(np.array([[1,2.],[3,4]]))
2、创建全0或全1张量
这是一种常见的初始化手段,主要为tf.zeros()和tf.ones()方法。
#创建大小为0或为1的标量
tf.zeros([]),tf.ones([])
#创建全0和全1的向量
tf.zeros([1]),tf.ones([1])
#创建全0和全1的向量
tf.zeros([1]),tf.ones([1])
#创建全为0的2*4矩阵和全为1的3*2矩阵
tf.zeros([2,4])
tf.ones([3,2])
3、创建自定义数值张量
由第2点创建全0或全1张量可以引出,非0非1的初始化怎样做呢,这就需要有自定义数值张量的定义了。
tf.fill(shape,value) #shape为张量形状,value为数值
#创建标量100
tf.fill([],100)
#创建所有元素为100的向量
tf.fill([1],100)
#创建3*3矩阵,且所有元素均为100
tf.fill([3,3],100)
4、创建已知分布张量
tf.random.normal(shape,mean,stddev) #创建正态分布,shape为形状,mean为均值,stddev为标准差。
tf.random.uniform(shape,minval,maxval,dtype)用于创建均匀分布,dtype为数值精度,[minval,maxval]可表示为一区间。
#创建均值为1,标准差为2的正态分布
tf.random.normal([2,2],mean = 1, stddev = 2)
#创建采样自[0,10)均匀分布的矩阵
tf.random.uniform([2,2],maxval = 10)
5、创建序列
通常在循环计算或对张量索引时,需要创建一段连续的整数序列。
tf.range(limit,delta) 可创建[0,limit),且步长为delta的整数序列。
tf.range(start,limit,delta) 可创建[start,limit),且步长为delta的整数序列。
创建[0,10)的序列,结果为[1,2,3,4,5,6,7,8,9]
tf.range(10)
#创建从[1,10)的步长为2的序列,结果为[1,3,5,7,9]
tf.range(1,10,2)
四、张量的典型应用
1、标量:典型用途就是误差值的表示以及各种测量指标的表示,例如acc,loss等。
2、向量:例如在全连接和卷积神经网络中,偏置张量b就使用向量表示。
3、矩阵:如全连接层的批量输入张量即为矩阵。