目录
函数
pad_sequences()
keras
只能接受长度相同的序列输入。因此如果目前序列长度参差不齐,这时需要使用pad_sequences()
。
该函数是将序列转化为经过填充以后的一个长度相同的新序列新序列。
参数:
sequences
:浮点数或整数构成的两层嵌套列表
maxlen
:None
或整数,为序列的最大长度。大于此长度的序列将被截短,小于此长度的序列将在后部填0
.
dtype
:返回的numpy array的数据类型
padding
:pre
或post
,确定当需要补0
时,在序列的起始还是结尾补
truncating
:pre
或post
,确定当需要截断序列时,从起始还是结尾截断
value
:浮点数,此值将在填充时代替默认的填充值0
enumerate()
seq = ['one', 'two', 'three']
for i, element in enumerate(seq):
print i, element
结果如下:
0 one
1 two
2 three
Dict字典
get()
dict.get(key, default=None)
参数:
key
– 字典中要查找的键。
default
– 如果指定键的值不存在时,返回该默认值。
返回值:
返回指定键的值,如果值不在字典中返回默认值None。
Tensorflow
tf.Session()
用于运行TensorFlow操作的类.
一个Session对象封装了Operation执行对象的环境,并对Tensor对象进行计算.例如:
# Build a graph.
a = tf.constant(5.0)
b = tf.constant(6.0)
c = a * b
# Launch the graph in a session.
sess = tf.Session()
# Evaluate the tensor `c`.
print(sess.run(c))
tf.placeholder()
tf.placeholder(
dtype,
shape=None,
name=None
)
dtype
:数据类型。常用的是tf.float32,tf.float64等数值类型
shape
:数据形状。默认是None,就是一维值,也可以是多维(比如[2,3], [None, 3]表示列是3,行不定)
name
:名称
placeholder()函数是在神经网络构建graph的时候在模型中的占位,此时并没有把要输入的数据传入模型,它只会分配必要的内存。等建立session,在会话中,运行模型的时候通过feed_dict()函数向占位符喂入数据。
tf.contrib.rnn.DropoutWrapper()
在使用tf.nn.rnn_cell.DropoutWrapper时,参数input_keep_prob,output_keep_prob分别控制输入和输出的dropout概率。
- 如果希望是input传入这个cell时dropout掉一部分input信息的话,就设置input_keep_prob,那么传入到cell的就是部分input;
- 如果我希望这个cell的output只部分作为下一层cell的input的话,就定义output_keep_prob。
Notice: Dropout只能是层与层之间(输入层与LSTM1层、LSTM1层与LSTM2层)的Dropout;同一个层里面,T时刻与T+1时刻是不会Dropout的。