NLP
一个句子:一个sample
一个句子由n个词:n个timestep
一个词是k维的词向量:k个feature
时间序列
时间序列是一个n行m列的excel表
- n行:共有n个观察记录,每个时间点一次(6点、7点、8点....各观察一次)
- m列:每一条观察记录,由m个观察项目(6点:风速,湿度,温度,光照....)
m列:m个feature
n行:n个timestep
所有的timestep:一个sequence;利用滑动窗口,可将一个sequenc分成多个sub_sequence
Batch_size
前面的timestep是训练参数,由网络的结构决定;Batch_size是训练参数,可以在训练时调整。
训练过程(一个epoch):
Batch_size=1:把一个sequence放进网络里,得出一个结果;有多个sequence,就要进行多轮训练,得到多个结果。结果和标签构成loss函数,最小化loss函数。更新参数。
Batch_size=2:把两个sequence同时放进网络(有两个网络?),同时训练(相当于并行处理),可同时得到两个结果。将所有结果和标签构成loss函数,最小化loss。更新参数。