- embedding层:在导入预训练的词典后,embedding层的参数是怎么来的,以及参数数目是怎么计算的。
- 添加dropout层【将dropout层单独加进去】,没有产生额外要训练的参数。
- LSTM、GRU等RNN,当return_sequences=False时表示不会将所有的时刻的隐层输出最终输出出来,所以会发生降维;当return_sequences=True时,表示会将所有的时刻输出,不会发生降维。
- 4.
模型中的一些细节问题
最新推荐文章于 2020-03-08 19:20:08 发布