欢迎关注我的CSDN:https://blog.csdn.net/caroline_wendy
本文地址:https://blog.csdn.net/caroline_wendy/article/details/128222398
NLP seq2seq代码编写技巧
数据
- tokenization,离散符号,翻译,划分token
- token2idx,将token变成idx
- add SoS&EoS,开头和结尾添加标识符,start of sentence,end of sentence
collate_fn
:pad_sequence
、label=target[:,1:]
、decoder_input=target[:, :-1]