- 博客(3)
- 收藏
- 关注
原创 深度学习代码笔记2-文本生成模型
首先,T5是一个大规模预训练模型,是encoder-decoder架构。T5模型是text to text形式,即输入的是文本,输出的也是文本,并且在每个任务前都会有一个特定的任务前缀(task prefix),例如:想做一个翻译任务,把英文翻译成中文,输入为 “ translation: translate English to Chinese: Today is Monday.”输出为 “ 今天星期一。事实上,不仅仅是翻译任务,其他的自然语言处理任务也可以用这种形式。
2023-04-22 15:44:23 820 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人