CCF-NLP走进高校(郑州大学)

最新推荐文章于 2023-04-15 17:45:00 发布

存在computer

最新推荐文章于 2023-04-15 17:45:00 发布

阅读量361

点赞数 1

分类专栏： NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014622100/article/details/108902284

版权

NLP 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

观看网址：https://www.yanxishe.com/events/ccf-nlp-zzu

（一）分享主题：预训练模型在多语言、多模态任务的进展——周明

pre-trained model:A new paradigm of NLP

大规模语料库（Large-scale Corpus）训练一个通用的预训练模型，这是属于上游任务。针对不同的工作，模型借助标注数据再discirminative(判别式)训练出新的模型符合具体业务需求，属于微调（Fine-tuning）。

Pre-training stage:learn task-agnostic general knowledge from large-scale corpus by self-supervised learning.（预训练阶段：通过自监督学习从大规模语料库中学习与任务无关的常识。）

Fine-tuning stage:transfer learnt knowledge to downstream tasks by discriminative training.（微调阶段：通过判别训练将学到的知识转移到下游任务中。）

(1)Transformer

(2)自监督训练是一种非监督的形式，没有标注语料，根据自身文本的特点进行训练。

Self-supervised learning is a form of unsupervised learning where the data itself provides the supervision.（自我监督学习是一种非监督学习的形式，其中数据本身提供了监督。）

自监督可以通过Autoregressive Langusge Model(AR LM)或者Auto-encoding(AE)实现。

(3)预训练

一次多义的情况Word2Vec无法判定，后面都是结合上下文改进可以识别一词多义。

GPT3适合生成。XLM是多语言的。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。