预训练思考与基于预训练模型的应用例子

最新推荐文章于 2023-06-22 20:44:47 发布

ox180x

最新推荐文章于 2023-06-22 20:44:47 发布

阅读量179

点赞数

文章标签：自然语言处理人工智能 nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ox180x/article/details/124095183

版权

介绍

本篇文章主要讲基于bert预训练模型的一些例子，希望可以从不同角度理解与应用基于bert的一些应用。

nlp发展了这么多年，经历了规则，统计，模型等阶段，目前预训练模型基本算是一统天下了。

大公司有更多资源，可以联合一些科研机构与组织搞一些事情，比如微软和nvidia利用更多的资源来探测模型的边界。
这个就很有意思，思考一个问题，什么叫意识？什么情况下产生了意识？

什么是意识，这个可以尝试用两个词来理解，计算和算计。计算很好理解，比如计算机，计算器，本质来讲是人输入指令，获得一个预期结果，不会产生任何歧义。而算计呢，它是一个综合体，它的输出是多样的，有可能不可预知的。它具有自己的思考。

那什么情况下产生了意识？这个问题就是这些大佬们所想要尝试认知的东西。比如人类有30亿碱基对，蚊子才几千万，单细胞生物可能更少可能就被认为不具备意识？如此看来的话，那我可以尝试扩充网络容量，更多的训练数据集，等到了某个程度下，突然机器就具备了某种智能。

这是个有意思的研究！

不过扯了这么多，小公司的话，更多是基于预训练模型的微调。

为什么要基于预训练模型微调呢，严格意义来讲就是预训练模型已经学习到了语义，一个认知大脑。基于此，给定一个具体任务，来对其进行微调，使其具备更快的收敛能力和更好的泛化能力。

所以掌握下还是很重要滴😂😂😂。

下面介绍四个应用示例，每一种大致介绍下，更具体的实现可以自行实现。

不过作者在这里使用了Trainer，这是transformers出的一套工具，可以让你更快的训练，但是封装太高，懒得折腾了，不如自己从头写😂😂😂。

命名实体任务

这个是个ner任务，不知道ner的自行百度，模型后面接了一个linear，如果想要更深入，可以看看crf。

不过这个任务如果用于分词，词性标注还是很nice的。

句子对相似度

这个任务还是蛮有意思的，之前也有类似的比赛。比如天池疫情相似句对判定大赛线上第一名方案。

整体实现思路基本一致，不过作者加入了对抗训练这些东西，感兴趣可以看看。

句子分类

这个就是多分类任务，也是比较常见的场景。

阅读理解

这个我没看😂😂😂。

总结

好吧，这本书快让我水了一波，感兴趣的需要基础的老铁们可以多翻翻。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

ox180x CSDN认证博客专家 CSDN认证企业博客

码龄8年

233: 原创

11万+: 周排名

168万+: 总排名

9万+: 访问

: 等级

2692: 积分

8: 粉丝

13: 获赞

9: 评论

91: 收藏

私信

关注

热门文章

分类专栏

Python 7篇
Java 3篇

最新评论

静态词向量之glove
weixin_42750884: 请问这是哪本书啊
macbert4csc纠错
ox180x: 看tokenizer词表，多数还是字向量，少量词词向量
macbert4csc纠错
m0_64544441: 你好大佬，我想请教一下macbert在做中文预训练的时候得到的到底是字向量还是词向量还是学习到词信息的字向量呢一直不太理解谢谢大佬
macbert4csc纠错
ox180x: 不能
macbert4csc纠错
猪批得: 这个只能解决输入和输出的句子一样长对吗，缺漏字能解决吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。