几个nlp的小任务(生成式任务——语言模型(CLM与MLM))

最新推荐文章于 2024-06-07 01:57:04 发布

Coder-jzq

最新推荐文章于 2024-06-07 01:57:04 发布

阅读量1.2k

点赞数 1

分类专栏：人工智能学习文章标签：自然语言处理语言模型人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Seven597/article/details/132524749

版权

人工智能学习专栏收录该内容

31 篇文章 0 订阅

订阅专栏

本章节需要用到的类库

在这里插入图片描述

微调任意Transformers模型（CLM因果语言模型、MLM遮蔽语言模型）

CLM

在这里插入图片描述

MLM

在这里插入图片描述

准备数据集

在这里插入图片描述

展示几个数据的结构

在这里插入图片描述

介绍因果语言模型（Causal Language Modeling，CLM）

分词后连接文本，再特定序列长度中拆分

在这里插入图片描述

指定一个模型，设置分词器

在这里插入图片描述

数据预处理

在这里插入图片描述

将所有文本连接在一起，然后将结果分割成特定block_size的小块

在这里插入图片描述

数据已经清理完毕，我们就可以实例化我们的训练器了

在这里插入图片描述

设置args、trainer

在这里插入图片描述

开始训练

在这里插入图片描述

训练结束后，评估模型即可

在这里插入图片描述

掩蔽语言模型（Mask Language Modeling，MLM）

选择模型和分词器

在这里插入图片描述

通过 map 分成batch_size = 1000 的样本大小

在这里插入图片描述

加载一个合适的语言遮蔽模型

在这里插入图片描述

转为 token时要随机 mask掉一些东西

在这里插入图片描述

把所有东西交给 trainer，然后开始训练

在这里插入图片描述

进行评估

在这里插入图片描述

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
几个nlp的小任务(生成式任务——语言模型(CLM与MLM))

nlp
复制链接

扫一扫

专栏目录

Coder-jzq CSDN认证博客专家 CSDN认证企业博客

码龄5年

160: 原创

3万+: 周排名

1万+: 总排名

9万+: 访问

: 等级

1886: 积分

206: 粉丝

158: 获赞

91: 评论

274: 收藏

私信

关注

热门文章

分类专栏

最新评论

pytorch的学习与总结(第二次组会)
qq_51575444: 很有帮助非常感谢
SpringBoot开发项目实战记录（未完结）
天蓝999: 可以的，我看的另一个SpringBoot视频，从零开发，十天掌握了项目实战：https://knife.blog.csdn.net/article/details/134911141
B站(云e办)SpringBoot实战练习的Sql文件、前端Vue源码、后端springboot源码
m0_73768267: 我也一直报这个错，求解决方案
如何下载spring（所有版本）
decent_soul: 转c了
常用的解决各类问题网址集合（一键即转）（前端、后端、linux等服务安装）
Coder-jzq: Gulp： Gulp是一种基于任务的构建工具，它允许你定义一系列任务（例如编译、压缩、拷贝文件等），然后自动运行这些任务。它使用JavaScript代码来配置任务，非常灵活。Gulp适用于需要自定义构建流程的项目。 Webpack： Webpack是一个模块打包工具，它能够将各种前端资源（JavaScript、CSS、图片等）打包成一个或多个文件。Webpack强大的功能包括代码分割、热模块替换（HMR）等，适用于复杂的现代前端开发。 Snowpack： Snowpack是一个现代的前端构建工具，专注于开发体验的速度。它采用ES模块导入的方式，将第三方依赖项直接引入浏览器，而不是传统的打包方式。这使得开发过程更快速。Snowpack适用于小型项目和需要快速开发迭代的场景。 esbuild： esbuild是一个极快的JavaScript和TypeScript构建工具。它以速度著称，通常能够比其他构建工具更快地构建项目。esbuild适用于需要高性能构建的项目。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。