关于gpt2生成的训练验证

最新推荐文章于 2024-06-09 10:26:46 发布

会发paper的学渣

最新推荐文章于 2024-06-09 10:26:46 发布

阅读量257

点赞数

分类专栏： NLP 文章标签：深度学习人工智能 Powered by 金山文档

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sslfk/article/details/129148364

版权

NLP 专栏收录该内容

29 篇文章 2 订阅

订阅专栏

代码地址：GPT2-Chinese: 中文的GPT2训练代码，可以写诗，新闻，小说，或是训练通用语言模型 (gitee.com)

其中代码的分词部分直接使用的是按字分词

gpt2生成的结果与bert类似。gpt2使用了隐藏层的最后一层的最后一个序列作为对下一个token的预测基础

再此基础上，通过增加nn.Linear(config.n_embd, config.vocab_size, bias=False)来进行维度和token字库数量保持一致

关于在输出词的选择上，并非直接使用最大概率的token作为预测结果，而是使用如下内容：

torch.multinomial(F.softmax(filtered_logits, dim=-1), num_samples=1)进行概率分布式的预测。即增加了随机性，由对返回的概率加权使用。后续根据使用情况做进一步的判断。目前对已经被分享出来的模型效果满意度不是很高。而对于下一步要验证的内容，很难收集到相关的数据，有点限于停止。郁闷半分钟

跟人对于gpt2/gpt3等总结：在大数据量的训练下，模型的各个任务都会产生互补式的效果叠加。原因是一位大神的结论：数据的特征天然就存在于数据本身，和任务无关。这也是模型在学会了一个任务后对其他任务也是有很大的帮助。

但是其对应的前提条件是数据量够大。在数据量有限的情况下，小公司或许更应该专注于小模型的垂直开发，或基于已经开源的通过模型的二次调优。

会发paper的学渣

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
关于gpt2生成的训练验证

gpt2生成的训练验证的感想
复制链接

扫一扫

专栏目录

会发paper的学渣 CSDN认证博客专家 CSDN认证企业博客

码龄13年

190: 原创

5万+: 周排名

2万+: 总排名

31万+: 访问

: 等级

2174: 积分

149: 粉丝

201: 获赞

89: 评论

910: 收藏

私信

关注

热门文章

分类专栏

elasticsearch 16篇
深度学习基础 24篇
tensorflow2.x 39篇
NLP 29篇
搜索 9篇
推荐 17篇
大模型 1篇
linux 8篇
python3 23篇
问题
模型训练 4篇
ocr 1篇
联想 2篇
neo4j 1篇
知识图谱 7篇
kafka 2篇
tfrs 1篇
pandas 2篇
加密算法 2篇
springcloud 1篇
awk 1篇
springboot继承 1篇
大数据算法 4篇
传统算法
札记 11篇
spark学习 3篇

最新评论

basicsr 安装问题
sad209: pip install torch=这里少了个等于号2.1.2 torchvision==0.16.2 -i https://download.pytorch.org/whl/cu118
elasticsearch 关于向量化检索
普通网友: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
cube-studio 部署过程
源泉775: 道友，你弄出来了吗
wave2lip训练
weixin_45561370: 你好，请问一下你生成那三个文件了吗
数据集下载渠道汇总
m0_62196601: https://computenest.console.aliyun.com/user/dataset/cn-hangzhou 阿里云的「计算巢」产品现已更新，增添了多个热门中文数据集，以便大家能够更便捷地进行数据分析和机器学习项目。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

会发paper的学渣 您的鼓励和将是我前进的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。