昇思25天学习打卡营第19天|xkd007|LLM原理和实践（2）基于MindSpore的GPT2文本摘要

冷酷的AI

于 2024-07-12 23:09:11 发布

阅读量41

点赞数

文章标签：学习

原文链接：https://cloud-f80f7f65-2606-4da3-a5ba-e59efcb47041.xihe.mindspore.cn/lab/tree/%E5%BA%94%E7%94%A8%E5%AE%9E%E8%B7%B5/LLM%E5%8E%9F%E7%90%86%E5%92%8C%E5%AE%9E%E8%B7%B5/%E5%9F%BA%E4%BA%8EMindSpore%E7%9A%84GPT2%E6%96%87%E6%9C%AC%E6%91%98%E8%A6%81.ipynb

版权

1 数据集加载与处理

数据集加载

本次实验使用的是nlpcc2017摘要数据，内容为新闻正文及其摘要，总计5000个样本。

数据预处理

原始数据格式：

article: [CLS] article_context [SEP]
summary: [CLS] summary_context [SEP]

预处理后的数据格式：

[CLS] article_context [SEP] summary_context [SEP]

2 模型构建

构建GPT2ForSummarization模型，注意shift right的操作。
动态学习率

3 模型训练

4 模型推理

数据处理，将向量数据变为中文数据。

（以上代码详原文链接）

原文链接：基于MindSpore的… - JupyterLab

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。