中文AI写作分享

最新推荐文章于 2024-08-20 17:42:22 发布

强强学习

最新推荐文章于 2024-08-20 17:42:22 发布

阅读量1.1k

点赞数 1

文章标签：人工智能 transformer 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_47532216/article/details/123073762

版权

文章目录

1. 架构
2. 数据来源
3. 模型下载和使用

1. 架构

2021监督学习方案，自己从头训练
- 基于Transformer的encoder-decoder
- transformer使用keras-transformer lib
2022迁移学习方案，使用T5 finetune
- 预训练使用澜舟科技的孟子 T5
- 理论上可以把诗歌和对联两个合起来作为multi-task下游任务，但是对联有很多是现代白话文，古文我只用了唐诗宋词，所以最后还是分开
- 只训练了3-4个epoch，看loss的下降速度应该还有很大提升空间

2. 数据来源

唐诗宋词 https://github.com/chinese-poetry/chinese-poetry
- 2021 transformer 只训练标题 -> 诗歌
- 2022 T5 方案考虑了标题 -> 诗歌，或者标题+诗人 -> 诗歌
- 标题长度限制12token，诗人4token，诗歌64token，结尾用句号，具体参考training下面的notebook
对联 https://github.com/wb14123/couplet-dataset
- 标准输入输出，T5使用对联：前缀，长度限制32字符

参考链接为：https://github.com/hululuzhu/chinese-ai-writing-share

3. 模型下载和使用

推荐参考inference下面的notebook来参考使用，模型下载地址也在notebook介绍
重要：模型文件存在Google Drive，推荐用Google账号打开，点击Add to shortcut，之后在你Drive的主页面shared with me看到目录后选择add shortcut to Drive，这样可以mount后本地可以操作文件
模型参数大小
2021 Transformer 对联 ~80M
2021 Transformer 写诗 ~10M
2022 T5 ~250M

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。