gpt-4chan 运行笔记

duoyasong5907

已于 2023-01-14 01:24:43 修改

阅读量1.9k

点赞数

分类专栏： AI与ML 文章标签：深度学习人工智能 python

于 2023-01-12 07:19:24 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/duoyasong5907/article/details/128653280

版权

本文介绍了如何下载和验证GPT-4chan模型文件的完整性，包括从网盘和git仓库下载，以及使用MD5校验。探讨了模型的微调机制，实践了模型的加载和运行，展示了在GPU上运行所需资源，以及prompt格式对生成结果的影响。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

下载模型
fine tune机制
实践尝试

GPT-4chan是一个脏话回帖机器人，由著名的油管主播yk编写，在某reddit频道的大量帖子与回复上训练。接下来，本文会找到GPT-4chan的模型文件，并用它运行一些样例。

下载模型

GPT-4chan的项目页面位于hugginface的ykilcher/gpt-4chan，但公告显示，由于违反互联网协议，模型的下载已被禁用。笔者探索了两种下载模型文件的方法：搜索网盘分享，或搜索网友提供的git仓库。

确定下载目标

参考huggingface的说明文档：

serialization的serialization-best-practices一章
model_sharing

忽略推断步骤，直接说明结论。你需要在某个文件夹里准备好pytorch_model.bin和config.json这两个文件，其中前者是模型权重，后者是模型配置。

下载途径1 网盘分享

本人在模型的讨论区中看到habdhzim的如下回答。可见，该网友将CPU与GPU版本的模型文件都上传到了网盘archive.org。

Meanwhile, it is possible to download the model by torrent.
CPU version: https://archive.org/details/gpt4chan_model
GPU version: https://archive.org/details/gpt4chan_model_float16

点击GPU版本的链接，会进到文件主页，我们要下载的文件是pytorch_model.bin

点击"SHOW ALL"跳转到文件详情，再点击.bin文件下载之。不建议通过.torrent文件下载，本人试过速度较慢。

如果你试图让huggingface直接加载这个.bin文件，会得到报错"缺少config.json文件"，因为完整的模型文件夹应当包含.bin和config.json两个文件。

下载途径2 git仓库

另一个可能的下载链接是Aspie96/gpt-4chan-model，它包含了模型的.bin文件以及config.json文件。

验证文件完整性

担心模型被篡改，可以下载个md5校验器，处理.bin文件得到md5值，并到huggingface的项目页面ykilcher/gpt-4chan找到作者发布的md5校验值，将两者比较：

pytorch_model.bin float32 : 833c1dc19b7450e4e559a9917b7d076a
pytorch_model.bin float16 : db3105866c9563b26f7399fafc00bb4b

笔者下载的模型文件对应float16那行的md5值，笔者校验过是相等的。

fine tune机制

GPT-4chan是如何在GPT-J的基础上进一步fine tune(微调)的？我们要了解作者是如何构建fine tune训练集的，这样才能自己构造样例。

根据

最低0.47元/天解锁文章

博客等级

码龄9年

369
原创

613
点赞

661
收藏

1340
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

IndexError: piece id is out of range.
敲键盘的兔子: 问题解决啦，问题出在我模型文件没下全，导致补全的token没法加载，谢谢博主！
AttributeError: module ‘tensorflow._api.v2.compat.v2.__internal__‘ has no attribute ‘register_load_c
duoyasong5907: 用阿里源试试。
IndexError: piece id is out of range.
duoyasong5907: 粘贴的报错不全，私信我吧。
IndexError: piece id is out of range.
敲键盘的兔子: Traceback (most recent call last): File "/root/data1/hky24/reasoning-on-graphs/src/qa_prediction/gen_rule_path.py", line 233, in <module> gen_path = gen_prediction(args) File "/root/data1/hky24/reasoning-on-graphs/src/qa_prediction/gen_rule_path.py", line 160, in gen_prediction raw_output = generate_seq( File "/root/data1/hky24/reasoning-on-graphs/src/qa_prediction/gen_rule_path.py", line 87, in generate_seq prediction = tokenizer.batch_decode( File "/root/anaconda3/envs/rog/lib/python3.10/site-packages/transformers/tokenization_utils_base.py", line 3510, in batch_decode return [ File "/root/anaconda3/envs/rog/lib/python3.10/site-packages/transformers/tokenization_utils_base.py", line 3511, in <listcomp> self.decode( File "/root/anaconda3/envs/rog/lib/python3.10/site-packages/transformers/tokenization_utils_base.py", line 3550, in decode return self._decode( File "/root/anaconda3/envs/rog/lib/python3.10/site-packages/transformers/tokenization_utils
AttributeError: module ‘tensorflow._api.v2.compat.v2.__internal__‘ has no attribute ‘register_load_c
哈哈＃: 为什么下载2.8.0版本的时候显示没有这个版本呢？

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。