gpt-4chan 运行笔记

本文介绍了如何下载和验证GPT-4chan模型文件的完整性,包括从网盘和git仓库下载,以及使用MD5校验。探讨了模型的微调机制,实践了模型的加载和运行,展示了在GPU上运行所需资源,以及prompt格式对生成结果的影响。
摘要由CSDN通过智能技术生成


GPT-4chan是一个脏话回帖机器人,由著名的油管主播yk编写,在某reddit频道的大量帖子与回复上训练。接下来,本文会找到GPT-4chan的模型文件,并用它运行一些样例。

下载模型

GPT-4chan的项目页面位于hugginface的ykilcher/gpt-4chan,但公告显示,由于违反互联网协议,模型的下载已被禁用。笔者探索了两种下载模型文件的方法:搜索网盘分享,或搜索网友提供的git仓库。

确定下载目标

参考huggingface的说明文档:

  1. serialization的serialization-best-practices一章
  2. model_sharing

忽略推断步骤,直接说明结论。你需要在某个文件夹里准备好pytorch_model.binconfig.json这两个文件,其中前者是模型权重,后者是模型配置。

下载途径1 网盘分享

本人在模型的讨论区中看到habdhzim的如下回答。可见,该网友将CPU与GPU版本的模型文件都上传到了网盘archive.org。

Meanwhile, it is possible to download the model by torrent.
CPU version: https://archive.org/details/gpt4chan_model
GPU version: https://archive.org/details/gpt4chan_model_float16

点击GPU版本的链接,会进到文件主页,我们要下载的文件是pytorch_model.bin

点击"SHOW ALL"跳转到文件详情,再点击.bin文件下载之。不建议通过.torrent文件下载,本人试过速度较慢。

如果你试图让huggingface直接加载这个.bin文件,会得到报错"缺少config.json文件",因为完整的模型文件夹应当包含.bin和config.json两个文件。

下载途径2 git仓库

另一个可能的下载链接是Aspie96/gpt-4chan-model,它包含了模型的.bin文件以及config.json文件。

验证文件完整性

担心模型被篡改,可以下载个md5校验器,处理.bin文件得到md5值,并到huggingface的项目页面ykilcher/gpt-4chan找到作者发布的md5校验值,将两者比较:

pytorch_model.bin float32 : 833c1dc19b7450e4e559a9917b7d076a
pytorch_model.bin float16 : db3105866c9563b26f7399fafc00bb4b

笔者下载的模型文件对应float16那行的md5值,笔者校验过是相等的。

fine tune机制

GPT-4chan是如何在GPT-J的基础上进一步fine tune(微调)的?我们要了解作者是如何构建fine tune训练集的,这样才能自己构造样例。

根据

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值