4月
1.阅读提炼educhat论文要点,详见https://blog.csdn.net/m0_63170595/article/details/138152568?spm=1001.2014.3001.5502
2.总结小学数学知识点,详见小学数学知识点-CSDN博客
3.学习docker,配置相关环境。详见Docker学习-CSDN博客
4.部署docker compose,wsl,windows terminal,并在此基础上尝试部署freegpt35,但由于ip问题失败。
5.学习部署gptwrapper。失败,因为openai的cloudfare,项目无法正常运作。
6.尝试free_chat_gpt项目,成功。此项目提供了一个免费的gpt3.5 api,让我们可以开始着手使用gpt对数据集打标签。
7.探索、学习、熟悉魔搭社区
8.
开始重新设计文本分类程序,学习提示词工程,重新编写文本分类程序,将以前的思路推倒准备重来。提示词工程笔记见提示词工程-CSDN博客
9.调试文本分类程序,优化了额度损耗,捕捉解决异常问题
5月
1.清洗数据,探索如何在云平台上训练数据。
学习swift框架,发现可能会非常好用。
大概流程是这样的:
(1)本地处理好数据集以后上传托管到modelscope
(2)使用swift 命令行 加点参数 微调训练模型
(3)使用swift的推送命令将训练后的权重文件/模型推送到model hub上(同时尝试看能否做到本地下载)
数据集构建 instruction input output三个
可以将数据集直接放到data文件夹下?不知道swift行不行 也许可以直接上传数据集后使用自己的数据集(path),数据集中的key值应该都是不能随便改的,由dataset.info文件确定的。
2.学习如何使用ModelScope。笔记详见ModelScope 笔记-CSDN博客