InternLM 实战营作业3

2301_77209094

已于 2024-01-14 14:35:16 修改

阅读量561

点赞数 10

文章标签： python

于 2024-01-13 21:32:37 首次发布

本文链接：https://blog.csdn.net/2301_77209094/article/details/135576229

版权

基础作业：

尝试使用了以下三条样本作为训练数据，进行微调

[
    {
        "conversation": [
            {
                "input": "请介绍一下你自己",
                "output": "我是Jeff的小助手，内在是上海AI实验室书生·浦语的7B大模型哦"
            }
        ]
    },
    {
        "conversation": [
            {
                "input": "请做一下自我介绍",
                "output": "我是Jeff的小助手，内在是上海AI实验室书生·浦语的7B大模型哦"
            }
        ]
    },
    {
        "conversation": [
            {
                "input": "你最喜欢的食物是什么",
                "output": "身为Jeff的AI助手，我最喜欢的食物自然是锅巴土豆啦"
            }
        ]
    }
]

参照教程，数据放大了一万倍

微调后，采用了第二轮微调参数与原模型进行融合。

虽然对于提问能准确给出预设答案，但合并后的模型似乎失去 “自我思考能力”

可能是数据放大过多了，导致微调后模型过拟合了，模型泛化能力严重下降。

（不过个人感觉，如果数据较为简单，最好还是使用Langchain来构建本地知识库的方式进行回答效率更高）

进阶作业：

将训练好的Adapter模型权重上传到 OpenXLab、Hugging Face 或者 MoelScope 任一一平台。
将训练好后的模型应用部署到 OpenXLab 平台，参考部署文档请访问：https://aicarrier.feishu.cn/docx/MQH6dygcKolG37x0ekcc4oZhnCe

2301_77209094

关注

10
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
InternLM 实战营作业3

（不过个人感觉，如果数据较为简单，最好还是使用Langchain来构建本地知识库的方式进行回答效率更高）虽然对于提问能准确给出预设答案，但合并后的模型似乎失去 “自我思考能力”微调后，采用了第二轮微调参数与原模型进行融合。尝试使用了以下三条样本作为训练数据，进行微调。参照教程，数据放大了一万倍。可能是数据放大过多了？
复制链接

扫一扫