DataWhale AI 夏令营大模型应用开发方向task04

最新推荐文章于 2024-08-27 23:41:28 发布

隐零

最新推荐文章于 2024-08-27 23:41:28 发布

阅读量158

点赞数 4

分类专栏： DataWhale AI夏令营文章标签：人工智能语言模型笔记

本文链接：https://blog.csdn.net/dxyl632956/article/details/141405286

版权

DataWhale AI夏令营专栏收录该内容

6 篇文章 0 订阅

订阅专栏

概述：本笔记用于记录对DataWhale AI 夏令营大模型应用开发的task04笔记

一、打开魔搭平台，在终端中输入指令

二、依次执行代码块中的代码

三、环境准备与模型下载

四、数据处理

加载tokenizer

定义数据处理函数

def process_func(example):
    MAX_LENGTH = 384    # Llama分词器会将一个中文字切分为多个token，因此需要放开一些最大长度，保证数据的完整性

    instruction = tokenizer(f"{example['input']}<sep>")
    response = tokenizer(f"{example['output']}<eod>")
    input_ids = instruction["input_ids"] + response["input_ids"]
    attention_mask = [1] * len(input_ids) 
    labels = [-100] * len(instruction["input_ids"]) + response["input_ids"] # instruction 不计算loss

    if len(input_ids) > MAX_LENGTH:  # 做一个截断
        input_ids = input_ids[:MAX_LENGTH]
        attention_mask = attention_mask[:MAX_LENGTH]
        labels = labels[:MAX_LENGTH]

    return {
        "input_ids": input_ids,
        "attention_mask": attention_mask,
        "labels": labels
    }

五、模型训练（省略部分代码图）

六、效果验证

七、运行streamlit查看微调以后的大模型应用

隐零

关注

4
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
DataWhale AI 夏令营大模型应用开发方向task04

概述：本笔记用于记录对DataWhale AI 夏令营大模型应用开发的task04笔记。七、运行streamlit查看微调以后的大模型应用。一、打开魔搭平台，在终端中输入指令。五、模型训练（省略部分代码图）二、依次执行代码块中的代码。三、环境准备与模型下载。加载tokenizer。
复制链接

扫一扫