适合于baichuan大模型的QA模板

最新推荐文章于 2024-08-10 00:35:27 发布

平平无奇哈斯特

最新推荐文章于 2024-08-10 00:35:27 发布

阅读量114

点赞数 3

文章标签：机器学习深度学习人工智能

本文链接：https://blog.csdn.net/m0_64636251/article/details/140966470

版权

使用Baichuan2-7B-Chat模型

官方模板

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
from transformers.generation.utils import GenerationConfig
tokenizer = AutoTokenizer.from_pretrained("baichuan-inc/Baichuan2-7B-Chat", use_fast=False, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("baichuan-inc/Baichuan2-7B-Chat", device_map="auto", torch_dtype=torch.bfloat16, trust_remote_code=True)
model.generation_config = GenerationConfig.from_pretrained("baichuan-inc/Baichuan2-7B-Chat")
messages = []
messages.append({"role": "user", "content": "解释一下“温故而知新”"})
response = model.chat(tokenizer, messages)
print(response)
"温故而知新"是一句中国古代的成语，出自《论语·为政》篇。这句话的意思是：通过回顾过去，我们可以发现新的知识和理解。换句话说，学习历史和经验可以让我们更好地理解现在和未来。

这句话鼓励我们在学习和生活中不断地回顾和反思过去的经验，从而获得新的启示和成长。通过重温旧的知识和经历，我们可以发现新的观点和理解，从而更好地应对不断变化的世界和挑战。

使用该模型来完成一系列QA pair

import pandas as pd
from tqdm import tqdm
import os
import re
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
from transformers.generation.utils import GenerationConfig

tokenizer = AutoTokenizer.from_pretrained("baichuan-inc/Baichuan2-7B-Chat", use_fast=False, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("baichuan-inc/Baichuan2-7B-Chat", device_map="auto", torch_dtype=torch.bfloat16, trust_remote_code=True)
model.generation_config = GenerationConfig.from_pretrained("baichuan-inc/Baichuan2-7B-Chat")


bot_name = "Baichuan2-7B"

output_dir = "./test_results"

if not os.path.exists(output_dir):
    os.makedirs(output_dir)

dataset = pd.read_excel("./Test_Datas.xlsx")

filename = f"{output_dir}/{bot_name}.txt"

if os.path.exists(filename):
    with open(filename, "w", encoding="utf-8") as output_file:
        output_file.truncate()  

with open(filename, "a+", encoding="utf-8") as output_file:
    for i in tqdm(range(len(dataset['Question']))):
        question = dataset['Question'][i]

        prompt = (
            "You are a multiple-choice question answering assistant. Answer the following question. Only give your choice in `ABCD`. Do not add any explanation.\n" + question
        ) 

        messages = []
        messages.append({"role": "user", "content": prompt})        
        responses = model.chat(tokenizer, messages)
        print(responses)

        output_file.write(f"Prompt {i} Response:\n{responses}\n\n")