AutoModel中模型CroissantLLMChat的使用

hehui0921

已于 2024-02-13 12:35:04 修改

阅读量190

点赞数 1

分类专栏： huggingface 文章标签：深度学习人工智能 pytorch

于 2024-02-13 10:38:52 首次发布

本文链接：https://blog.csdn.net/oHeHui1/article/details/136105631

版权

huggingface 专栏收录该内容

33 篇文章 0 订阅

订阅专栏

本文展示了如何使用HuggingFace的transformers库，特别是模型`croissantllm/CroissantLLMChat-v0.1`，在CPU版本下生成对话内容，以提供冬季在马赛可能的活动建议。

摘要由CSDN通过智能技术生成

cpu版本。

from transformers import AutoTokenizer, AutoModel
from huggingface_hub.hf_api import HfFolder

HfFolder.save_token('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')


import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "croissantllm/CroissantLLMChat-v0.1"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16, device_map="auto")

chat = [
   {"role": "user", "content": "Que puis-je faire à Marseille en hiver?"},
]

chat_input = tokenizer.apply_chat_template(chat, tokenize=False, add_generation_prompt=True)

inputs = tokenizer(chat_input, return_tensors="pt", add_special_tokens=True).to(model.device)
tokens = model.generate(**inputs, max_new_tokens=150, do_sample=True, top_p=0.95, top_k=60, temperature=0.3)
print(tokenizer.decode(tokens[0]))