BigScience bloom模型

绀目澄清

已于 2023-02-26 23:27:57 修改

阅读量6.5k

点赞数

分类专栏： pytorch 文章标签： pytorch 人工智能 gpt-3 chatgpt python Powered by 金山文档

于 2023-02-26 22:50:58 首次发布

本文链接：https://blog.csdn.net/u013628121/article/details/129232971

版权

pytorch 专栏收录该内容

19 篇文章 5 订阅

订阅专栏

简介

项目叫 BigScience,

模型叫 BLOOM,

BLOOM 的英文全名代表着大科学、大型、开放科学、开源的多语言语言模型。

拥有 1760 亿个参数的模型.

BLOOM 是去年由 1000 多名志愿研究人员,学者在一个名为“大科学 BigScience”的项目中创建的.

BLOOM 和今天其他可用大型语言模型存在的一个主要区别：该模型可以理解多达 46 种人类语言，包括法语、越南语、普通话、印度尼西亚语、加泰罗尼亚语、13 种印度语言（如印地语）和 20 种非洲语言。超过 30% 的训练数据是英文的。该模型还可以理解 13 种编程语言。

下载部署步奏

新建一个Anaconda conda 环境,然后安装 pytorch >1.3版本

下载模型

模型下载:https://huggingface.co/bigscience

打开以后 Models 模块就可以看到它不同参数级别的模型 ,B代表英文简写亿 1B1,就代表模型的参数是1亿1千万.1B3好像丢失了下不了.

这里选择单击 bloom-1b1 模型,然后在单击 Files and versions ,下载所有文件,新建文件夹取名1b1,放里面.

加载本地模型,只要写上本地模型所在的目录

#分词

tokenizer = AutoTokenizer.from_pretrained('./1b1/')

#模型

model = AutoModelForCausalLM.from_pretrained('./1b1/')

3.运行代码,代码放到1b1父级目录

cmd调用模型代码

from transformers import AutoTokenizer, AutoModelForCausalLM
from transformers import pipeline
import torch

#从https://huggingface.co/bigscience/bloom-1b1/tree/main
#下载所有文件,放到新创建的文件夹1b1
checkpoint = "./1b1/"
tokenizer = AutoTokenizer.from_pretrained(checkpoint)#分词
model = AutoModelForCausalLM.from_pretrained(checkpoint)#模型
#设置为gpu，推理更快
device = torch.device('cuda')
model.to(device)
#device=0表示使用第一个可用的GPU
generator = pipeline(task="text-generation", model=model, tokenizer=tokenizer, device=0)



out = generator("你是谁?", max_length=30)
print(out[0]['generated_text']) #输出 "你是谁?我:她说"

因为1B1只是一个文本生成模型,你给一个短语,它接着生成.没有问答功能.而且中文生成效果也不好.

GUI调用代码

from transformers import AutoTokenizer, AutoModelForCausalLM
from transformers import pipeline
import tkinter as tk
import torch

checkpoint = "./1b1/"
#分词
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
#模型
model = AutoModelForCausalLM.from_pretrained(checkpoint)
#设置为gpu，推理更快
device = torch.device('cuda')
model.to(device)
#device=0表示使用第一个可用的GPU
generator = pipeline(task="text-generation", model=model, tokenizer=tokenizer, device=0)

def clean_string(s, substr): #substr=问题,s=回答
    s = s.replace(substr, '')
    lst = s.split(',')
    result_lst = list(set(lst))
    result_lst.sort()
    result = ','.join(result_lst) + ','
    return result


# 创建主窗口
root = tk.Tk()
root.title("Bloom:1亿3千万参数版")
root.geometry("800x600+{}+{}".format(root.winfo_screenwidth() // 2 - 400, root.winfo_screenheight() // 2 - 350))

# 创建输入框和滚动条
input_frame = tk.Frame(root)
input_label = tk.Label(input_frame, text="用户：")

input_text = tk.Text(input_frame, height=10, width=87,padx=6, pady=6)
input_scrollbar = tk.Scrollbar(input_frame)

input_text.config(yscrollcommand=input_scrollbar.set)
input_scrollbar.config(command=input_text.yview)
input_label.pack(side="left")
input_text.pack(side="left",pady=10)
input_scrollbar.pack(side="right", fill="y")
input_frame.pack()

# 创建按钮
button_frame = tk.Frame(root)

def show_text():

    #清空 Tkinter Text 组件中的文本
    output_text.delete('1.0', 'end')
    input_str = input_text.get("1.0", "end-1c")
    # 去掉最后一个换行符
    if input_str.endswith('\n'):
        input_str = input_str[:-1]
    
    out = generator(input_str, max_length=30)
    print(out[0])
    anwer = out[0]['generated_text'] #clean_string(out[0]['generated_text']) 
    output_text.insert("end",anwer)
    
button = tk.Button(button_frame, text="回答", command=show_text,width=6, height=3)
button.pack(pady=10)
button_frame.pack()

# 创建输出框和滚动条
output_frame = tk.Frame(root)
output_label = tk.Label(output_frame, text="bloom:")
output_text = tk.Text(output_frame, height=26, width=87,padx=6, pady=6)
output_scrollbar = tk.Scrollbar(output_frame)
output_text.config(yscrollcommand=output_scrollbar.set)
output_scrollbar.config(command=output_text.yview)
output_label.pack(side="left",pady=10)
output_text.pack(side="left",pady=10)
output_scrollbar.pack(side="right", fill="y")
output_frame.pack()


def copy():
    global text
    text.event_generate("<<Copy>>")

def cut():
    global text
    text.event_generate("<<Cut>>")

def paste():
    global text
    text.event_generate("<<Paste>>")

# 创建右键菜单
menu = tk.Menu(root, tearoff=0)
menu.add_command(label="复制", command=copy)
menu.add_command(label="剪切", command=cut)
menu.add_command(label="粘贴", command=paste)

# 创建右键菜单2
menu2 = tk.Menu(root, tearoff=0)
menu2.add_command(label="复制", command=copy)


# 绑定鼠标右键（第一个文本框）
def show_menu1(event):
    global text
    text = input_text
    menu.post(event.x_root, event.y_root)

input_text.bind("<Button-3>", show_menu1)

# 绑定鼠标右键（第二个文本框）
def show_menu2(event):
    global text
    text = output_text
    menu2.post(event.x_root, event.y_root)

output_text.bind("<Button-3>", show_menu2)

# 创建按钮
button_frame = tk.Frame(root)
button = tk.Button(button_frame, text="回答", command=show_text,width=6, height=3)
# 响应回车键 绑定 <Return> 事件
root.bind("<Return>", lambda event: show_text())



root.lift()
# 运行主循环
root.mainloop()

生成300字效果

中英翻译效果不堪 ,诱导式

问答

绀目澄清

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
4
评论
BigScience bloom模型

BLOOM 的英文全名代表着大科学、大型、开放科学、开源的多语言语言模型。BLOOM 是去年由 1000 多名志愿研究人员,学者在一个名为“大科学 BigScience”的项目中创建的.BLOOM 和今天其他可用大型语言模型存在的一个主要区别：该模型可以理解多达 46 种人类语言，包括法语、越南语、普通话、印度尼西亚语、加泰罗尼亚语、13 种印度语言（如印地语）和 20 种非洲语言。超过 30% 的训练数据是英文的。该模型还可以理解 13 种编程语言。
复制链接

扫一扫