本地部署 Dolly V2

1. 什么是 Dolly V2

Databricks的dolly-v2-12b,是一个在 Databricks 机器学习平台上训练的指令跟随型大型语言模型,被授权用于商业用途。基于 pythia-12b,Dolly 在大约 15000 条指令/响应微调记录 databricks-dolly-15k 上进行训练,这些记录由 Databricks 员工在 InstructGPT 论文中的能力领域生成,包括头脑风暴、分类、封闭式QA、生成、信息提取、开放式QA和总结。dolly-v2-12b 不是一个最先进的模型,但确实表现出令人惊讶的高质量指令跟随行为,这是它所基于的基础模型的特点。

2. Github 地址

https://huggingface.co/databricks/dolly-v2-12b

3. 安装 Miniconda3

下载 Conda 安装脚本,

wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh

运行安装脚本,

bash Miniconda3-latest-Linux-x86_64.sh

按提示操作。当提示是否初始化 Conda 时,输入 “yes”,

在这里插入图片描述

安装完成后,关闭当前终端并打开新终端,这将激活 Conda,

sudo su - root

更新 Conda 至最新版本,

conda update conda

在这里插入图片描述
在这里插入图片描述

添加必要的 Conda 通道以获取更多软件包,

conda config --add channels conda-forge
conda config --add channels defaults 

测试是否安装成功,

conda list

如果显示 Conda 及其内部包的列表,则说明安装成功。

4. 创建虚拟环境

conda create -n dolly python==3.10.4
conda activate dolly

5. 部署 Dolly V2

git lfs install
git clone https://huggingface.co/databricks/dolly-v2-12b
pip3 install "accelerate>=0.16.0,<1" "transformers[torch]>=4.28.1,<5" "torch“

6. 编写测试程序

cat << EOF > dolly.py
import torch
from transformers import pipeline

generate_text = pipeline(model="databricks/dolly-v2-12b", torch_dtype=torch.bfloat16, trust_remote_code=True, device_map="auto")

text = "how could i get up early?"
print("Question:" + text)
resp = generate_text(text)
print("Dolly's Answer:")
print(resp[0]["generated_text"])
EOF

7. 运行测试程序

python dolly.py

输出结果示例,

Question:how could i get up early?
Dolly's Answer:
Here are some ways to get up early:
1. Sleep until the morning
2. Wait for the sunrise
3. Wake up at the time when the birds are chirping
4. Turn on some good music
5. Light some candles

完结!

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: dolly-v2-12b 数据集是一个用于语音识别任务的数据集,由于其广泛应用,现在网上已经有很多可供下载的途径。以下是一些途径供参考: 1. GitHub dolly-v2-12b 数据集的一份完整备份可以在 GitHub 上找到,可以直接下载或者通过 Git 命令进行克隆。 2. Kaggle kaggle 是一个以数据为基础的社区平台,提供各种数据集供用户下载。dolly-v2-12b 数据集也可以在 Kaggle 上找到并下载。 3. Google Drive 一些学者可能会将数据集上传至 Google Drive 并分享下载链接。搜寻一下相关的共享链接,即可下载得到该数据集。 需要注意的是,在下载数据集的过程中,一定要选择可信的来源,以避免下载到潜在的病毒或恶意程序。同时,最好事先重复检验文件的完整性和正确性,以确保在使用该数据集时准确可靠。 ### 回答2: Dolly-v2-12b是一个用于人脸识别和图像检索任务的数据集,涵盖了各种人物和场景的图片。要下载这个数据集,首先你需要找到合适的资源站点。可以通过搜索引擎进行查找,在网页上输入“Dolly-v2-12b下载”,就可以找到多个可供下载的资源站点。建议选择官方或知名的站点下载,以确保数据集的完整性和可靠性。其中,一些站点可能需要你注册账号或付费才能获得下载权限,需要根据自己情况选择合适的方式。另外,在下载之前,记得仔细阅读数据集的使用说明和许可协议,以确保你的研究和应用符合相关的规定。 ### 回答3: dolly-v2-12b数据集可以在互联网上找到,但如果要快速下载,最好使用百度网盘或其他云存储服务。用户可以搜索dolly-v2-12b数据集,并在搜索结果中找到可用的下载链接。在下载之前,用户应该确保所选的链接是可靠和安全的。一些学术机构或研究机构也可能提供该数据集的下载链接,这些机构通常会要求用户填写特定的表格或提交申请以获取数据集的访问权限。用户还可以考虑使用下载管理器和断点续传功能,以便在网络连接中断时恢复下载进度。总之,找到可靠的下载链接和使用高效的下载工具是从互联网上快速下载dolly-v2-12b数据集的关键。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值