全面解析开源大语言模型：BLOOM_bloom 模型，阿里出品

最新推荐文章于 2024-06-19 16:01:00 发布

2401_84267585

最新推荐文章于 2024-06-19 16:01:00 发布

阅读量835

点赞数 30

分类专栏： 2024年程序员学习文章标签：开源语言模型人工智能

本文链接：https://blog.csdn.net/2401_84267585/article/details/137800269

版权

2024年程序员学习专栏收录该内容

59 篇文章 0 订阅

订阅专栏

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7

深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年最新Golang全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上Go语言开发知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

如果你需要这些资料，可以添加V获取：vip1024b （备注go）

正文

配置工作区

BLOOM 模型是资源密集型的，因此正确配置工作区至关重要，主要步骤如下所述。

首先，Transformer 库用于提供用于处理 BLOOM 模型和其他基于 transformer 的节点的接口。

pip install transformers -q

使用 nvidia-smi，我们检查可用 GPU 的属性，以确保我们拥有运行模型所需的计算资源

nvidia-smi

GPU 属性

我们从 transformers 和 torch 中导入所需的模块。torch 用于设置默认张量类型以利用 GPU 加速。

然后，由于我们使用的是 GPU，因此使用 set_default_tensor_type 函数设置 torch 库以确保使用 GPU。

from transformers import AutoModelForCausalLM, AutoTokenizer, set_seed
import torch
torch.set_default_tensor_type(torch.cuda.FloatTensor)

使用 BLOOM 模型

正在使用的目标模型是 70 亿参数的 BLOOM 模型，可以从 bigscience/bloom-1b7 下的 BigScience 的 Hubbing Face 存储库访问它，该存储库对应于模型的唯一标识符。

model_ID = “bigscience/bloom-1b7”

接下来，我们从 Hugging Face 加载预训练的 BLOOM 模型和分词器，并使用具有任意数字的 set_seed 函数为可重复性设置种子。数字本身的值并不重要，但使用非浮动值很重要。

model = AutoModelForCausalLM.from_pretrained(model_ID, use_cache=True)
tokenizer = AutoTokenizer.from_pretrained(model_ID)
set_seed(2024)

现在，我们可以定义要生成的故事的标题以及提示。

story_title = ‘An Unexpected Journey Through Time’
prompt = f’This is a creative story about {story_title}.\n’

最后，我们将提示标记化并映射到适当的模型设备，然后在解码后生成模型的结果。

input_ids = tokenizer(prompt, return_tensors=“pt”).to(0)

sample = model.generate(**input_ids,
max_length=200, top_k=1,
temperature=0, repetition_penalty=2.0)

generated_story = tokenizer.decode(sample[0], skip_special_tokens=True)

最终结果使用 textwrap 模块进行格式化，以确保每行的最大字符数为 80 个，以提高可读性。

import textwrap
wrapper = textwrap.TextWrapper(width=80)

最终结果如下：

图片2.png

使用 BLOOM 模型生成的故事

只需几行代码，我们就能够使用 BLOOM 模型生成有意义的内容。

预期用途和范围外用途

像所有技术进步一样，BLOOM也有自己的一套合适和不合适的应用程序。本节深入探讨了其适当和不适当的用例，重点介绍了哪些方面可以最好地利用其功能，哪些地方建议谨慎行事。了解这些界限对于负责任和有效地利用 BLOOM 的潜力至关重要。

BLOOM的预期用途

BLOOM 是一个多功能工具，旨在突破语言处理和生成的界限。它的预期用途跨越各个领域，每个领域都利用其广泛的语言功能。

**多语言内容生成：**BLOOM 精通 59 种语言，擅长创造多样化和包容性的内容。这种能力在全球传播、教育和媒体中尤为重要，在这些领域，语言包容性至关重要。
**编码和软件开发：**BLOOM在编程语言方面的培训将其定位为软件开发的资产。它可以协助完成代码生成、调试等任务，并作为新程序员的教育工具。
**研究与学术：**在学术界，BLOOM 是语言分析和 AI 研究的强大资源，提供对语言模式、AI 行为等的见解。

超出 BLOOM 的范围使用

了解 BLOOM 的局限性对于确保其合乎道德和实际应用至关重要。一些用例超出了 BLOOM LLM 的适用范围，主要是出于道德考虑或技术限制。

**敏感数据处理：**BLOOM 并非专为处理敏感个人数据或机密信息而设计。此类数据可能侵犯隐私或滥用，因此不适合用于这些目的。
**高风险决策：**不建议在需要关键准确性的场景中使用 BLOOM，例如医疗诊断或法律决策。与大多数大型语言模型一样，该模型的局限性可能会导致这些敏感领域的不准确或误导性结果。
**人机交互替代：**BLOOM不应被视为人际互动的替代品，尤其是在需要情商的领域，如咨询、外交或个性化教学。该模型缺乏人类互动提供的细致入微的理解和同理心。

直接和间接用户

BLOOM 作为一种先进的大型语言模型（LLM），提供了广泛的优势，可以扩展到各种用户群。它的能力不仅直接影响某些专业人士和部门，而且具有更广泛的影响，间接影响更广泛的利益相关者。

对 BLOOM 用户的探索旨在强调不同群体如何利用这一创新工具并受到其影响。

通过了解 BLOOM 的直接和间接用户，我们可以欣赏该模型的广泛影响力以及它为推动技术和社会进步做出贡献的多种方式。

BLOOM的直接用户

**开发人员和数据科学家：**软件开发和数据科学领域的专业人士是主要用户。他们利用 BLOOM 完成编码辅助、调试和数据分析等任务。
**研究人员和学者：**该小组包括语言学家、人工智能研究人员和学者，他们使用 BLOOM 进行语言研究、人工智能行为分析和推进 NLP 研究。
**内容创作者和翻译人员：**作家、记者和翻译人员使用 BLOOM 生成和翻译不同语言的内容，从而提高他们的工作效率和影响力。

BLOOM的间接用户

**企业和组织：**各行各业的公司通过增强的人工智能驱动服务、改进的客户互动和高效的数据处理，间接受益于 BLOOM。
**教育机构：**学生和教育工作者通过教育工具和资源间接体验 BLOOM 的好处，这些工具和资源结合了其语言处理能力进行学习和教学。
**公众：**更广泛的社区通过改进的技术体验、访问多语言内容和增强的软件应用程序成为 BLOOM 的间接受益者。

道德考虑和限制

与任何大型语言模型（LLM）一样，BLOOM 的部署会带来一系列伦理方面的考虑和限制。这些方面对于了解负责任的使用和预测该技术的更广泛影响至关重要。本节介绍与使用 BLOOM 相关的伦理影响、风险和固有限制。

道德考量

**数据偏差和公平性：**主要的伦理问题之一是 BLOOM 有可能延续或放大其训练数据中存在的偏见。这可能会影响其输出的公平性和中立性，从而在公正处理至关重要的情况下导致道德挑战。
**隐私问题：**虽然 BLOOM 没有明确设计用于处理敏感的个人信息，但其庞大的训练数据可能会无意中包含此类信息。如果 BLOOM 基于敏感数据生成输出或泄露敏感数据，则存在侵犯隐私的风险。

与使用相关的风险

**错误信息和操纵：**BLOOM 的高级功能可能会被滥用于生成误导性信息或操纵性内容，从而在媒体、政治和舆论等领域构成重大风险。
**依赖和技能退化：**过度依赖 BLOOM 来完成内容创作或翻译等任务可能会导致人类这些技能的退化，从而影响创造力和语言能力。

BLOOM的局限性

**上下文理解：**尽管 BLOOM 很复杂，但它可能缺乏某些任务所需的深刻背景和文化理解，导致在细微的场景中出现不准确或不适当的输出。
**语言的演变性质：**BLOOM在静态数据集上的训练意味着它可能无法跟上语言不断发展的步伐，包括新的俚语、术语或文化参考。

现实世界的影响和争议

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以添加V获取：vip1024b （备注Go）

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！
时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。**

需要这份系统化的资料的朋友，可以添加V获取：vip1024b （备注Go）
[外链图片转存中…(img-L9c7CxNR-1713196228148)]

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

2401_84267585

关注

30
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
全面解析开源大语言模型：BLOOM_bloom 模型，阿里出品

接下来，我们从 Hugging Face 加载预训练的 BLOOM 模型和分词器，并使用具有任意数字的 set_seed 函数为可重复性设置种子。BLOOM 作为一种先进的大型语言模型（LLM），提供了广泛的优势，可以扩展到各种用户群。它的能力不仅直接影响某些专业人士和部门，而且具有更广泛的影响，间接影响更广泛的利益相关者。通过了解 BLOOM 的直接和间接用户，我们可以欣赏该模型的广泛影响力以及它为推动技术和社会进步做出贡献的多种方式。正在使用的目标模型是 70 亿参数的 BLOOM 模型，可以从。
复制链接

扫一扫