探索知识神经元：预训练变换器的开放源代码实现

侯深业Dorian

于 2024-06-17 09:32:09 发布

阅读量246

点赞数 4

本文链接：https://blog.csdn.net/gitblog_00093/article/details/139732558

版权

探索知识神经元：预训练变换器的开放源代码实现

knowledge-neuronsA library for finding knowledge neurons in pretrained transformer models.项目地址:https://gitcode.com/gh_mirrors/kn/knowledge-neurons

在人工智能领域，预训练模型已经成为理解和生成自然语言的关键工具。然而，这些模型是如何存储和处理信息的呢？这就是Dai等人2021年提出的“知识神经元”（Knowledge Neurons in Pretrained Transformers）的研究所在。现在，这个开创性的概念已经被转化为一个名为knowledge-neurons的开源项目，让我们有机会更深入地研究预训练模型的工作原理。

项目介绍

knowledge-neurons是一个基于Huggingface Transformers库的工具，它实现了查找和操纵预训练模型中“知识神经元”的方法。当前，项目支持BERT和GPT-Neo系列模型，提供了一种探索模型内部知识的新途径。通过定位与特定知识相关的神经元，并对其进行操作，我们可以观察到模型预测行为的变化，从而揭示其内在的推理机制。

项目技术分析

该项目采用集成梯度（Integrated Gradients）技术来识别与特定事实相关的一组神经元，即所谓的“知识神经元”。之后，可以对这些神经元进行增强或抑制，以观察模型的反应。比如，在填充句子任务中，当知识被抑制时，模型可能无法正确预测填空；而知识被增强时，模型预测正确结果的可能性增加。此外，项目还提供了删除或修改这些神经元权重的功能，以便进一步探究模型的可塑性。