LM 格式强制器(LM Format Enforcer):引导语言模型输出结构化数据

LM 格式强制器(LM Format Enforcer):引导语言模型输出结构化数据

lm-format-enforcerEnforce the output format (JSON Schema, Regex etc) of a language model项目地址:https://gitcode.com/gh_mirrors/lm/lm-format-enforcer

1. 项目介绍

LM Format Enforcer 是一个库,旨在确保语言模型(LLM)的输出遵循指定的数据格式,如 JSON Schema 或正则表达式。该项目不仅仅提供建议性结构输出,而是能够“强制”LLM 输出符合预期的模式。它支持本地 LLM,目前兼容 LlamaCPP 和 HuggingfaceLLM 后端,并通过处理 LLM 的输出 logit 来工作,这使得它能够支持高级生成方法,如束搜索和批处理。

2. 项目快速启动

要开始使用 LM Format Enforcer,首先确保安装了必要的依赖项:

pip install lm-format-enforcer

然后,可以使用以下代码示例来演示如何限制 LLM 生成符合 JSON Schema 结构的文本:

from pydantic import BaseModel
from lmformatenforcer import JsonSchemaParser
from lmformatenforcer.integrations.transformers import *

class Album(BaseModel):
    title: str
    artist: str
    songs: list

schema = JsonSchemaParser.parse_schema(Album)

# 假设 `my_language_model` 是你的 LLM
output = my_language_model.generate(prompt, max_length, num_return_sequences, **schema)

在上面的例子中,prompt 应该是一个提示,max_lengthnum_return_sequences 是模型生成参数,而 **schema 将 JSON Schema 对象作为额外的输入传递给模型。

3. 应用案例和最佳实践

示例1:结构化音乐专辑数据生成

假设你想让 LLM 生成一个包含歌曲列表的音乐专辑描述,你可以定义一个 JSON Schema 并使用 LM Format Enforcer 强制其遵循这个结构:

{
  "$schema": "http://json-schema.org/draft-07/schema",
  "title": "Album",
  "type": "object",
  "properties": {
    "title": {"type": "string"},
    "artist": {"type": "string"},
    "songs": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "title": {"type": "string"},
          "duration": {"type": "integer"}
        }
      }
    }
  },
  "required": ["title", "artist", "songs"]
}

然后,利用这个 schema 创建一个提示并生成结构化的专辑描述。

最佳实践

  1. 在调用 LLM 之前,始终验证 JSON Schema 是否正确。
  2. 使用启发式策略避免因 LLM 输出引起的边缘情况。
  3. 考虑结合不同的提示工程技巧来提高生成文本的鲁棒性。

4. 典型生态项目

LM Format Enforcer 可以与以下项目集成:

  • LlamaIndex: 提供了一个初始集成,简化了生成 Pydantic 对象的过程。
  • vLLM Server: 包含 LM Format Enforcer 的推理服务器,允许无需编写自定义推断代码就能使用。
  • Huggingface Transformers: 支持与 Huggingface Transformers 的无缝协作,方便处理各种 NLP 任务。

通过这些生态项目,开发者可以更轻松地将格式控制融入到现有的 NLP 工作流程中。


以上是 LM Format Enforcer 的简介及其基本用法。为了了解更多详细信息和高级功能,建议查阅项目官方文档和示例代码。

lm-format-enforcerEnforce the output format (JSON Schema, Regex etc) of a language model项目地址:https://gitcode.com/gh_mirrors/lm/lm-format-enforcer

利用 TensorFlow 训练自己的目标识别。本文内容来自于我的毕业设计,基于 TensorFlow 1.15.0,其他 TensorFlow 版本运行可能存在问题。.zip项目工程资源经过严格测试可直接运行成功且功能正常的情况才上传,可轻松复刻,拿到资料包后可轻松复现出一样的项目,本人系统开发经验充足(全领域),有任何使用问题欢迎随时与我联系,我会及时为您解惑,提供帮助。 【资源内容】:包含完整源码+工程文件+说明(如有)等。答辩评审平均分达到96分,放心下载使用!可轻松复现,设计报告也可借鉴此项目,该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的。 【提供帮助】:有任何使用问题欢迎随时与我联系,我会及时解答解惑,提供帮助 【附带帮助】:若还需要相关开发工具、学习资料等,我会提供帮助,提供资料,鼓励学习进步 【项目价值】:可用在相关项目设计中,皆可应用在项目、毕业设计、课程设计、期末/期中/大作业、工程实训、大创等学科竞赛比赛、初期项目立项、学习/练手等方面,可借鉴此优质项目实现复刻,设计报告也可借鉴此项目,也可基于此项目来扩展开发出更多功能 下载后请首先打开README文件(如有),项目工程可直接复现复刻,如果基础还行,也可在此程序基础上进行修改,以实现其它功能。供开源学习/技术交流/学习参考,勿用于商业用途。质量优质,放心下载使用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

吕岚伊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值