5分钟，结合 LangChain 搭建自己的生成式智能问答系统

字节跳动云原生计算

已于 2023-07-27 11:30:02 修改

阅读量1.7k

点赞数

文章标签： langchain 火山引擎

于 2023-07-20 14:17:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46399686/article/details/131829313

版权

伴随大语言模型（LLM，Large Language Model）的涌现，人们发现生成式人工智能在非常多领域具有重要意义，如图像生成，书写文稿，信息搜索等。随着 LLM 场景的多样化，大家希望 LLM 能在垂直领域发挥其强大的功能。但是由于大模型在特定领域数据集的训练和时效性限制，在 LLM 的基础上构建垂直领域的产品时，需要将特定的知识库输入到大模型中来训练或者推理。

目前常用的方式有两种：微调（Fine-Tuning），提示学习（Prompt-Tuning）。前者是通过新数据集在已有模型上进一步训练，训练成本较高，时效性较差。后者在训练成本，时效性上都比较灵活。

本文将基于提示学习方式，介绍如何基于火山引擎云搜索服务和方舟平台来构建专属的智能问答系统。利用嵌入技术（embedding），通过嵌入模型，将数据集内容转化为向量，然后借助火山引擎云搜索服务 ESCloud 的向量搜索能力，将这些向量和数据保存起来。在查询阶段，通过相似度查询，匹配出关联的 topK 结果，然后将这些结果辅以提示词提供给 LLM，最终生成相应的答案。这里会从火山引擎方舟平台大模型广场中选取一个大模型作为 LLM 来推理答案。选用开源框架 LangChain 作为构建端到端语言模型应用框架，简化整个聊天模型的链路。

云搜索 VectorStore 准备

1.登录火山引擎云搜索服务，创建实例集群，集群版本选择 7.10.

2.在火山引擎方舟平台大模型广场选择合适的模型，并查看API调用说明

3.Mapping 准备

PUT langchain_faq { "mappings": { "properties": { "message": { "type": "text" }, "message_embedding": { "type": "knn_vector", "dimension":

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

字节跳动云原生计算 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。