Second Me + Ollama + Mac M2本地训练

jacky_wxl(微信同号）

已于 2025-04-11 17:41:32 修改

阅读量644

点赞数 7

分类专栏：大模型文章标签： Second Me ollama MacOS M2 bge-m3 qwen2.5 deepseek-r1

于 2025-04-10 17:45:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wxl781227/article/details/147123560

版权

大模型专栏收录该内容

49 篇文章

订阅专栏

官方版本Second Me，默认需要使用gpt-mini-4o才能正常训练，ollama使用OpenAI接口访问总是出现502错误，使用curl访问是成功的，说明OpenAI接口不兼容ollama的v1 chat接口(v1/embeddings可以正常使用)，因此训练Second Me的过程中总会在Augment Content Retention 这步失败，而这步失败的主要原因是因为GraphRag 脚本（Second-Me/lpm_kernel/L2/data_pipeline/data_prep/scripts/graphrag_indexing.sh）执行失败了，没有生成Augment Content Retention需要的Second-Me/resources/L1/graphrag_indexing_output/subjective/entities.parquet文件，为了解决本地训练的问题，我将Second Me中所有使用到OpenAI接口的地方都统一修改为使用requests来实现。

涉及的修改文件的比较多，列表如下：

修改的代码参考如下：

另外，还有一个比较重要的地方，就是tiktoken tokenizer模型的支持。

首先需要下载cl100k_base.tiktoken到本地，如：/Users/wxl/Downloads

然后按下面代码进行修改，还有其它地方也有使用到tiktoken，也需按此进行修改。

通过以上修改，可以成功完成训练。

我使用模型配置是：

国内还有以下选择，就是不修改代码的情况下：

1、直接使用doubao-1.5-pro-32k-250115或deepseek-r1模型。

2、使用pip install litellm[proxy]代理，来兼容OpenAI接口，我在本地也失败了（502错误，OpenAI接口突然不兼容了吗？）。

模型训练后，由于推理也使用了OpenAI，也需要进行修改。

具体修改代码如下：

推理效果：

为了获得更好的效果，还需要使用deepseek-r1模型，以便获取偏好和多样化数据来增强数据。

多样化数据生成中，这个过程非常慢，单个文件用了3个多小时：

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

jacky_wxl(微信同号） 喜欢作者

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。