- 博客(2)
- 收藏
- 关注
原创 MCP协议开发(基于python)指南
MCP(Model Context Protocol)是一项革命性技术,它为 AI 应用提供了标准化接口,让大语言模型(LLM)能够轻松访问外部工具、数据和系统。想象一下 USB 如何标准化了设备连接,MCP 就是 AI 世界的"万能接口"。如何让 AI 与你的系统安全、高效地交互。无需复杂的自定义接口,MCP 提供了一套统一标准,显著降低了开发成本和技术门槛。MCP 开发正在改变 AI 应用的格局,它使 AI 从简单的对话机器人转变为能够实际行动和解决问题的助手。
2025-04-12 22:14:10
1629
原创 关于微调的模型(qwen,GLM4)的一些感想
最近,我深入研究了用 LoRA 和 QLoRA 进行指令微调,经过几次实验,收获颇丰。我把一些发现和大家分享,希望能对你们有所帮助。LoRA 的秩设置:如果你觉得秩越高模型就会越好,那你错了。高秩会导致过拟合,在大多数情况下,较低的秩(r=8/16)就足够了。Dropout 并不万能:很多人认为在 LoRA 适配器中添加 dropout 能防止过拟合,但事实证明,这并不有效,反而可能会拖累性能。适配器的位置:在模型的所有线性层中添加 LoRA 适配器,能带来最好的性能提升。学习率计划:调整学习率非常关键。恒
2024-06-20 04:12:24
577
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人