- 博客(362)
- 收藏
- 关注
原创 开源模型应用落地-解锁大语言模型的无限潜能
1、您是否也在迫不及待地期待在AI时代中展示自己的能力?2、您是否一直在研究如何使用开源模型?3、您是否一直在寻找将AI与业务结合的方向?4、您是否一直在寻找模型推理加速的方法?5、您是否一直在努力整合来自互联网上零散的资料?
2024-01-11 14:23:55
24544
87
原创 开源模型应用落地-Spark-TTS-从文本到声音的智能跃迁-“声”临其境(四)
本文介绍了如何将普通文章改写为双人对话式播客脚本,并利用开源TTS系统Spark-TTS实现高质量、自然流畅的长文本语音合成,提升“可听化”内容的真实感与可用性。
2025-10-10 08:30:00
5680
10
原创 开源模型应用落地-FireRedTTS2-从文本到声音的智能跃迁-“声”临其境(三)
本文介绍了如何将普通文章改写为双人播客脚本,并利用开源语音合成模型 FireRedTTS-2 高效、自然地生成富有角色感的长篇对话音频,推动内容“可听化”的落地与创新。
2025-10-09 15:21:27
6117
10
原创 开源模型应用落地-SearxNG:不止是搜索,更是你的隐私堡垒与AI外脑——工具集成开发全攻略
SearXNG 赋能大模型主动联网、精准获取实时信息,开启智能体自主求知的新时代。
2025-09-22 12:36:26
8281
4
原创 开源模型应用落地-基于ORPO的Qwen3-4B意图理解精准对齐实践(二十二)
本文利用ORPO+LoRA在Qwen3-4B上实现高效微调,一步完成意图理解与偏好对齐,让大模型真正“听懂”用户。
2025-09-10 11:06:59
7365
9
原创 开源模型应用落地-基于KTO的Qwen3-4B意图理解精准对齐实践(二十一)
本文以Qwen3-4B为基座模型,结合LLaMA-Factory框架和KTO偏好对齐算法,通过轻量化微调技术系统提升大模型在意图识别任务中的精准度,探索从“会说话”到“懂人心”的高效优化路径。
2025-09-09 12:11:43
7223
5
原创 开源模型应用落地-模型上下文协议(MCP)-让传统API无缝融入大模型生态的利器-FastAPI_MCP(十四)
FastAPI_MCP 作为一款轻量级适配工具,可在不侵入原有代码的前提下,将 FastAPI 接口自动转化为符合模型上下文协议(MCP)的服务描述,使已有业务逻辑无缝接入大模型系统,实现从自然语言指令到后端服务的闭环调用。
2025-09-03 19:00:00
7584
7
原创 开源模型应用落地-模型上下文协议(MCP)-构建AI智能体的“万能插座”-“mcp-use”高级用法(十三)
本文介绍了MCP-USE如何通过标准化通信连接大模型与现实应用,并重点探讨其结构化输出和交互式聊天模式等高级使用技巧。
2025-09-02 18:30:40
8786
10
原创 开源模型应用落地-模型上下文协议(MCP)-为AI智能体打造的“万能转接头”-“mcp-use”(十二)
通过mcp-use与外部工具的高效、灵活连接,支持动态发现与热插拔,为构建具备自主能力的智能代理提供类似USB-C的通用接口。
2025-09-01 20:00:00
10033
10
原创 开源模型应用落地-Open-WebUI-开启本地QWen3-4B部署与交互的新篇章
Open-WebUI是一个开源、可自托管的Web界面,支持通过Docker或Kubernetes便捷部署,为本地或私有化的大语言模型提供类ChatGPT的离线交互体验和全面的模型管理功能。
2025-08-26 07:30:00
13208
10
原创 开源模型应用落地-模型上下文协议(MCP)-Streamable HTTP实战(十一)
本文系统探讨了Streamable HTTP在MCP协议中的生产实践,深入分析其设计原理、性能瓶颈与优化策略,为开发者提供完整的工程落地指南。
2025-08-25 07:30:00
14288
12
原创 开源模型应用落地-安全合规篇-深度合成隐式标识的技术实现(五)
本文深入解析AI生成内容隐式标识的技术实现路径,为企业提供兼顾合规性与技术可信性的落地方案。
2025-08-20 12:28:59
16868
5
原创 开源模型应用落地-基于DPO的Qwen3-4B意图理解精准对齐实践(二十)
结合LLaMA-Factory框架与DPO算法,通过轻量化微调技术系统提升大模型在意图识别任务中的精准度,探索从“会说话”到“懂人心”的高效优化路径。
2025-08-18 08:00:00
10901
14
原创 开源模型应用落地-用LLaMA-Factory点亮Qwen3-4B的“读心术”(十九)
利用LLaMA-Factory结合LoRA技术微调Qwen3-4B模型,在有限算力下通过精细化数据与训练设计,提升AI对用户意图的理解准确率。
2025-08-13 10:03:48
16120
21
原创 开源模型应用落地-RAG优化小技巧-ParentDocumentRetriever:解决RAG上下文割裂的分层检索方案(四)
ParentDocumentRetriever通过子文档检索与父文档关联的分层策略,兼顾语义匹配精度与上下文完整性,有效解决了RAG系统中文本分块粒度难以平衡的问题。
2025-08-05 12:25:59
19664
15
原创 开源模型应用落地-RAG优化小技巧-拆解复杂问题的多步推理引擎(三)
通过问题裂变引擎将复杂问题拆解为逻辑子问题、逐层推进形成“知识雪球”的智能问答系统,有效克服传统AI的知识碎片化难题,使复杂推理更精准深入。
2025-08-01 18:17:58
28829
6
原创 开源模型应用落地-RAG优化小技巧-本地检索器驱动下的MultiQuery多视角探索与RRF智能融合(二)
通过结合自定义本地检索器、MultiQueryRetriever和RRF算法,构建高效RAG系统,实现对复杂查询的多角度理解与多源信息融合,提升私有知识检索的精准性与召回质量。
2025-07-24 21:00:00
30667
15
原创 开源模型应用落地-RAG优化小技巧-用MultiQueryRetriever解锁信息检索的多维视角(一)
MultiQueryRetriever通过让大模型从单一问题生成多个等价查询,以多元视角提升检索覆盖率,实现智能问答系统的思维跃迁。
2025-07-23 21:00:00
30801
15
原创 开源模型应用落地-qwen模型小试-Qwen3-Embedding 模型集成 vLLM 实战解析(二)
Qwen3-Embedding凭借卓越的多语言理解和文本表征能力,结合vLLM框架实现高效推理,推动语义检索和生成任务迈向新高度。
2025-07-16 19:30:00
5139
16
原创 开源模型应用落地-qwen模型小试-Qwen3-Reranker 模型集成 vLLM 实战解析(一)
本文介绍了将Qwen3-Reranker模型集成至高效推理引擎vLLM的技术方案,旨在提升大模型在信息爆炸时代下的排序效率与应用落地能力。
2025-07-15 18:29:20
6974
9
原创 开源模型应用落地-OpenAI Agents SDK-集成多个MCP Servers与Qwen3-8B模型的创新应用探索(九)
本文探讨如何结合OpenAI Agents与多MCP服务器及Qwen3-8B模型,构建高效且功能丰富的AI解决方案,以提升AI代理对外部资源的理解与操作能力。
2025-07-09 10:27:15
10437
12
原创 开源模型应用落地-OpenAI Agents SDK-集成MCP【SSE机制】与Qwen3-8B模型的创新应用探索(八)
探讨OpenAI Agents集成MCP【SSE】与Qwen3-8B模型的技术组合在智能应用中的实际场景与价值。
2025-07-08 07:00:00
10885
12
原创 开源模型应用落地-OpenAI Agents SDK-集成MCP与Qwen3-8B模型的创新应用探索(七)
探讨OpenAI Agents集成MCP与Qwen3-8B模型的技术组合在智能应用中的实际场景与价值。
2025-07-07 15:37:12
10800
4
原创 开源模型应用落地-让AI更懂你的每一次交互-Mem0集成Qdrant、Neo4j与Streamlit的创新实践(四)
在AI快速发展的背景下,Mem0结合Qdrant、Neo4j和Streamlit构建了一个具备长期记忆、个性化服务与实时推理能力的智能记忆助手,探索AI记忆系统的无限可能。
2025-07-03 15:14:10
12382
11
原创 开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-探索output_guardrail的创意应用(六)
Output Guardrail作为关键安全机制,在生成内容后进行审核与过滤,确保其安全、合规并符合预期,从而提升AI系统的可信度和稳健性
2025-07-02 07:30:00
15173
11
原创 开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-探索input_guardrail 的创意应用(五)
本文介绍 OpenAI Agents 中用于保障交互安全的 input_guardrail 工具,探讨了其工作原理与实际应用,帮助开发者提升系统的安全性和用户体验。
2025-07-01 19:45:00
15402
10
原创 开源模型应用落地-让AI更懂你的每一次交互-用LangChain、Streamlit与Redis构建AI模型的“不忘”人生(三)
在人工智能中,记忆是稀有而重要的能力,传统对话模型仅能记住最近的交互内容,但借助LangChain的ConversationSummaryBufferMemory、Redis内存数据库和Streamlit界面,构建一个具有长期记忆能力的AI对话系统。
2025-06-27 16:41:35
20478
15
原创 开源模型应用落地-让AI更懂你的每一次交互-用Redis Stack与LangChain解锁大模型的长期记忆潜能(二)
结合 Redis Stack 与 LangChain 构建外部记忆系统,以提升大型语言模型的长期记忆与持续学习能力。
2025-06-24 12:09:08
18757
8
原创 开源模型应用落地-让AI更懂你的每一次交互-mem0-QDrant-Streamlit(一)
本文介绍了为解决大型语言模型缺乏持久记忆问题而设计的智能记忆层Mem0,并将指导如何使用Streamlit搭建其测试Web UI。
2025-06-19 22:15:00
18761
10
原创 开源模型应用落地-工具使用篇-从零开始搭建Qdrant Web UI-可视化管理工具-Windows(十)
Qdrant Web UI 是一个简洁友好的可视化界面,用于简化 Qdrant 向量数据库的管理与操作,降低使用门槛。
2025-06-13 18:11:35
19691
2
原创 开源模型应用落地-语音合成-Spark-TTS-非标准词处理技巧(二)
本文探讨了Spark-TTS如何通过文本归一化方法有效处理非标准词,以提升语音合成的质量与自然度。
2025-06-11 07:00:00
14091
3
原创 开源模型应用落地-语音合成-Spark-TTS-长文本高效自然的中文语音合成体验(一)
本文详细介绍 Spark-TTS 在长文本处理方面的实际应用方法。
2025-06-10 07:00:00
20423
13
原创 开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-多Agents联动(四)
OpenAI Agents SDK 通过简化多智能体协作系统的开发流程,显著提升了任务自动化效率与系统可扩展性。
2025-06-09 07:00:00
21135
6
原创 开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-多个Tools(三)
OpenAI Agents SDK 是一个基于 Python 的强大工具集,能够帮助开发者快速构建从简单任务到复杂决策的智能代理应用,显著提升程序的智能化水平 。
2025-06-05 08:00:00
25241
14
原创 开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-function_tool(二)
OpenAI Agents SDK 是一个基于 Python 的强大工具集,能够帮助开发者快速构建从简单任务到复杂决策的智能代理应用,显著提升程序的智能化水平 。
2025-06-04 18:30:08
20364
3
原创 开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B(一)
OpenAI Agents SDK 是一个基于 Python 的强大工具集,能够帮助开发者快速构建从简单任务到复杂决策的智能代理应用,显著提升程序的智能化水平 。
2025-06-03 20:30:00
20846
3
原创 开源模型应用落地-模型上下文协议(MCP)-安全认证的创新与实践探索(十)
MCP安全认证对于保障人工智能生态系统中数据完整性、身份真实性和访问控制至关重要,本文将深入探讨其核心机制与行业实践。
2025-05-27 19:00:00
28578
11
原创 开源模型应用落地-模型上下文协议(MCP)-Context-深入解析sampling_callback机制与应用场景(九)
sampling_callback实现了模型与外部工具的高效协同,不仅突破了传统单向交互模式,还通过动态上下文扩展与状态监控为开发者提供了灵活的定制化能力。
2025-05-26 08:00:00
18343
4
原创 开源模型应用落地-模型上下文协议(MCP)-Context-深入解析message_handler机制与应用场景(八)
message_handler是MCP中实现服务端与客户端高效通信、实时反馈任务进度的核心组件。
2025-05-22 08:00:00
23750
3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅