- 博客(324)
- 收藏
- 关注

原创 开源模型应用落地-解锁大语言模型的无限潜能
1、您是否也在迫不及待地期待在AI时代中展示自己的能力?2、您是否一直在研究如何使用开源模型?3、您是否一直在寻找将AI与业务结合的方向?4、您是否一直在寻找模型推理加速的方法?5、您是否一直在努力整合来自互联网上零散的资料?
2024-01-11 14:23:55
24189
86
原创 开源模型应用落地-模型上下文协议(MCP)-Context-深入解析message_handler机制与应用场景(八)
message_handler是MCP中实现服务端与客户端高效通信、实时反馈任务进度的核心组件。
2025-05-22 08:00:00
1065
原创 开源模型应用落地-模型上下文协议(MCP)-Context-深入解析logging_callback机制与应用场景
logging_callback在MCP中实现模型调用链追踪、错误诊断与性能优化
2025-05-21 08:00:00
1863
10
原创 开源模型应用落地-模型上下文协议(MCP)-Prompt-提示词的使用逻辑(七)
通过 Model Context Protocol(MCP)中的 Prompt 提升与大型语言模型交互的效率和规范性。
2025-05-20 07:30:00
3890
14
原创 开源模型应用落地-模型上下文协议(MCP)-Resource Template-资源模板的使用逻辑(六)
Resource Template 是 MCP 中支持动态生成定制化资源的核心机制,通过参数化设计实现按需上下文注入,广泛适用于自动化运维、云计算与AI交互场景。
2025-05-19 14:19:02
4719
4
原创 开源模型应用落地-模型上下文协议(MCP)-Resources-资源的使用逻辑
深入解析MCP资源的使用逻辑,从协议规范到实战场景,探讨如何通过这一机制释放大模型的无限潜能。
2025-05-15 15:58:15
5744
3
原创 开源模型应用落地-qwen模型小试-Qwen3-8B-融合VLLM、MCP与Agent(七)
Qwen3凭借其智能体能力、MCP协议支持与高效部署特性,正加速在金融、制造、科研等多个企业场景中的落地应用,推动智能化转型与业务闭环构建。
2025-05-13 10:23:49
6693
12
原创 开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-MCP的完美融合(六)
Qwen3-8B接入MCP,实现动态地连接外部工具和服务,从而极大地增强了其处理复杂任务的能力。
2025-05-09 07:45:00
16165
6
原创 开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-Tools助力(五)
在人工智能大模型迅速发展的今天,如何让模型更智能地与外部世界交互,成为提升其实际应用能力的关键。
2025-05-08 08:30:00
19708
13
原创 开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-思考与非思考模式(四)
Qwen3通过“思考模式”与“非思考模式”的双模态架构,实现复杂推理与实时响应的灵活切换,为大语言模型在智能与效率间的平衡提供创新解法。
2025-05-07 08:30:00
20271
13
原创 开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-结构化输出(三)
通过vLLM框架高效部署QWen3-8B模型,并优化提示词工程与输出控制,实现稳定的结构化JSON生成,从而提升推理效率并拓展大模型应用场景。
2025-05-06 07:35:24
21266
10
原创 开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-Docker(二)
通过容器化技术整合高性能推理框架vLLM与Qwen3-8B模型,可实现资源高效利用、灵活部署及推理性能优化,为大模型本地化应用提供轻量化解决方案
2025-05-06 07:34:21
21692
10
原创 开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM(一)
解析Qwen3-8B与vLLM的技术协同逻辑,探讨其在复杂任务中的性能表现及落地价值。
2025-05-05 16:01:11
13670
9
原创 开源模型应用落地-qwen模型小试-Qwen3-8B-快速体验-批量推理(三)
使用Transformers的pipeline实现批量推理
2025-05-05 13:51:38
13949
7
原创 开源模型应用落地-qwen模型小试-Qwen3-8B-快速体验-pipeline方式(二)
阿里云推出国内首个集成“快思考”与“慢思考”能力的 Qwen3-8B 大语言模型,以80亿参数和 128K 上下文支持,重塑AI应用边界并助力开发者高效部署
2025-04-30 18:33:59
20174
9
原创 开源模型应用落地-qwen模型小试-Qwen3-8B-快速体验(一)
阿里云推出国内首个集成“快思考”与“慢思考”能力的 Qwen3-8B 大语言模型,以80亿参数和 128K 上下文支持,重塑AI应用边界并助力开发者高效部署
2025-04-29 14:08:11
20901
8
原创 开源模型应用落地-全能音频新纪元-Kimi-Audio-7B-Instruct-重塑多模态交互边界
月之暗面开源的Kimi-Audio-7B-Instruct模型通过多任务融合架构与创新技术,实现了全场景音频交互的突破性进展
2025-04-28 18:36:53
15842
2
原创 开源模型应用落地-语音合成-MegaTTS3-零样本克隆与多语言生成的突破
MegaTTS3以0.45亿参数实现高质量中英双语语音合成与语音克隆,为语音合成领域带来全新可能性。
2025-04-24 21:00:00
15709
6
原创 开源模型应用落地-语音合成-Spark-TTS-零样本克隆与多语言生成的突破
Spark-TTS通过单流解耦技术解决因复杂的多阶段流程难以平衡效率与自然度的问题,实现了更高效的语音合成。
2025-04-23 20:00:00
13641
11
原创 开源模型应用落地-Podcastfy-从文本到声音的智能跃迁-Docker(二)
Podcastfy通过结合生成式AI和先进TTS技术,将文字、图片、视频等多种内容智能转化为多语言音频,支持高度自定义与多样化场景应用,引领“可听化”创作新风潮并重新定义声音经济时代的内容表达方式。
2025-04-22 18:36:44
17237
6
原创 开源模型应用落地-Podcastfy-从文本到声音的智能跃迁-Gradio(一)
通过Podcastfy,结合生成式人工智能和文本转语音技术,高效将多种内容形式转换为播客音频,实现灵活和专业的表达。
2025-04-16 20:00:00
21997
16
原创 开源模型应用落地-模型上下文协议(MCP)-第三方MCP Server实战指南(五)
第三方MCP Server通过复用社区共享的能力,大幅降低了开发者集成外部工具的门槛
2025-04-14 22:00:00
20979
8
原创 开源模型应用落地-LangChain与MCP协议-集成GPT-4o构建下一代AI智能体的全栈实践(三)
LangChain集成MCP协议与GPT-4o模型,构建高效、安全且可扩展的下一代AI智能体的全栈技术路径。
2025-04-10 13:58:50
24619
8
原创 开源模型应用落地-LangChain与MCP协议-重塑AI工具调用的未来格局(二)
集成LangChain将MCP工具无缝融入Agent工作流。
2025-04-09 08:30:00
24445
14
原创 开源模型应用落地-模型上下文协议(MCP)-从数据孤岛到万物互联(一)
模型上下文协议(MCP)通过标准化的接口和交互语法,重新定义AI与物理世界的连接,提升人机协作的深度与广度。
2025-04-08 19:45:00
25942
13
原创 开源模型应用落地-Qwen2.5-Omni-7B模型-Gradio-部署 “光速” 指南(二)
集成Gradio将Qwen2.5-Omni的复杂能力封装为交互式Web应用
2025-04-07 13:12:31
26126
13
原创 开源模型应用落地-Qwen2.5-Omni-7B模型-部署 “光速” 指南
阿里巴巴开源的全模态大模型Qwen2.5-Omni-7B以其强大的多模态感知能力和创新架构,标志着人机交互的重大突破,为普惠AI时代铺平道路。
2025-04-03 19:30:00
15617
14
原创 开源模型应用落地-LangGraph101-多智能体反思协同(七)
通过反思协同,多智能体系统能够在动态环境中持续进化,实现从简单任务分配到复杂问题求解的能力升级。
2025-03-26 18:33:30
43840
9
原创 开源模型应用落地-语音转文本-whisper模型-AIGC应用探索(五)
如何处理一段完整音频并生成字幕文件,弥补上一节中模型只能处理30秒音频的局限。
2025-03-25 19:00:00
30150
9
原创 开源模型应用落地-语音转文本-whisper模型-AIGC应用探索(四)
介绍OpenAI 最新开源的Whisper-large-v3-turbo模型,并集成vLLM进行推理加速。
2025-03-24 18:40:38
28625
11
原创 开源模型应用落地-LangGraph101-多智能体协同实践(六)
LangGraph 通过图形结构将多个智能体连接在一起,形成一个可以动态反馈的合作网络,实现更深层次的合作。
2025-03-21 20:45:37
29519
12
原创 开源模型应用落地-LangGraph101-ToolNode-智能工具调度的核心枢纽
通过ToolNode组件实现了智能体与工具之间的无缝衔接。
2025-03-21 13:19:22
30658
10
原创 开源模型应用落地-shieldgemma-2-4b-it模型小试-多模态内容安全检测(一)
ShieldGemma-2-4B-IT 凭借多模态能力、低资源需求和高精度检测,成为兼顾性能与安全性的开源图像审核工具。
2025-03-19 20:00:00
30573
19
原创 开源模型应用落地-LangGraph101-探索 LangGraph人机交互-更新历史Graph状态(三)
深入解析如何通过get_state_history与update_state两大核心方法,实现对历史对话状态的精准回溯与修改。
2025-03-13 20:15:00
29748
14
原创 开源模型应用落地-LangGraph101-探索 LangGraph人机交互-编辑Graph状态(二)
通过在Agent执行流程中实时中断并修改图状态,实现人机协同的精准控制与逻辑修正,提升智能系统的灵活性和适应性。
2025-03-11 18:36:46
32190
16
原创 开源模型应用落地-LangGraph101-探索 LangGraph人机交互-添加断点(一)
通过“断点机制”实现了智能系统的可控自主性。
2025-03-05 13:18:54
29019
11
原创 开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现推理加速的正确姿势-自动前缀缓存-APC(八)
vLLM框架通过自动前缀缓存技术有效解决了大语言模型推理中的重复计算问题,显著提升了长上下文和多轮对话场景下的效率。
2025-03-04 08:30:00
28885
11
原创 开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B与vllm实现推理加速的正确姿势(三)
使用 vLLM 清晰呈现推理过程
2025-03-03 09:00:00
29913
13
原创 开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B-Docker助力-模型部署 “光速” 指南
借助Docker简化并加速DeepSeek-R1-Distill-Qwen-7B模型的部署
2025-02-24 18:41:56
34128
8
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人