- 博客(118)
- 资源 (6)
- 收藏
- 关注
原创 Gradio全解14——使用Gradio构建MCP的服务器与客户端(4)——Python包命令:uv与uvx实战
pip是最常用的Python包管理工具,但现在出现了一个速度更快,功能更全面强大,而且被广泛用在AI MCP管理中的包工具,那就是uv。而uvx是uv的包执行命令,下面将分别讲解并实战。
2025-10-24 22:56:48
1102
原创 Gradio全解11——Streaming:流式传输的视频应用(9)——使用FastRTC+Gemini创建沉浸式音频+视频的艺术评论家
作为对本章知识的总结,本节将实现一个综合演示:让Gemini扮演艺术评论家,对用户通过FastRTC上传的艺术作品进行点评。本节内容包括准备工作及音频图像编码器、实现Gemini音视频处理程序使用gr.Blocks替换Stream.ui。
2025-09-11 10:21:38
1552
原创 Gradio全解11——Streaming:流式传输的视频应用(8)——Gemini Live API:实时音视频连接
本节介绍Gemini Live API实时音视频连接,内容包括Live API入门讲解和Live API - WebSockets API详解。Live API入门介绍内容包括Live API技术与功能介绍、选择音频生成架构和实施方案、异步发送并接受音频示例、第三方集成应用与下一步学习建议。Live API底层使用的是WebSockets进行连接。WebSockets API详解将介绍WebSockets API概念及功能、Live API连接时的会话配置、发送与接收操作及消息类型。
2025-09-11 10:20:05
1219
原创 Gradio全解11——Streaming:流式传输的视频应用(7)——多模态Gemini模型及其思考模式
在使用FastRTC+Gemini创建实时沉浸式音频+视频演示之前,先了解下Gemini模型和它的Live API。本节先介绍Gemini模型,内容包括Gemini系列模型介绍、思考预算和思路总结的thinking模式示例。
2025-09-10 14:20:49
1303
原创 Gradio全解11——Streaming:流式传输的视频应用(5)——RT-DETR:实时端到端检测模型
在使用RT-DETR模型构建视频流目标检测系统之前,先了解下RT-DETR模型。先讲解模型的技术与架构,然后着眼于训练细节与性能表现,接着介绍其最新版本RT-DETRv2,之后通过图像目标识别示例演示其用法,最后列出下一步的学习资源。
2025-09-10 14:20:18
1115
原创 Gradio全解11——Streaming:流式传输的视频应用(3)——YOLO系列模型技术架构与实战
近年来,YOLO系列因其在计算成本与检测性能之间的有效平衡,已成为实时目标检测领域的主导技术。本节将介绍YOLO系列最流行的两个模型:YOLOv10和YOLOE,讲解技术架构并进行实战,方便读者了解著名的YOLO系列模型较新版本的区别和优势。
2025-09-09 17:12:22
1139
原创 Gradio全解11——Streaming:流式传输的视频应用(2)——Twilio:网络服务提供商
本节先讲解Twillo与TURN服务器概念,然后进行Twilio网络穿透服务实战,包括通过Twilio建立连接和使用Twilio拨打外呼电话。
2025-09-09 16:53:56
1058
原创 Gradio全解11——Streaming:流式传输的视频应用(1)——FastRTC:Python实时通信库
本章讲述流式传输的视频应用,应用部分包括三部分:基于Gradio.WebRTC+YOLO的实时目标检测,使用RT-DETR模型构建视频流目标检测系统,以及使用FastRTC+Gemini创建实时沉浸式音频+视频的艺术评论家。此外,用到的技术部分分为独立的六节讲解:Python实时通信库FastRTC,网络服务提供商Twilio,YOLO系列模型技术架构与实战,实时端到端检测模型RT-DETR、Gemini模型简介及入门实战,以及为更复杂的结合音视频的Gemini Live API实时连接。
2025-09-09 00:04:59
1324
原创 Gradio全解10——Streaming:流式传输的音频应用(7)——ElevenLabs:高级智能语音技术
本节引入ElevenLabs智能语音技术,作为更专业的语音、音频和音乐工具,后边视频应用中将用到它。它不仅能无缝替换之前的语音转换工具,还能实现更丰富复杂的语音功能;它不仅能拓展开发者的工具库,还能产生更逼真的语音甚至优美的音乐。本节内容包括ElevenLabs的核心功能与产品讲解,其旗下Eleven系列语音大模型的介绍,以及文本转语音API、语音转文本API及音乐API的使用。
2025-09-08 21:15:53
1740
原创 Gradio全解10——Streaming:流式传输的音频应用(4)——Spaces ZeroGPU:为Spaces提供动态GPU分配方案
ZeroGPU是HuggingFace Spaces平台上专为AI模型和演示优化的GPU共用基础设施,采用动态分配机制实现NVIDIA H200显卡的按需调用与释放,其主要特性包括:- 免费GPU访问:为Spaces用户提供经济高效的GPU算力支持。- 多GPU并发:支持Spaces上的单个应用同时调用多块显卡进行运算。通过ZeroGPU,开发者能创建更高效、可扩展的Space,在最大化GPU利用率的同时实现成本优化。
2025-08-06 16:20:34
1179
原创 Gradio全解10——Streaming:流式传输的音频应用(3)——HF Inference:在服务器运行推理
推理(Inference)是指使用训练好的模型对新数据进行预测的过程。由于该过程可能涉及大量计算,所以最好运行在专用服务或外部服务上。
2025-08-06 16:14:53
1267
原创 Gradio全解9——ChatInterface&Chatbot:聊天界面类与聊天机器人(5)——通过API加载、聊天历史和用户反馈
本章介绍如何使用Gradio的ChatInterface和Chatbot创建聊天机器人。聊天机器人是大型语言模型(LLMs)的一个流行应用,通过Gradio,我们可以轻松构建LLM应用并与其它用户分享,或者自己使用直观的聊天机器人界面进行开发尝试。
2025-07-27 18:34:06
1304
原创 Gradio全解9——ChatInterface&Chatbot:聊天界面类与聊天机器人(4)——返回复杂响应与直接修改Chatbot值
本章介绍如何使用Gradio的ChatInterface和Chatbot创建聊天机器人。聊天机器人是大型语言模型(LLMs)的一个流行应用,通过Gradio,我们可以轻松构建LLM应用并与其它用户分享,或者自己使用直观的聊天机器人界面进行开发尝试。
2025-07-27 18:30:49
767
原创 Gradio全解9——ChatInterface&Chatbot:聊天界面类与聊天机器人(3)——ChatInterface的多模态功能与附加输入输出
本章介绍如何使用Gradio的ChatInterface和Chatbot创建聊天机器人。聊天机器人是大型语言模型(LLMs)的一个流行应用,通过Gradio,我们可以轻松构建LLM应用并与其它用户分享,或者自己使用直观的聊天机器人界面进行开发尝试。
2025-07-27 18:21:42
1080
原创 Gradio全解8——ChatInterface&Chatbot:聊天界面类与聊天机器人(2)——ChatInterface的自定义函数和界面
本章介绍如何使用Gradio的ChatInterface和Chatbot创建聊天机器人。聊天机器人是大型语言模型(LLMs)的一个流行应用,通过Gradio,我们可以轻松构建LLM应用并与其它用户分享,或者自己使用直观的聊天机器人界面进行开发尝试。本章主要包括两部分内容:第一部分内容和gr.ChatInterface相关,包括ChatInterface类示例与构造参数,ChatInterface的自定义函数和界面,多模态和附加输入输出,返回复杂响应与直接修改Chatbot值,通过API加载聊天机器人、聊天历
2025-07-27 18:15:53
1326
原创 Gradio全解7——Additional Features:附加特性(上)
本篇介绍Gradio的补充特性功能,这些功能辅助Interface/Blocks实现更绚丽效果和更多功能。本章补充特性主要包括队列、输入输出流、提示及进度条、批处理函数、嵌入托管Spaces、访问网络请求和Analytics应用分析、授权OAuth、安全访问文件和资源清理,内容较多请保持耐心,下面逐一讲述。
2025-07-04 19:49:39
1090
原创 Gradio全解13——MCP协议详解(6)——MCP服务器构建、测试与示例大全
MCP是当前人工智能领域最热门技术之一,是实现大模型快速应用的捷径。本章将基于MCP最新方案修订版:2025-06-18,详细讲解MCP协议细节,内容包括MCP协议介绍与架构组件、MCP能力协商与通信机制、TypeScript介绍:特点、适用领域与实战、TypeScript包命令npm与npx、Python包命令uv与uvx、MCP服务器构建测试与示例大全、MCP客户端、六大功能特性和调试工具MCP Inspector。
2025-07-01 16:06:52
1074
原创 Gradio全解13——MCP协议详解(5)——Python包命令:uv与uvx实战
MCP是当前人工智能领域最热门技术之一,是实现大模型快速应用的捷径。本章将基于MCP最新方案修订版:2025-06-18,详细讲解MCP协议细节,内容包括MCP协议介绍与架构组件、MCP能力协商与通信机制、TypeScript介绍:特点、适用领域与实战、TypeScript包命令npm与npx、Python包命令uv与uvx、MCP服务器构建测试与示例大全、MCP客户端、六大功能特性和调试工具MCP Inspector。
2025-07-01 16:05:16
1055
原创 Gradio全解14——使用Gradio构建MCP的客户端与服务器(3)——使用Gradio Docs MCP服务器
本章将使用使用Gradio构建多种形式的MCP客户端与服务器。首先,使用FastMCP构建服务器,使用ChatBot构建MCP客户端。然后,讲解生成MCP服务器的其他方案,包括:利用Gradio参数直接生成MCP服务器、转换现有Space项目以及自定义MCP服务器方案。最后,用一个文档式MCP服务器讲解其它配置。
2025-06-29 11:40:38
1164
原创 Gradio全解14——使用Gradio构建MCP的客户端与服务器(2)——使用Gradio构建MCP服务器
本章将使用使用Gradio构建多种形式的MCP客户端与服务器。首先,使用FastMCP构建服务器,使用ChatBot构建MCP客户端。然后,讲解生成MCP服务器的其他方案,包括:利用Gradio参数直接生成MCP服务器、转换现有Space项目以及自定义MCP服务器方案。最后,用一个文档式MCP服务器讲解其它配置。
2025-06-29 11:40:16
1025
原创 Gradio全解14——使用Gradio构建MCP的客户端与服务器(1)——使用Gradio构建MCP客户端
本章将使用使用Gradio构建多种形式的MCP客户端与服务器。首先,使用FastMCP构建服务器,使用ChatBot构建MCP客户端。然后,讲解生成MCP服务器的其他方案,包括:利用Gradio参数直接生成MCP服务器、转换现有Space项目以及自定义MCP服务器方案。最后,用一个文档式MCP服务器讲解其它配置。
2025-06-28 12:14:51
1393
原创 Gradio全解13——MCP详解(4)——TypeScript包命令:npm与npx
MCP是当前人工智能领域最热门技术之一,是实现大模型快速应用的捷径。本章将基于MCP最新方案修订版:2025-06-18,详细讲解MCP协议细节,并实战如何通过Gradio构建MCP客户端与服务器。
2025-06-28 11:43:44
1277
原创 Gradio全解13——MCP详解(3)——TypeScript介绍:特点与适用领域
MCP是当前人工智能领域最热门技术之一,是实现大模型快速应用的捷径。本章将基于MCP最新方案修订版:2025-06-18,详细讲解MCP协议细节,并实战如何通过Gradio构建MCP客户端与服务器。
2025-06-28 11:39:40
1082
原创 Gradio全解13——MCP详解(2)——MCP能力协商与通信机制
MCP是当前人工智能领域最热门技术之一,是实现大模型快速应用的捷径。本章将基于MCP最新方案修订版:2025-06-18,详细讲解MCP协议细节,并实战如何通过Gradio构建MCP客户端与服务器。
2025-06-27 12:03:19
1346
原创 Gradio全解13——MCP协议详解(1)——MCP协议介绍与架构组件
MCP是当前人工智能领域最热门技术之一,是实现大模型快速应用的捷径。本章将基于MCP最新方案修订版:2025-06-18,详细讲解MCP协议细节,并实战如何通过Gradio构建MCP客户端与服务器。
2025-06-27 11:56:39
1173
原创 Gradio全解11——Streaming:流式传输的视频应用(6)——基于RT-DETR模型构建视频流目标检测系统
本章讲述流式传输的应用,包括音频、图像和视频格式的流式传输。音频应用包括流式传输音频、构建音频对话式聊天机器人、实时语音识别技术和自动语音检测功能;图像应用包括基于WebRTC的摄像头实时目标检测;视频应用包括构建视频流目标检测系统。
2025-05-05 20:44:55
1176
原创 Gradio全解11——Streaming:流式传输的视频应用(4)——基于WebRTC的摄像头实时目标检测
本章讲述流式传输的应用,包括音频、图像和视频格式的流式传输。音频应用包括流式传输音频、构建音频对话式聊天机器人、实时语音识别技术和自动语音检测功能;图像应用包括基于WebRTC的摄像头实时目标检测;视频应用包括构建视频流目标检测系统。
2025-05-05 20:25:01
1888
原创 Gradio全解10——Streaming:流式传输的音频应用(6)——基于Groq的带自动语音检测功能的Gradio应用
本章讲述流式传输的应用,包括音频、图像和视频格式的流式传输。音频应用包括流式传输音频、构建音频对话式聊天机器人、实时语音识别技术和自动语音检测功能;图像应用包括基于WebRTC的摄像头实时目标检测;视频应用包括构建视频流目标检测系统。
2025-05-05 19:26:19
1032
原创 Gradio全解10——Streaming:流式传输的音频应用(5)——Mistral实现流式传输音频:魔力8号球
本章讲述流式传输的应用,包括音频、图像和视频格式的流式传输。音频应用包括流式传输音频、构建音频对话式聊天机器人、实时语音识别技术和自动语音检测功能;图像应用包括基于WebRTC的摄像头实时目标检测;视频应用包括构建视频流目标检测系统。
2025-05-02 16:57:05
1226
原创 Gradio全解10——Streaming:流式传输的音频应用(2)——使用本地部署的Mini-Omni模型构建对话式聊天机器人
本章讲述流式传输的应用,包括音频、图像和视频格式的流式传输。音频应用包括流式传输音频、构建音频对话式聊天机器人、实时语音识别技术和自动语音检测功能;图像应用包括基于WebRTC的摄像头实时目标检测;视频应用包括构建视频流目标检测系统。
2025-04-30 18:36:31
955
原创 Gradio全解10——Streaming:流式传输的音频应用(1)——自动语音识别技术(ASR)
本章讲述流式传输的应用,包括音频、图像和视频格式的流式传输。音频应用包括流式传输音频、构建音频对话式聊天机器人、实时语音识别技术和自动语音检测功能;图像应用包括基于WebRTC的摄像头实时目标检测;视频应用包括构建视频流目标检测系统。
2025-04-30 18:19:14
1677
原创 Gradio全解13——由Gradio应用创建Discord Bot/Slack Bot/Website Widget(3)——Website Widget
为了拓展Gradio App的应用范围,本章讲解从Gradio App分别创建Discord Bot/Slack Bot/Website Widget。
2025-04-17 18:06:29
721
原创 Gradio全解13——由Gradio应用创建Discord Bot/Slack Bot/Website Widget(2)——由Gradio应用创建Slack Bot
为了拓展Gradio App的应用范围,本章讲解从Gradio App分别创建Discord Bot/Slack Bot/Website Widget。
2025-04-15 21:44:39
946
原创 Gradio全解13——由Gradio应用创建Discord Bot、Slack Bot和Website Widget(1)——由Gradio应用创建Discord Bot
为了拓展Gradio App的应用范围,本章讲解从Gradio App分别创建Discord Bot/Slack Bot/Website Widget。
2025-04-15 21:40:10
1210
原创 WG18:从Gradio App创建Discord Bot/Slack Bot/Website Widget(2)——从Gradio App创建Slack Bot
我们可以将Gradio应用部署为Slack机器人,让Slack工作区中的成员直接与之互动。Slack官网地址https://slack.com,Slack可以将人员、项目、应用和AI代理整合在一起,进行人员组织协作、项目管理、工具集成并可使用人工智能Slack AI及智能代理Agentforce提供服务。
2025-04-11 17:42:43
230
原创 WG18:从Gradio App创建Discord Bot/Slack Bot/Website Widget(1)——从Gradio App创建Discord Bot
Discord是专为游戏和快乐打造的群聊,它是与朋友们一起游戏、放松,甚至是打造全球社区的理想平台;用户可以自由定制自己的一方天地,在其中聊天、游戏,与朋友共度美好时光。我们可以将Gradio应用部署为Discord机器人,让Discord服务器中的用户直接与之互动。
2025-04-11 17:18:07
554
原创 Gradio全解12——Agent and Tool:代理与工具库(9)——创建自定义Gradio工具
本章使用LangChain Agents构建Gradio,首先介绍LangChain Agents概念及执行逻辑,并给出演示用例,然后用其构建Gradio,最后介绍如何通过智能体使用Gradio Tools,以及如何创建Gradio Tools。
2025-04-08 09:22:04
926
1
原创 Gradio全解12——Agent and Tool:代理与工具(8)——gradio_tools的端到端示例详解
本章使用LangChain Agents构建Gradio,首先介绍LangChain Agents概念及执行逻辑,并给出演示用例,然后用其构建Gradio,最后介绍如何通过智能体使用Gradio Tools,以及如何创建Gradio Tools。
2025-04-07 17:04:04
1163
原创 Gradio全解12——Agent and Tool:代理与工具(7)——Gradio Tools的实现形式:gradio_tools库
本章使用LangChain Agents构建Gradio,首先介绍LangChain Agents概念及执行逻辑,并给出演示用例,然后用其构建Gradio,最后介绍如何通过智能体使用Gradio Tools,以及如何创建Gradio Tools。
2025-04-07 16:11:11
1063
原创 Gradio全解12——Agent and Tool:代理与工具库(3)——在Gradio中使用Langchain Agent
本章使用LangChain Agents构建Gradio,首先介绍LangChain Agents概念及执行逻辑,并给出演示用例,然后用其构建Gradio,最后介绍如何通过智能体使用Gradio Tools,以及如何创建它。
2025-03-31 17:24:29
1049
【语音处理与AI聊天】基于Groq和Llama模型的音频转录及营养成分估算对话系统实现
2025-05-05
Gradio-Tools+LLM-Agents
2024-11-04
四元数插值方法SlerpSquadSpicvSping知识总结思维导图.xmind
2021-06-25
四元数插值绘图论文原始代码
2021-03-06
rigidMotion.zip
2020-03-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅