自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

shao918516的博客

大话强化学习算法

  • 博客(118)
  • 资源 (6)
  • 收藏
  • 关注

原创 Gradio全解14——使用Gradio构建MCP的服务器与客户端(4)——Python包命令:uv与uvx实战

pip是最常用的Python包管理工具,但现在出现了一个速度更快,功能更全面强大,而且被广泛用在AI MCP管理中的包工具,那就是uv。而uvx是uv的包执行命令,下面将分别讲解并实战。

2025-10-24 22:56:48 1102

原创 Gradio全解11——Streaming:流式传输的视频应用(9)——使用FastRTC+Gemini创建沉浸式音频+视频的艺术评论家

作为对本章知识的总结,本节将实现一个综合演示:让Gemini扮演艺术评论家,对用户通过FastRTC上传的艺术作品进行点评。本节内容包括准备工作及音频图像编码器、实现Gemini音视频处理程序使用gr.Blocks替换Stream.ui。

2025-09-11 10:21:38 1552

原创 Gradio全解11——Streaming:流式传输的视频应用(8)——Gemini Live API:实时音视频连接

本节介绍Gemini Live API实时音视频连接,内容包括Live API入门讲解和Live API - WebSockets API详解。Live API入门介绍内容包括Live API技术与功能介绍、选择音频生成架构和实施方案、异步发送并接受音频示例、第三方集成应用与下一步学习建议。Live API底层使用的是WebSockets进行连接。WebSockets API详解将介绍WebSockets API概念及功能、Live API连接时的会话配置、发送与接收操作及消息类型。

2025-09-11 10:20:05 1219

原创 Gradio全解11——Streaming:流式传输的视频应用(7)——多模态Gemini模型及其思考模式

在使用FastRTC+Gemini创建实时沉浸式音频+视频演示之前,先了解下Gemini模型和它的Live API。本节先介绍Gemini模型,内容包括Gemini系列模型介绍、思考预算和思路总结的thinking模式示例。

2025-09-10 14:20:49 1303

原创 Gradio全解11——Streaming:流式传输的视频应用(5)——RT-DETR:实时端到端检测模型

在使用RT-DETR模型构建视频流目标检测系统之前,先了解下RT-DETR模型。先讲解模型的技术与架构,然后着眼于训练细节与性能表现,接着介绍其最新版本RT-DETRv2,之后通过图像目标识别示例演示其用法,最后列出下一步的学习资源。

2025-09-10 14:20:18 1115

原创 Gradio全解11——Streaming:流式传输的视频应用(3)——YOLO系列模型技术架构与实战

近年来,YOLO系列因其在计算成本与检测性能之间的有效平衡,已成为实时目标检测领域的主导技术。本节将介绍YOLO系列最流行的两个模型:YOLOv10和YOLOE,讲解技术架构并进行实战,方便读者了解著名的YOLO系列模型较新版本的区别和优势。

2025-09-09 17:12:22 1139

原创 Gradio全解11——Streaming:流式传输的视频应用(2)——Twilio:网络服务提供商

本节先讲解Twillo与TURN服务器概念,然后进行Twilio网络穿透服务实战,包括通过Twilio建立连接和使用Twilio拨打外呼电话。

2025-09-09 16:53:56 1058

原创 Gradio全解11——Streaming:流式传输的视频应用(1)——FastRTC:Python实时通信库

本章讲述流式传输的视频应用,应用部分包括三部分:基于Gradio.WebRTC+YOLO的实时目标检测,使用RT-DETR模型构建视频流目标检测系统,以及使用FastRTC+Gemini创建实时沉浸式音频+视频的艺术评论家。此外,用到的技术部分分为独立的六节讲解:Python实时通信库FastRTC,网络服务提供商Twilio,YOLO系列模型技术架构与实战,实时端到端检测模型RT-DETR、Gemini模型简介及入门实战,以及为更复杂的结合音视频的Gemini Live API实时连接。

2025-09-09 00:04:59 1324

原创 Gradio全解10——Streaming:流式传输的音频应用(7)——ElevenLabs:高级智能语音技术

本节引入ElevenLabs智能语音技术,作为更专业的语音、音频和音乐工具,后边视频应用中将用到它。它不仅能无缝替换之前的语音转换工具,还能实现更丰富复杂的语音功能;它不仅能拓展开发者的工具库,还能产生更逼真的语音甚至优美的音乐。本节内容包括ElevenLabs的核心功能与产品讲解,其旗下Eleven系列语音大模型的介绍,以及文本转语音API、语音转文本API及音乐API的使用。

2025-09-08 21:15:53 1740

原创 Gradio全解10——Streaming:流式传输的音频应用(4)——Spaces ZeroGPU:为Spaces提供动态GPU分配方案

ZeroGPU是HuggingFace Spaces平台上专为AI模型和演示优化的GPU共用基础设施,采用动态分配机制实现NVIDIA H200显卡的按需调用与释放,其主要特性包括:- 免费GPU访问:为Spaces用户提供经济高效的GPU算力支持。- 多GPU并发:支持Spaces上的单个应用同时调用多块显卡进行运算。通过ZeroGPU,开发者能创建更高效、可扩展的Space,在最大化GPU利用率的同时实现成本优化。

2025-08-06 16:20:34 1179

原创 Gradio全解10——Streaming:流式传输的音频应用(3)——HF Inference:在服务器运行推理

推理(Inference)是指使用训练好的模型对新数据进行预测的过程。由于该过程可能涉及大量计算,所以最好运行在专用服务或外部服务上。

2025-08-06 16:14:53 1267

原创 Gradio全解9——ChatInterface&Chatbot:聊天界面类与聊天机器人(5)——通过API加载、聊天历史和用户反馈

本章介绍如何使用Gradio的ChatInterface和Chatbot创建聊天机器人。聊天机器人是大型语言模型(LLMs)的一个流行应用,通过Gradio,我们可以轻松构建LLM应用并与其它用户分享,或者自己使用直观的聊天机器人界面进行开发尝试。

2025-07-27 18:34:06 1304

原创 Gradio全解9——ChatInterface&Chatbot:聊天界面类与聊天机器人(4)——返回复杂响应与直接修改Chatbot值

本章介绍如何使用Gradio的ChatInterface和Chatbot创建聊天机器人。聊天机器人是大型语言模型(LLMs)的一个流行应用,通过Gradio,我们可以轻松构建LLM应用并与其它用户分享,或者自己使用直观的聊天机器人界面进行开发尝试。

2025-07-27 18:30:49 767

原创 Gradio全解9——ChatInterface&Chatbot:聊天界面类与聊天机器人(3)——ChatInterface的多模态功能与附加输入输出

本章介绍如何使用Gradio的ChatInterface和Chatbot创建聊天机器人。聊天机器人是大型语言模型(LLMs)的一个流行应用,通过Gradio,我们可以轻松构建LLM应用并与其它用户分享,或者自己使用直观的聊天机器人界面进行开发尝试。

2025-07-27 18:21:42 1080

原创 Gradio全解8——ChatInterface&Chatbot:聊天界面类与聊天机器人(2)——ChatInterface的自定义函数和界面

本章介绍如何使用Gradio的ChatInterface和Chatbot创建聊天机器人。聊天机器人是大型语言模型(LLMs)的一个流行应用,通过Gradio,我们可以轻松构建LLM应用并与其它用户分享,或者自己使用直观的聊天机器人界面进行开发尝试。本章主要包括两部分内容:第一部分内容和gr.ChatInterface相关,包括ChatInterface类示例与构造参数,ChatInterface的自定义函数和界面,多模态和附加输入输出,返回复杂响应与直接修改Chatbot值,通过API加载聊天机器人、聊天历

2025-07-27 18:15:53 1326

原创 Gradio全解7——Additional Features:附加特性(上)

本篇介绍Gradio的补充特性功能,这些功能辅助Interface/Blocks实现更绚丽效果和更多功能。本章补充特性主要包括队列、输入输出流、提示及进度条、批处理函数、嵌入托管Spaces、访问网络请求和Analytics应用分析、授权OAuth、安全访问文件和资源清理,内容较多请保持耐心,下面逐一讲述。

2025-07-04 19:49:39 1090

原创 Gradio全解13——MCP协议详解(6)——MCP服务器构建、测试与示例大全

MCP是当前人工智能领域最热门技术之一,是实现大模型快速应用的捷径。本章将基于MCP最新方案修订版:2025-06-18,详细讲解MCP协议细节,内容包括MCP协议介绍与架构组件、MCP能力协商与通信机制、TypeScript介绍:特点、适用领域与实战、TypeScript包命令npm与npx、Python包命令uv与uvx、MCP服务器构建测试与示例大全、MCP客户端、六大​功能特性和调试工具MCP Inspector。

2025-07-01 16:06:52 1074

原创 Gradio全解13——MCP协议详解(5)——Python包命令:uv与uvx实战

MCP是当前人工智能领域最热门技术之一,是实现大模型快速应用的捷径。本章将基于MCP最新方案修订版:2025-06-18,详细讲解MCP协议细节,内容包括MCP协议介绍与架构组件、MCP能力协商与通信机制、TypeScript介绍:特点、适用领域与实战、TypeScript包命令npm与npx、Python包命令uv与uvx、MCP服务器构建测试与示例大全、MCP客户端、六大​功能特性和调试工具MCP Inspector。

2025-07-01 16:05:16 1055

原创 Gradio全解14——使用Gradio构建MCP的客户端与服务器(3)——使用Gradio Docs MCP服务器

本章将使用使用Gradio构建多种形式的MCP客户端与服务器。首先,使用FastMCP构建服务器,使用ChatBot构建MCP客户端。然后,讲解生成MCP服务器的其他方案,包括:利用Gradio参数直接生成MCP服务器、转换现有Space项目以及自定义MCP服务器方案。最后,用一个文档式MCP服务器讲解其它配置。

2025-06-29 11:40:38 1164

原创 Gradio全解14——使用Gradio构建MCP的客户端与服务器(2)——使用Gradio构建MCP服务器

本章将使用使用Gradio构建多种形式的MCP客户端与服务器。首先,使用FastMCP构建服务器,使用ChatBot构建MCP客户端。然后,讲解生成MCP服务器的其他方案,包括:利用Gradio参数直接生成MCP服务器、转换现有Space项目以及自定义MCP服务器方案。最后,用一个文档式MCP服务器讲解其它配置。

2025-06-29 11:40:16 1025

原创 Gradio全解14——使用Gradio构建MCP的客户端与服务器(1)——使用Gradio构建MCP客户端

本章将使用使用Gradio构建多种形式的MCP客户端与服务器。首先,使用FastMCP构建服务器,使用ChatBot构建MCP客户端。然后,讲解生成MCP服务器的其他方案,包括:利用Gradio参数直接生成MCP服务器、转换现有Space项目以及自定义MCP服务器方案。最后,用一个文档式MCP服务器讲解其它配置。

2025-06-28 12:14:51 1393

原创 Gradio全解13——MCP详解(4)——TypeScript包命令:npm与npx

MCP是当前人工智能领域最热门技术之一,是实现大模型快速应用的捷径。本章将基于MCP最新方案修订版:2025-06-18,详细讲解MCP协议细节,并实战如何通过Gradio构建MCP客户端与服务器。

2025-06-28 11:43:44 1277

原创 Gradio全解13——MCP详解(3)——TypeScript介绍:特点与适用领域

MCP是当前人工智能领域最热门技术之一,是实现大模型快速应用的捷径。本章将基于MCP最新方案修订版:2025-06-18,详细讲解MCP协议细节,并实战如何通过Gradio构建MCP客户端与服务器。

2025-06-28 11:39:40 1082

原创 Gradio全解13——MCP详解(2)——MCP能力协商与通信机制

MCP是当前人工智能领域最热门技术之一,是实现大模型快速应用的捷径。本章将基于MCP最新方案修订版:2025-06-18,详细讲解MCP协议细节,并实战如何通过Gradio构建MCP客户端与服务器。

2025-06-27 12:03:19 1346

原创 Gradio全解13——MCP协议详解(1)——MCP协议介绍与架构组件

MCP是当前人工智能领域最热门技术之一,是实现大模型快速应用的捷径。本章将基于MCP最新方案修订版:2025-06-18,详细讲解MCP协议细节,并实战如何通过Gradio构建MCP客户端与服务器。

2025-06-27 11:56:39 1173

原创 Gradio全解11——Streaming:流式传输的视频应用(6)——基于RT-DETR模型构建视频流目标检测系统

本章讲述流式传输的应用,包括音频、图像和视频格式的流式传输。音频应用包括流式传输音频、构建音频对话式聊天机器人、实时语音识别技术和自动语音检测功能;图像应用包括基于WebRTC的摄像头实时目标检测;视频应用包括构建视频流目标检测系统。

2025-05-05 20:44:55 1176

原创 Gradio全解11——Streaming:流式传输的视频应用(4)——基于WebRTC的摄像头实时目标检测

本章讲述流式传输的应用,包括音频、图像和视频格式的流式传输。音频应用包括流式传输音频、构建音频对话式聊天机器人、实时语音识别技术和自动语音检测功能;图像应用包括基于WebRTC的摄像头实时目标检测;视频应用包括构建视频流目标检测系统。

2025-05-05 20:25:01 1888

原创 Gradio全解10——Streaming:流式传输的音频应用(6)——基于Groq的带自动语音检测功能的Gradio应用

本章讲述流式传输的应用,包括音频、图像和视频格式的流式传输。音频应用包括流式传输音频、构建音频对话式聊天机器人、实时语音识别技术和自动语音检测功能;图像应用包括基于WebRTC的摄像头实时目标检测;视频应用包括构建视频流目标检测系统。

2025-05-05 19:26:19 1032

原创 Gradio全解10——Streaming:流式传输的音频应用(5)——Mistral实现流式传输音频:魔力8号球

本章讲述流式传输的应用,包括音频、图像和视频格式的流式传输。音频应用包括流式传输音频、构建音频对话式聊天机器人、实时语音识别技术和自动语音检测功能;图像应用包括基于WebRTC的摄像头实时目标检测;视频应用包括构建视频流目标检测系统。

2025-05-02 16:57:05 1226

原创 Gradio全解10——Streaming:流式传输的音频应用(2)——使用本地部署的Mini-Omni模型构建对话式聊天机器人

本章讲述流式传输的应用,包括音频、图像和视频格式的流式传输。音频应用包括流式传输音频、构建音频对话式聊天机器人、实时语音识别技术和自动语音检测功能;图像应用包括基于WebRTC的摄像头实时目标检测;视频应用包括构建视频流目标检测系统。

2025-04-30 18:36:31 955

原创 Gradio全解10——Streaming:流式传输的音频应用(1)——自动语音识别技术(ASR)

本章讲述流式传输的应用,包括音频、图像和视频格式的流式传输。音频应用包括流式传输音频、构建音频对话式聊天机器人、实时语音识别技术和自动语音检测功能;图像应用包括基于WebRTC的摄像头实时目标检测;视频应用包括构建视频流目标检测系统。

2025-04-30 18:19:14 1677

原创 Gradio全解13——由Gradio应用创建Discord Bot/Slack Bot/Website Widget(3)——Website Widget

为了拓展Gradio App的应用范围,本章讲解从Gradio App分别创建Discord Bot/Slack Bot/Website Widget。

2025-04-17 18:06:29 721

原创 Gradio全解13——由Gradio应用创建Discord Bot/Slack Bot/Website Widget(2)——由Gradio应用创建Slack Bot

为了拓展Gradio App的应用范围,本章讲解从Gradio App分别创建Discord Bot/Slack Bot/Website Widget。

2025-04-15 21:44:39 946

原创 Gradio全解13——由Gradio应用创建Discord Bot、Slack Bot和Website Widget(1)——由Gradio应用创建Discord Bot

为了拓展Gradio App的应用范围,本章讲解从Gradio App分别创建Discord Bot/Slack Bot/Website Widget。

2025-04-15 21:40:10 1210

原创 WG18:从Gradio App创建Discord Bot/Slack Bot/Website Widget(2)——从Gradio App创建Slack Bot

我们可以将Gradio应用部署为Slack机器人,让Slack工作区中的成员直接与之互动。Slack官网地址https://slack.com,Slack可以将人员、项目、应用和AI代理整合在一起,进行人员组织协作、项目管理、工具集成并可使用人工智能Slack AI及智能代理Agentforce提供服务。

2025-04-11 17:42:43 230

原创 WG18:从Gradio App创建Discord Bot/Slack Bot/Website Widget(1)——从Gradio App创建Discord Bot

Discord是专为游戏和快乐打造的群聊,它是与朋友们一起游戏、放松,甚至是打造全球社区的理想平台;用户可以自由定制自己的一方天地,在其中聊天、游戏,与朋友共度美好时光。我们可以将Gradio应用部署为Discord机器人,让Discord服务器中的用户直接与之互动。

2025-04-11 17:18:07 554

原创 Gradio全解12——Agent and Tool:代理与工具库(9)——创建自定义Gradio工具

本章使用LangChain Agents构建Gradio,首先介绍LangChain Agents概念及执行逻辑,并给出演示用例,然后用其构建Gradio,最后介绍如何通过智能体使用Gradio Tools,以及如何创建Gradio Tools。

2025-04-08 09:22:04 926 1

原创 Gradio全解12——Agent and Tool:代理与工具(8)——gradio_tools的端到端示例详解

本章使用LangChain Agents构建Gradio,首先介绍LangChain Agents概念及执行逻辑,并给出演示用例,然后用其构建Gradio,最后介绍如何通过智能体使用Gradio Tools,以及如何创建Gradio Tools。

2025-04-07 17:04:04 1163

原创 Gradio全解12——Agent and Tool:代理与工具(7)——Gradio Tools的实现形式:gradio_tools库

本章使用LangChain Agents构建Gradio,首先介绍LangChain Agents概念及执行逻辑,并给出演示用例,然后用其构建Gradio,最后介绍如何通过智能体使用Gradio Tools,以及如何创建Gradio Tools。

2025-04-07 16:11:11 1063

原创 Gradio全解12——Agent and Tool:代理与工具库(3)——在Gradio中使用Langchain Agent

本章使用LangChain Agents构建Gradio,首先介绍LangChain Agents概念及执行逻辑,并给出演示用例,然后用其构建Gradio,最后介绍如何通过智能体使用Gradio Tools,以及如何创建它。

2025-03-31 17:24:29 1049

【语音处理与AI聊天】基于Groq和Llama模型的音频转录及营养成分估算对话系统实现

内容概要:本文介绍了一个基于Groq和Gradio构建的语音转文字及营养咨询对话机器人的实现细节。该机器人首先通过Whisper语音识别模型将用户的语音输入转换为文本,然后利用Llama大语言模型进行对话管理,逐步询问并估算用户的饮食摄入量,包括总卡路里、蛋白质、碳水化合物、脂肪、纤维和糖分含量。整个系统通过Gradio界面提供给用户,支持实时录音、自动语音识别以及对话交互。此外,还涉及了音频文件的处理、环境变量的配置(如API密钥)以及异常处理机制。; 适合人群:对语音识别、自然语言处理和机器学习感兴趣的开发者,特别是那些希望了解如何整合多个AI模型来构建复杂应用的工程师。; 使用场景及目标:①用于个人健康管理,帮助用户记录和分析日常饮食摄入;②作为技术示例,展示如何结合Groq平台、Whisper和Llama模型来创建语音驱动的应用程序;③研究语音识别与对话系统的集成方法及其实际应用效果。; 阅读建议:由于本文涉及较多的技术细节和代码片段,建议读者具备一定的Python编程基础,尤其是对API调用、异步编程和Web开发有所了解。同时,在实践中可以尝试运行代码并调整参数,以便更好地理解各个组件的工作原理。

2025-05-05

Gradio-Tools+LLM-Agents

使用gradio_tools的方法很简单,只需从库gradio_tools导入所需的工具,并将它们传递给LangChain的initialize_agent方法即可。如下例所示,我们从预构建工具集中分别导入StableDiffusionPromptGeneratorTool、StableDiffusionTool、ImageCaptioningTool和ImageCaptioningTool,它们将依次创建改进的提示、根据提示创建图片、为图片添加文字说明并根据改进提示创建视频。

2024-11-04

微软笔试面试整理题.txt

很全的微软面试题和笔试题整理,相信对从事这行业面试的朋友很有帮助

2011-04-22

groundtruth.txt

误差估计中的真实轨迹

2021-07-08

四元数插值方法SlerpSquadSpicvSping知识总结思维导图.xmind

最近在学习思维导图,闲来无事,就把之前写过的博客,四元数插值方法Slerp、Squad、Spicv和Sping知识点总结整理为思维导图,有了这张图,复习时就不用再看十几万字的文章了。

2021-06-25

四元数插值绘图论文原始代码

论文《Quaternions, Interpolation and Animation》四元数运算原始代码,包括基本运算和Slerp\Squad\Spring插值

2021-03-06

estimated.txt

误差分析中的预估轨迹

2021-07-08

rigidMotion.zip

代码包括三部分:旋转矩阵和变换矩阵,旋转向量和欧拉角,四元数表示旋转。请下载解压后,使用KDevelop导入工程,注意CMake版本。因版本问题,如有必要,请删除.kdev文件,重新创建工程。

2020-03-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除