自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

寻道AI,探索AI无限可能!

探索未知,分享所知。作为一名系统架构师,我曾带领团队打造多个行业领域的系统平台。如今,我正踏上AI大模型的探索之旅,期待与你一起成长,迎接技术的未来。

  • 博客(467)
  • 资源 (8)
  • 收藏
  • 关注

原创 【AI大模型前沿】MiniMind-V:低成本打造超小多模态视觉语言模型(仅需1.3元人民币和1小时)

MiniMind-V是一款超小型多模态视觉语言模型(VLM),由开发者jingyaogong开源,旨在以极低成本(仅需1.3元人民币和1小时)从零开始训练,支持图像识别、对话和多模态推理。其最小版本参数规模为26M,体积仅为GPT-3的1/7000,适合个人GPU快速训练和推理。MiniMind-V基于Transformer架构,采用混合专家(MoE)技术,具备强大的多模态处理能力,能够同时处理文本和图像等多种模态的信息。应用场景包括图像识别与描述、视觉问答系统、智能客服和视频理解等。

2025-05-20 08:00:00 290 13

原创 【AI大模型前沿】MoCha:端到端对话角色视频生成模型、电影级对话角色合成黑科技、重新定义动画创作

Meta与滑铁卢大学联合开发的MoCha模型在对话角色视频生成领域取得了显著突破。该模型基于扩散变换器(DiT)架构,采用语音-视频窗口注意力机制和联合训练策略,能够根据文本或语音输入生成带有同步语音和自然动作的完整角色动画。MoCha的核心功能包括语音驱动角色动画生成、文本驱动角色动画生成、全身动画生成和多角色轮番对话生成。其技术创新在于端到端训练无需辅助条件、语音-视频窗口注意力机制、多角色对话生成的突破以及联合训练策略的优势。

2025-05-19 16:29:22 828 10

原创 【AI大模型前沿】F5R-TTS:腾讯出品、又快又准又自然、零样本语音克隆新高度

F5R-TTS 是腾讯推出的一款基于流匹配技术的文本到语音(TTS)系统,通过集成强化学习算法,显著提升了语音合成的清晰度和说话人相似度。该系统采用梯度奖励策略优化(GRPO)技术,将流匹配模型的确定性输出转化为概率性高斯分布,实现了强化学习的无缝集成。F5R-TTS 在零样本语音克隆任务中表现出色,词错误率(WER)相对减少29.5%,说话人相似度(SIM)得分相对增加4.6%。此外,该系统支持多语言合成、情感控制和速度调整,适用于语音克隆、有声读物生成、情感语音合成及智能设备等场景。

2025-05-19 08:00:00 564 21

原创 【GitHub开源AI精选】UFO²:微软开源的 Windows 桌面 Agent 操作系统,开启智能自动化新时代

微软推出的UFO²是一款面向Windows桌面的多智能体操作系统,旨在通过深度系统集成和自然语言交互实现复杂桌面任务的自动化。UFO²采用多智能体架构,由中央HostAgent和多个应用专用的AppAgent组成,显著提升了任务执行的效率和鲁棒性。其混合控制检测技术结合了Windows UI Automation APIs和视觉检测模型,确保在各种UI环境中准确操作。此外,UFO²通过统一GUI/API动作层和持续知识整合技术,优化了任务执行路径并动态提升智能体的学习能力。

2025-05-18 18:00:08 1303 35

原创 大模型之Spring AI实战系列(十):Spring Boot + OpenAI 使用 DALL·E实现文本生成图像功能

在前面的文章中,我们已经学习了如何使用 Spring AI 构建基础聊天服务、流式对话、上下文记忆、角色设定、动态提示词模板、结构化输出、语音识别与合成等能力。本文将聚焦于**多模态 AI 能力中的图像生成部分**。我们将基于 `spring-ai-openai-image` 示例项目,详细介绍如何通过 Spring AI 集成 OpenAI 的 [DALL·E]模型,根据自然语言描述生成高质量图像,并演示其在不同分辨率、模型版本和生成参数下的应用效果。

2025-05-18 08:00:00 925 15

原创 大模型之Spring AI实战系列(九):Spring Boot + OpenAI 使用TTS实现文本转语音功能

在前面的文章中,我们已经学习了如何使用 Spring AI 构建基础聊天服务、流式对话、上下文记忆、角色设定、动态提示词模板、结构化输出以及语音转文字等功能。本文将聚焦于**文本转语音(Text to Speech, TTS)**的实现。我们将基于 `spring-ai-openai-textToSpeech` 示例项目,详细介绍如何通过 Spring AI 集成 OpenAI 的 TTS 模型(tts-1),实现文本到音频的转换,并演示其在不同声音、格式和语速配置下的应用效果。

2025-05-17 16:00:00 1100 4

原创 大模型之Spring AI实战系列(八):Spring Boot + OpenAI 使用Whisper实现语音转文本功能

在前面的文章中,我们已经学习了如何使用 Spring AI 构建基础聊天服务、流式对话、上下文记忆、角色设定、动态提示词模板以及结构化输出等功能。本文将聚焦于一个非常实用但容易被忽视的能力——**语音转文本(Speech to Text, STT)**。我们将基于 `spring-ai-openai-speechToText` 示例项目,详细介绍如何通过 Spring AI 集成 OpenAI 的 [Whisper]模型,实现音频文件的自动转录,并演示其在不同语言、格式和参数配置下的应用效果。

2025-05-17 08:00:00 681 1

原创 大模型之Spring AI实战系列(七):Spring Boot + OpenAI 构建结构化输出的AI响应系统

在前面的文章中,我们已经学习了如何使用 Spring AI 构建基础聊天服务、流式对话、上下文记忆、角色设定以及动态提示词模板等功能。本文将聚焦于一个非常关键但容易被忽视的能力——**结构化输出(Structured Output)**。

2025-05-16 15:06:04 937 5

原创 大模型之Spring AI实战系列(六):借助PromptTemplate在使用OpenAI时构建动态提示词系统

在前面的文章中,我们已经学习了如何使用 Spring AI 构建基础聊天服务、流式对话、上下文记忆、角色设定等功能。本文将聚焦于一个非常实用但常被忽视的能力——**动态提示词模板(Prompt Template)**。我们将基于 `spring-ai-openai-promptTemplate` 示例项目,详细介绍如何通过 `PromptTemplate` 实现灵活的提示词管理,支持从字符串模板和文件模板生成内容,并演示其在诗歌创作、代码生成等场景中的应用。

2025-05-16 08:00:00 1157 56

原创 大模型之Spring AI实战系列(五):Spring Boot + OpenAI 构建带角色设定的智能对话系统

在上一篇文章中,我们学习了如何使用 Spring AI 集成 OpenAI 的 Embedding API 实现文本向量化,并探讨了其在语义搜索、RAG 系统等场景中的应用。本文将继续深入 Spring AI 的能力栈,聚焦于**系统提示词(System Prompt)的设计与实现**。

2025-05-15 15:00:00 740 10

原创 大模型之Spring AI实战系列(四):Spring Boot + OpenAI 使用OpenAI Embedding实现文本向量化

本篇文章作为《Spring AI 实战》专栏的第四篇,将带领大家深入探索 spring-ai-openai-embedding 示例项目。我们将详细解读如何借助 Spring AI 无缝集成 OpenAI 的 Embedding API,实现文本的高效向量化处理。不仅如此,我们还将深入剖析其在企业级应用中的多种典型用途,助力您在实际项目中挖掘文本数据的深层价值,开启智能应用的新篇章。

2025-05-15 08:00:00 4058 19

原创 大模型之Spring AI实战系列(三):Spring Boot + OpenAI 实现聊天应用上下文记忆功能

为了让 AI 聊天机器人具备“记忆力”,能够理解上下文并进行连贯的多轮对话,我们需要引入**上下文管理机制**。本文将基于 `spring-ai-openai-context` 示例项目,详细介绍如何构建一个支持上下文记忆的 OpenAI 聊天服务。

2025-05-14 15:00:00 1117 7

原创 大模型之Spring AI实战系列(二):Spring Boot + OpenAI 打造聊天应用全攻略

本篇文章是《Spring AI实战》专栏的第一篇开发入门文章,我们将借助一个完整的OpenAI聊天应用示例,详细介绍如何运用Spring Boot和Spring AI快速搭建一个支持OpenAI API的聊天服务,全面涵盖基础对话、流式对话、多提供商配置等核心功能。

2025-05-14 08:00:00 1857 43

原创 大模型之Spring AI实战系列(一):基础认知篇 - 开启智能应用开发之旅

Spring AI 是一个轻量级开源框架,旨在简化 AI 模型在企业级 Java 应用中的集成与管理。它提供了跨多个 AI 服务提供商的便携式 API,支持聊天、文本转图像、嵌入式模型等多种功能,并兼容主流的 AI 模型提供商如 OpenAI、Google 等。Spring AI 的核心功能包括结构化输出、向量数据库支持、工具/函数调用、可观察性、文档摄取 ETL 框架、AI 模型评估等。

2025-05-13 15:00:00 2223 5

原创 【GitHub开源AI精选】Oliva:开源语音RAG助手,一句话秒搜海量数据,多AI协作颠覆传统搜索

本文介绍了一系列基于GitHub的开源AI项目,涵盖了从影视解说、虚拟试穿、剧本生成到语音转文本、智能眼镜等多个领域。这些项目展示了AI技术在各个行业中的创新应用,如Narrato AI的影视解说工具、TryOffDiff的虚拟试穿技术、FilmAgent的剧本自动生成等。特别提到Oliva,一款基于Langchain和Superlinked技术的开源语音RAG助手,通过语音驱动和Qdrant向量数据库实现实时信息搜索,支持多智能体协作,提升复杂问题的处理能力。

2025-05-13 08:00:00 1095 44

原创 【GitHub开源AI精选】Crawl4AI:LLM专属极速开源爬虫利器、1秒处理百万级数据

Crawl4AI 是一款专为AI场景设计的开源网络爬虫工具,旨在为大型语言模型(LLM)、AI代理和数据管道提供高效、精准的网络数据采集服务。其核心优势包括为LLM量身定制的Markdown格式输出、极速性能、灵活的浏览器控制、启发式智能算法以及开源与可部署性。Crawl4AI适用于多种应用场景,如AI模型训练数据收集、实时数据监控和内容聚合平台构建。通过先进的技术架构和算法优化,Crawl4AI能够以6倍于传统工具的速度完成任务,并生成干净、结构化的Markdown文档,确保提取的核心信息精准、简洁。

2025-05-12 15:00:00 985 6

原创 【GitHub开源AI精选】WhisperX:70倍实时语音转录、革命性词级时间戳与多说话人分离技术

WhisperX 是一个基于 OpenAI Whisper 模型的开源自动语音识别(ASR)项目,通过引入批量推理、强制音素对齐和语音活动检测等技术,显著提升了语音识别的效率和精度。该项目支持多语言处理,能够生成精确的单词级时间戳,并识别音频中的不同说话人。WhisperX 的批处理推理功能使其在 GPU 上实现了高达 70 倍的实时处理速度,特别适用于大规模音频数据的处理。此外,通过语音活动检测(VAD)技术,WhisperX 能够有效过滤非语音部分,减少幻听现象,提升转录质量。

2025-05-12 08:00:00 1610 49

原创 【GitHub开源AI精选】LocAgent:斯坦福联合耶鲁大学等机构推出的代码问题定位智能体

在软件开发领域,代码库的规模和复杂度正以惊人的速度增长。开发者在修复错误、添加功能或优化性能时,往往需要花费大量时间来定位问题代码。传统的代码搜索工具仅能基于关键词进行简单匹配,难以理解代码的结构和依赖关系,更无法处理复杂的多跳推理问题。这一瓶颈严重制约了开发效率和软件质量。近年来,随着图表示学习和大型语言模型(LLM)的快速发展,研究者们开始探索如何利用这些技术来解决代码问题定位的难题。LocAgent是由斯坦福大学、耶鲁大学和南加州大学等机构联合开发的代码问题定位框架。

2025-05-11 08:00:00 1118 42

原创 【GitHub开源AI精选】MegaTTS 3:字节跳动开源语音利器,超越VALL-E,自然度逼近真人录音

在人工智能领域,语音合成技术一直是研究的热点之一。随着深度学习的发展,语音合成系统不断取得突破,从早期的机械语音到如今自然流畅的语音输出,技术的进步为众多行业带来了变革。近期,字节跳动与浙江大学合作推出的MegaTTS 3零样本语音合成系统,凭借其轻量级、高效、高质量的特点,引起了广泛关注。本文将深入探讨MegaTTS 3的技术原理、主要功能、应用场景以及如何快速上手使用,为技术爱好者和从业者提供全面的参考。

2025-05-10 08:00:00 1965 10

原创 【GitHub开源AI精选】RF-DETR:Roboflow 的实时目标检测模型『边缘设备鹰眼』,低至160FPS的工业级检测利器

在人工智能领域,目标检测技术一直是研究的热点和难点。近年来,随着深度学习技术的发展,目标检测模型的性能不断提升。然而,如何在保证检测精度的同时实现实时性,仍然是一个亟待解决的问题。近期,Roboflow 团队推出了一款名为 RF-DETR 的实时目标检测模型,它基于 Transformer 架构,不仅在精度上达到了新的高度,还实现了低延迟的实时检测。本文将详细介绍 RF-DETR 的技术原理、功能特点、应用场景以及如何快速上手使用。

2025-05-09 14:58:24 1324 13

原创 【GitHub开源AI精选】LLaVA-Med:微软打造的生物医学领域多模态AI助手,助力医疗智能化

在人工智能与医疗健康深度融合的今天,多模态AI技术正逐渐成为推动医疗行业变革的关键力量。在医疗领域,尤其是生物医学研究和临床诊断中,医学图像和文本数据的处理一直是关键挑战。传统的单模态AI模型在处理生物医学图像时往往缺乏复杂性,而多模态模型则能够更好地整合图像和文本信息,提供更全面的分析。LLaVA-Med正是基于这一需求而开发的,它通过创新的训练方法和大规模数据集的支持,实现了高效的多模态学习。

2025-05-09 08:00:00 1048 4

原创 【GitHub开源AI精选】Browser Use:开源AI自动化工具,让AI像人类一样操控网页

随着人工智能技术的不断发展,AI代理在各种领域的应用越来越广泛。从简单的数据处理到复杂的任务执行,AI代理正在逐渐改变我们的工作和生活方式。然而,让AI代理像人类一样操作网页一直是技术上的一个挑战。最近,一个名为Browser Use的开源项目引起了广泛关注。它通过集成大型语言模型(LLM)和自动化工具,使AI代理能够像人类一样浏览和操作网页。本文将详细介绍Browser Use的技术架构、主要功能、应用场景以及如何快速上手使用。

2025-05-08 16:24:47 1114 5

原创 【AI大模型前沿】TxGemma:谷歌推出的高效药物研发大模型,临床试验预测准确率超90%

在药物研发领域,高成本和高风险一直是困扰科学家们的难题。传统的药物研发过程繁琐且耗时,常常需要数年时间才能取得突破性进展。为了加速这一进程,谷歌推出了TxGemma,这是一款基于Gemma 2的高效、通用型大型语言模型(LLM),专门用于药物研发。TxGemma不仅能够进行药物特性预测,还具备对话能力和推理能力,为科学家们提供了一个强大的工具,帮助他们更高效地进行药物研发。TxGemma是谷歌推出的一款高效、通用的药物研发大模型,基于Gemma 2架构微调,融合了700万治疗实体数据进行多任务学习。

2025-05-08 08:00:00 2728 50

原创 【AI大模型前沿】一键生成宫崎骏动画风,EasyControl Ghibli 让照片秒变吉卜力艺术品

在AI大模型技术飞速发展的当下,图像生成领域不断涌现令人惊艳的创新成果。其中,由Tiamat AI、ShanghaiTech University、National University of Singapore、Liblib AI等机构联合打造的EasyControl框架脱颖而出,其衍生的EasyControl Ghibli更是备受瞩目。这款AI模型专注于将普通图像转化为极具魅力的吉卜力风格图像,为广大用户开启了一场独特的艺术创作之旅。

2025-05-07 16:06:35 1106 8

原创 【AI大模型前沿】Baichuan-M1-14B:百川智能推出专为医疗优化的开源大语言模型

随着人工智能技术的不断发展,大语言模型(LLM)在各个领域的应用越来越广泛。然而,针对特定领域的优化仍然是一个重要的研究方向。Baichuan-M1-14B 是由百川智能开发的一款专为医疗场景优化的开源大语言模型。它不仅在通用语言任务上表现出色,还在医疗领域展现了卓越的性能。Baichuan-M1-14B 是业界首款从零开始专为医疗场景优化的开源大语言模型。它旨在解决传统通用语言模型在医疗领域应用时的不足,例如对专业术语的理解、复杂医疗推理能力以及长序列任务的处理。

2025-05-07 08:00:00 1221 40

原创 【AI大模型前沿】Med-R1:基于强化学习的医疗视觉语言模型,突破跨模态医学推理的普适性

随着人工智能技术的发展,视觉语言模型(VLM)在医学影像分析和诊断中的应用逐渐崭露头角。一是容易过拟合到训练数据的特定模式,缺乏泛化能力;二是高质量的推理链数据稀缺,难以获取。为了解决这两大难题,Med-R1通过强化学习技术,显著提升了医学影像推理任务的泛化能力和可解释性。Med-R1 是一个基于强化学习的视觉语言模型,专门用于医学推理任务。支持 8 种医学影像模态支持 5 种关键诊断任务(解剖结构识别、疾病诊断、病灶分级、成像模态识别、生物学属性分析)

2025-05-06 16:00:00 1966 7

原创 【AI大模型前沿】Fin-R1:上海财经大学联合财跃星辰推出的金融推理大模型,凭7B参数拿下评测第二,离行业第一仅差3分

在人工智能技术飞速发展的今天,大语言模型(LLMs)正以前所未有的速度改变着各个领域。然而,在金融这个复杂且严谨的领域,通用的推理模型常常面临诸多挑战,如金融数据的碎片化、推理逻辑的不可控性以及业务泛化能力的不足等。为了攻克这些难题,上海财经大学统计与数据科学学院张立文教授团队(SUFE-AIFLM-Lab)联合财跃星辰,历经数月的刻苦钻研与实践,终于推出了 Fin-R1,一款专为金融推理量身打造的大型语言模型。

2025-05-06 08:00:00 1337 42

原创 【AI大模型前沿】InternVL:OpenGVLab开源多模态大模型,解锁视觉问答与多语言翻译的全能应用图鉴

在人工智能领域,多模态大模型的发展正以前所未有的速度改变着我们与技术的交互方式。从视觉到语言,从图像到文本,多模态模型正逐渐成为连接人类感知与机器理解的桥梁。今天,我们将深入探讨一个备受瞩目的开源多模态大模型——InternVL。由OpenGVLab推出,InternVL凭借其强大的技术架构和广泛的应用场景,正在成为多模态领域的重要力量。本文将从项目概述、技术原理、功能特点、应用场景、部署使用等多个方面,全面剖析InternVL,帮助读者快速了解这一前沿技术。

2025-05-05 19:16:57 967 7

原创 【MCP探索实践】MCP生态下的LangChain适配器:AI开发的加速引擎,多工具集成一步到位|

在人工智能领域,模型的互操作性和工具的集成能力是实现复杂应用的关键。应运而生,它是一座连接 Anthropic Model Context Protocol(MCP)工具与 LangChain 和 LangGraph 的桥梁。本文将深入探讨这个库的核心功能、安装配置以及实际应用场景,帮助读者快速掌握并利用这一强大工具。LangChain MCP Adapters 为整合 Anthropic Model Context Protocol 工具与 LangChain 和 LangGraph 提供了强大的支持。

2025-05-05 08:00:00 1398 7

原创 【MCP探索实践】百度地图 MCP Server:告别繁琐集成、让地图服务接入更简单

随着智能化技术的飞速发展,地图服务在智能体助手中的应用越来越广泛。百度地图作为国内领先的地图服务提供商,率先推出了全面兼容 MCP 协议的 MCP Server。这一创新举措不仅极大地拓展了地图服务的应用边界,还为开发者和用户带来了前所未有的便捷体验。本文将详细介绍百度地图 MCP Server 的技术原理、主要功能、应用场景以及如何快速上手使用,帮助读者更好地理解和应用这一前沿技术。

2025-05-04 16:00:00 983 7

原创 【MCP探索实践】Web Search MCP Server:无需 API 密钥的免费网络搜索服务

在开发智能体助手或需要集成网络搜索功能的应用程序时,获取和使用搜索结果常常需要依赖于各种搜索引擎的 API。然而,这些 API 通常需要申请密钥,并且可能伴随着使用限制和费用。开源项目web-search提供了一种无需 API 密钥即可进行网络搜索的解决方案,通过 Model Context Protocol (MCP) 协议,开发者可以轻松地将 Google 搜索结果集成到他们的应用中。本文将详细介绍 web-search 的技术原理、主要功能、应用场景以及如何快速上手使用。

2025-05-04 09:00:00 840 2

原创 【MCP探索实践】MindsDB:借助 MCP 协议,让 AI 大模型秒变 SQL 专家

在企业数字化转型的浪潮中,数据的价值愈发凸显。然而,数据碎片化和复杂查询需求成为摆在企业面前的两大难题。传统的数据处理方式依赖繁琐的 ETL(Extract,Transform,Load)流程,不仅效率低下,还难以适应快速变化的业务需求。同时,对于普通业务人员来说,掌握专业的 SQL 技能门槛较高,使得他们在面对海量数据时,难以快速获取有价值的信息。

2025-05-03 16:32:36 1265 6

原创 【MCP探索实践】3分钟搭建AI服务器,FastMCP让开发效率飙升10倍

在人工智能技术飞速发展的当下,模型上下文协议(MCP)作为一种标准化接口协议,逐渐成为连接语言模型(LLM)与外部资源的关键纽带。然而,实现 MCP 协议的复杂性往往让开发者们面临诸多挑战。为了打破这一困境,FastMCP 项目横空出世。它如同一束光,照亮了开发者们前行的道路,凭借其高效、简洁且极具 Python 风格的接口,极大程度地简化了 MCP 服务器的构建流程,让开发者们得以将更多的精力投入到工具和资源的开发中去,无需在底层实现的繁琐细节上过多纠缠。

2025-05-03 09:00:00 2452 56

原创 【MCP探索实践】MoLing:零依赖跨平台办公自动化神器,3分钟搞定文件+浏览器双核操作

在当今数字化时代,办公自动化和开发运维效率的提升成为企业和个人追求的关键目标。随着人工智能技术的不断发展,越来越多的工具被开发出来以满足这些需求。MoLing 作为一个本地 AI 办公自动化助手,凭借其独特的技术原理和强大的功能,正在成为办公和开发领域的新宠。本文将详细介绍 MoLing 的项目背景、技术原理、主要功能、应用场景以及如何快速部署和使用,帮助读者更好地了解和利用这一强大的工具。

2025-05-02 14:51:30 1425 3

原创 【MCP探索实践】GitHub MCP Server:为开发者打造的高效自动化工具

在当今快节奏的软件开发环境中,自动化工具成为了提高开发效率、减少重复性劳动的关键。GitHub作为全球最大的代码托管平台,拥有海量的项目和活跃的开发者社区。然而,随着项目规模的扩大和复杂度的增加,手动管理GitHub上的问题、Pull Request以及仓库内容变得越来越困难。为了应对这一挑战,GitHub官方开源了GitHub MCP Server,一个基于Model Context Protocol(MCP)的服务器工具,旨在通过自动化和智能化的方式提升开发者的GitHub使用体验。

2025-05-01 08:00:00 1053 4

原创 【MCP探索实践】FastAPI + MCP:2025年最火的后端与AI集成方案

在现代软件开发中,如何高效地将后端服务与 AI 模型进行集成是一个关键问题。FastAPI 作为一款高性能的 Python Web 框架,已经被广泛应用于构建后端服务。然而,随着 AI 技术的发展,如何将 FastAPI 应用与 AI 模型进行更高效的交互成为了一个新的需求。FastAPI-MCP 作为一个开源工具,提供了一种简单而强大的解决方案,能够将 FastAPI 应用的端点自动转换为符合的服务,从而实现与 AI 模型的无缝对接。

2025-04-30 16:02:24 1186 7

原创 【MCP探索实践】Cherry Studio+MCP实战:3步让AI自动抓网页/读文件/调API

在人工智能飞速发展的今天,AI 模型的应用场景不断拓展,但同时也面临着诸多挑战,例如如何让 AI 模型更好地与外部资源进行交互和协作。MCP(Model Context Protocol,模型上下文协议)作为一种新兴的接口协议,为解决这一问题提供了新的思路。而 Cherry Studio 作为一款功能强大的 AI 桌面客户端,其与 MCP 的融合更是为 AI 开发和应用带来了全新的机遇。

2025-04-30 08:00:00 2633 56

原创 【AI大模型前沿】阿里 Qwen3 震撼开源,模型新王诞生,开启全球大模型新纪元

在人工智能领域,大语言模型的发展速度令人瞩目。就在昨天,阿里巴巴正式开源了 Qwen3 系列大型语言模型,这标志着开源大模型领域又迎来了一位强有力的竞争者。本文将详细介绍 Qwen3 的技术特点、应用场景以及如何部署使用,帮助读者快速了解这一前沿技术。Qwen3 是阿里巴巴通义千问团队推出的最新一代大型语言模型。它包含 8 个不同尺寸的模型,既有稠密模型(Dense Model),也有混合专家(Mixture-of-Experts,MoE)模型。

2025-04-29 11:00:34 1247 11

原创 AI大模型ms-swift框架实战指南(十三):Agent智能体能力构建指南

在人工智能的蓬勃发展中,智能体(Agent)技术正逐渐成为实现智能交互与任务自动化的关键驱动力。MS-Swift框架对智能体的支持,为开发者提供了强大的工具,使其能够训练模型以具备处理复杂任务、与外部工具交互的能力。本文将深入剖析MS-Swift框架中智能体支持的相关内容,包括数据准备、训练技术、推理过程以及部署方式,旨在为读者全面呈现其技术细节与应用方法。智能体是一种能够感知环境、进行决策并采取行动以实现特定目标的软件实体。

2025-04-29 08:00:00 895 33

原创 AI大模型ms-swift框架实战指南(十二):模型量化效率提升指南

在人工智能模型的优化过程中,模型量化是一项关键技术,它能够在不显著降低模型性能的前提下,有效地减少模型的存储需求和计算量,从而提高模型的推理效率。本文将深入解读MS-Swift模型量化相关内容,包括支持的量化技术、环境准备、量化命令以及注意事项等,旨在帮助读者全面理解并掌握MS-Swift模型量化的核心要点与操作方法。MS-Swift提供了多种强大的量化技术,以满足不同场景下的模型优化需求。

2025-04-28 16:23:54 947 16

各领域行业ChatGPT Prompt提示词大全

本资料精心汇编了适用于各行各业的ChatGPT Prompt提示词,旨在帮助用户更高效地利用ChatGPT进行行业分析和内容创作。我们根据不同领域的特征和需求,归纳和整理了一系列有效的Prompt模板和词汇,以便于专业人士快速引导模型生成所需的专业信息或解决方案。 无论您从事的是科技、金融、教育还是医疗行业,或是任何其他专业领域,本资料的Prompt提示词都将助您一臂之力,使您能够更加精准地与ChatGPT沟通,从而提升工作效率、优化输出内容,并发掘更多的应用场景和商业价值。

2024-06-05

CVP架构的企业级知识库落地

1.基于ChatGPT+VectorDB+Prompt架构实现的企业级本地知识库源码; 2.企业可以通过这个知识库来管理和分析自己的数据,比如客户信息、市场调研结果、产品数据等。 3. 利用本地知识库+通过RAG机制实现检索生成增强,落地实现企业级本地知识库机器人方案。(为了提高检索的效率和准确性,采用了RAG(Retrieval-Augmented Generation)机制。这是一种先进的信息检索技术,它结合了传统的关键字检索和最新的生成模型技术。通过RAG机制,系统能够理解用户的查询意图,然后从知识库中检索出最相关的信息,最后通过生成模型将这些信息整合成有用的答案)

2024-05-26

Java面试专题及答案大全各类经验分享

Java面试专题及答案等,多个技术点面试大全;阿里百度美团面试题集合,各类经验分享

2024-04-16

Embedding-评论数据集

Embedding-评论数据集

2024-04-05

任意获取鼠标点击处的位置坐标

获取鼠标的坐标,通过js任意获取鼠标点击处的位置坐标。

2010-12-17

js实现定时隐藏div

js实现定时隐藏div层,任你设置时间,时间一到立即隐藏

2010-12-17

jquery匹配搜索

jquery就匹配搜索功能。模拟百度搜索栏,输入关键字自动提示。。。。

2010-11-22

jquery表单验证

jquery表单验证,jquery实现各种各类的无刷新表单验证。

2010-11-06

jquery技巧总结

jquery技巧总结,轻松,简单学习jquery.

2010-11-06

初学者必备资料-php-ext学习

初学者必备的学习PHP-EXT资料,详细实列

2010-09-10

js小技巧:当鼠标移上文字弹出层

js小技巧:当鼠标移上文字或照片的时候可以弹出层 层里面可以是文字、图片、表格

2010-07-16

面试必备十五问,面试难题预先知

在应聘的过程中,总会遇到一些难缠的问题,令人一时不知如何招架。当然这些问题并没有标准答案,个人以为,胜出的关键,是事先对应聘单位需要什么样的人有所了解,既“投其所好”,又诚信而本色地展示自我

2010-07-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除