自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小马过河R的博客

阿里云专家博主、简书创作者、计算机二级C语言、软件设计师、网络通信安全管理员四级、退役编辑部成员

  • 博客(82)
  • 收藏
  • 关注

原创 薅的人工智能证书Certificate

人工智能证书薅一下

2025-03-29 12:07:49 713 2

原创 ComfyUI入门初相识与默认工作流

ComfyUI是一个基于节点式工作流的Stable Diffusion可视化操作界面,通过将图像生成过程拆解为可自由组合的功能模块(如模型加载、文本编码、采样器等),实现对AI生成流程的精细控制。相比WebUI,ComfyUI具有更高的定制性、更好的性能表现和更强的流程复现能力,适合进阶用户进行复杂创作。其核心原理与Stable Diffusion一致,通过潜空间生成和迭代降噪来产生图像。本地部署需要8G以上显存的Nvidia显卡,通过安装自定义节点可扩展视频生成等高级功能。

2026-01-02 10:48:59 802 1

原创 混元世界模型1.5架构原理初探

腾讯混元世界模型1.5(HY World 1.5)是国内首个开源的实时世界模型框架,支持通过文本/图片生成可交互的3D场景。该模型采用WorldPlay自回归扩散技术,创新性地融合双分支动作表征、重构记忆机制等技术,实现24帧/秒的实时生成能力,同时保持几何一致性。其核心突破包括精准交互控制、3D一致性保障和高效强化学习框架,适用于游戏开发、虚拟现实等场景。模型已开源,提供从数据构建到流式推理的全流程支持,为AI内容创作提供了高效平台。

2026-01-01 10:43:09 1117 1

原创 ReAct和Function Calling之间的纠葛与恩恩怨怨

摘要: ReAct与Function Calling是大语言模型中两种不同的工具调用策略。Function Calling通过预定义函数直接匹配用户指令,适合标准化、流程固定的任务,效率高但灵活性低;ReAct采用“思考-行动-观察”的循环迭代,动态调整策略,适合复杂或开放性问题,但执行成本较高。两者的选择需权衡任务复杂度、性能与成本,例如简单查询优先Function Calling,多步推理则用ReAct。实验显示,在明确步骤的场景下,两者效果相近。开发者需根据实际需求选择策略,无绝对优劣之分。

2025-12-29 16:53:34 797 1

原创 2025,在AI星河中遨游,于CSDN星畔留痕

本文分享了作者"小马过河R"从2022年转型AI领域到2025年的技术探索历程。文章记录了智能问答系统从RAG+Bert到RAG+LLM的演进,AIGC短视频和AI生图的实践经验,以及基于Spec工作流的AI辅助编程模式。作者强调持续学习与分享的重要性,认为写作既是技术总结也是思维锻炼。在CSDN平台创作近百篇AI相关文章的过程中,作者既获得了专业成长,也收获了社区认可。文章以"AI不会替代人,只会淘汰不会使用AI的人"作结,表达了对技术发展的敬畏与期待。

2025-12-28 19:00:49 941

原创 RAG检索增强生成:通过重排序提升AI信息检索精准度

RAG召回之模型重排序

2025-12-22 20:01:43 898 2

原创 谷歌Nano Banana系列AI图像模型:从代号到原理的全解析

谷歌AI图像生成模型"Nano Banana"(Gemini 2.5 Flash Image)及其Pro版本采用原生多模态MoE Transformer架构,实现图像与文本的统一处理。基础版支持1024×1024分辨率,具有快速生成和角色一致性特点;Pro版基于Gemini 3 Pro,支持4K分辨率,强化了文字渲染和复杂场景融合能力。两个版本分别面向趣味创作和专业设计需求,通过Gemini App、API等方式提供服务。该系列通过交错生成、对话式编辑和多模态推理等技术,推动AI图像生成

2025-12-22 16:49:03 1166

原创 基于Skills驱动的AI编码

基于skills驱动的AI编码

2025-12-20 12:42:23 1237 2

原创 Codebuddy使用CloudBase MCP辅助AI编码基于Spec工作流开发的坦克大战小游戏

Codebuddy使用CloudBase MCP辅助AI编码基于Spec工作流开发的坦克大战小游戏

2025-12-16 19:07:47 834

原创 浅谈AI辅助编码从氛围编程Vibe Coding到基于spec规范驱动开发

浅谈AI辅助编码从氛围编程Vibe Coding到基于spec规范驱动开发

2025-12-14 12:16:53 1289 2

原创 开发游戏需要哪些岗位和角色参与

在一个游戏开发组里,策划、程序、美术是三个不可或缺的职能

2025-12-01 15:37:24 880

原创 tRPC-GO 框架Helloworld实践初体验

本文介绍了tRPC-Go框架的入门实践。首先简要说明了tRPC-Go作为高性能RPC框架的架构特点,重点介绍了如何使用trpc命令行工具链安装配置环境。文章详细展示了从定义protobuf接口规范、生成桩代码到实现业务逻辑的完整流程,包括安装trpc-cmdline工具、编写proto文件、生成客户端和服务端桩代码,以及实现服务接口的具体步骤。通过一个简单的HelloWorld示例,帮助读者快速上手tRPC-Go框架的基本使用方法。

2025-11-29 12:47:21 1024 1

原创 CDN原理及回源重写是什么意思

CDN 、COS 与 回源URL重写

2025-11-23 12:53:10 878

原创 Monorepo与Multirepo:企业级代码管理方案全面解析

monorepo multirepo企业级包管理器

2025-11-20 14:40:32 791 1

原创 APISIX和Kubernetes Ingress Controller如何配合使用?

apisix是一款云原生微服务API网关,可以为API提供终极性能、安全性、开源和可扩展的平台。apisix基于Nginx和etcd实现,与传统API网关相比,apisix具有动态路由和插件热加载,特别适合微服务系统下的API管理。

2025-11-18 13:51:13 972 3

原创 AIGC爆火西游记取经vlog视频制作教程案例

AIGC爆火西游记取经vlog视频制作教程案例

2025-11-09 10:56:00 1513 1

原创 AIGC首帧图尾帧图生成视频案例教程

AIGC首帧图尾帧图生成视频案例教程

2025-11-08 19:59:34 1694 3

原创 AI隐式标识‌中的红绿名单水印技术通俗讲解

红绿水印技术

2025-10-28 21:14:01 1127 1

原创 AIGC视频生成之Deepseek、百度妙笔组合实战小案例

摘要:本文介绍了如何利用百度妙笔工具结合Deepseek模型快速生成AIGC长视频的方法。作者以天文奇观"血月"为例,仅需输入文本内容,无需剪辑或素材,10分钟即可自动完成脚本生成、角色创建、分镜设计和视频合成全过程。文章展示了百度妙笔在中文理解方面的优势,并对比了与其他AIGC视频工具的效果差异。该方法特别适合零基础用户快速制作短视频内容。

2025-10-25 15:54:10 1423 3

原创 国庆爆火的Sora2使用初探和实例生成

国庆爆火的Sora2使用初探和实例生成

2025-10-18 20:22:17 3891 4

原创 23种设计模式PHP代码示例

23种设计模式PHP示例代码

2025-10-07 11:07:10 1051

原创 K8s引入Service Mesh原因及Istio入门

Service Mesh、Istio

2025-09-24 12:00:41 964 2

翻译 Helm Chart 教程:初学者简单指南

Helm Charts 教程:初学者简单指南

2025-09-23 12:45:39 169 3

原创 5分钟使用Dify实现《射雕英雄传》问答智能体Agent

Dify的实现案例, 5分钟使用Dify实现《射雕英雄传》问答智能体Agent, 一文上手Dify的使用

2025-09-21 22:36:41 1375 7

原创 Taichi太极图形编程语言实践demo

太极(Taichi)是一种嵌入Python的领域特定语言,专为高性能计算设计,支持CPU/GPU运行,适用于物理模拟、游戏开发等领域。本文介绍了太极的安装与实践:首先需安装Python 3.6-3.8版本,通过pip install taichi安装太极库。实践部分通过调试官方示例代码(如分形动画),解决了版本兼容性问题,最终成功运行动态图形演示。文章还提供了不同平台的后端支持说明和常见错误解决方法,为初学者提供了实用的入门指南。

2025-09-20 17:43:19 1273 7

原创 小白AIGC短视频生成的第一课之混元AI视频

摘要 2024-2025年,AI生成内容(AIGC)在短视频领域实现全流程自动化生产,推动新型内容形态如单元剧、互动剧的发展。本文以腾讯混元AI视频平台为例,探索图生视频技术的应用效果。通过二郎神大战美猴王的案例,对比混元AI视频1.0与万相2.2的生成质量,从画面清晰度、动作连贯性、提示词遵循度等维度进行评估。结果显示,混元AI视频在画面清晰度上表现优异,但在动作生成和叙事逻辑上仍有提升空间。文章还总结了AIGC短视频制作的核心流程(剧本→分镜→文生图→图生视频→剪辑→配音),并分析了不同平台的技术特点,

2025-09-07 14:47:12 2506 6

原创 k8s的SidecarSet配置和initContainers

k8s的SidecarSet配置和initContainers

2025-09-03 15:21:01 952 2

原创 k8s的CRD自定义资源类型示例

k8s 的CRD 自定义资源类型

2025-09-02 17:58:16 1125 3

原创 GPT-5原理

GPT-5原理

2025-08-29 16:11:14 1053 7

原创 多智能Multi-Agent原理与实现初探

多智能体系统(Multi-Agent)概述与应用价值 多智能体系统(MAS)是由多个自主智能体(Agent)通过协作、竞争等方式组成的分布式系统。每个智能体拥有独立的LLM模型、提示词、工具和代码,能够感知环境并自主决策。MAS通过集体行为解决复杂问题,突破了单智能体的局限性。 核心优势 突破上下文限制:通过功能拆分避免上下文窗口超限 增强灵活性:松耦合结构支持动态调整 提升效率:分工协作实现复杂任务分解 工作原理 智能体具备自主性、反应性、主动性和社交能力 通过通信、协作、协调、协商等方式交互 采用合同网

2025-08-17 13:10:43 2080 4

原创 LangChain是如何实现RAG多轮问答的

langchain是如何实现RAG多轮问答的

2025-08-13 21:09:58 849

原创 多轮问答与指代消解

多轮问答与指代消解

2025-08-12 22:39:13 969 2

原创 小白AIGC短视频生成的第一课

本文介绍了AIGC短视频制作入门指南,主要包含三个部分:制作流程、提示词公式和实践体验。作者总结出AIGC短视频制作需经过剧本编写、分镜、文生图、图生视频、剪辑和配音六个步骤。重点讲解了文生视频和图生视频的提示词公式,并比较了两者在主体一致性和创意自由度方面的优缺点。最后通过万相平台的实操案例,展示了如何运用提示词生成3D卡通风格的二郎神大战美猴王视频,同时指出免费版生成时间较长的问题。文章为AIGC视频创作新手提供了实用的入门指导。

2025-08-09 13:11:03 2408 3

原创 《深入浅出Embedding》这本书

《深入浅出Embedding》系统解析了Embedding技术的本质与实践应用。该书从向量化表达、技术演进、工业落地到认知维度四大层面,剖析如何将离散对象转化为低维稠密向量,实现语义关联计算。内容涵盖从Word2vec到BERT的技术发展,并结合推荐系统、机器翻译等实战案例,提供"万物皆可向量化"的思维范式。书中强调没有最优模型只有最适组合,将Embedding视为机器理解世界的"翻译词典"。适合不同层次读者,既可学习基础应用,也能深入技术优化,最终培养用向量空间视角

2025-08-06 23:05:42 972 1

原创 多模态大模型的原理

多模态模型通过整合多种数据模态(如文本、图像、音频、视频等),实现跨模态的理解与生成,其核心原理是将异构数据映射到统一语义空间并进行联合推理。

2025-08-03 12:25:08 1213 5

原创 MCP Agent 工程框架Dify初探

摘要:Dify初探:企业级AI应用开发平台解析 Dify是一款开源的大语言模型应用开发平台,融合了后端即服务和LLMOps理念,支持非技术人员参与AI应用开发。相比LangChain等工具库,Dify提供更完整的生产级解决方案,具备API调用、WebApp托管和易用界面三大核心功能。平台支持五种应用类型:聊天助手(多轮对话)、文本生成应用(表单式问答)、Agent(复杂任务分解与工具调用)、对话流和工作流。其中Agent类型尤为强大,支持Function calling和ReAct两种推理模式,可集成知识库

2025-08-02 17:30:00 1316 7

原创 如何5分钟快速搭建智能问答系统

5分钟快速搭建智能问答系统

2025-07-20 15:33:50 1608 5

原创 Prompt提示词的主要类型和核心原则

Prompt提示词的主要类型和核心原则

2025-07-10 23:05:44 1664 3

原创 k8s Ingress、Service配置各样例大全

k8s核心,ingress、service配置各样例大全

2025-06-23 09:43:20 1168 11

原创 K8s入门指南:架构解析浓缩版与服务间调用实战演示

本文介绍了Kubernetes(k8s)的核心概念和架构,帮助读者快速入门和复盘。k8s作为云原生基石,源自Google的Borg系统,其架构包含Master节点(Api Server、Scheduler、Controller)、Node节点(运行容器的kubelet和负载均衡的kube-proxy)以及Etcd键值数据库。重点解析了Pod作为最小部署单元的特性,以及Service的四种类型(ClusterIP、NodePort、LoadBalancer、ExternalName)及其作用。

2025-06-22 20:54:02 1374 7

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除