自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

举世誉之而不加劝,举世非之而不加沮,定乎内外之分,辩乎荣辱之境,斯已矣。

作为一名热衷于探索未知领域的博主,我希望通过我的文章能够启发读者在技术领域不断进步,同时在人生的旅途中找到更深层次的意义。

  • 博客(242)
  • 资源 (4)
  • 问答 (1)
  • 收藏
  • 关注

原创 驾驭未来:零基础读懂“驾驭工程”(Harness Engineering)

在混乱中建立秩序,在复杂中寻找路径。

2026-03-31 20:15:37 85

原创 零精度损失,6倍内存缩减:TurboQuant如何重新定义AI效率

谷歌研究院推出的TurboQuant算法解决了大语言模型KV Cache内存占用的关键难题。该技术通过创新的两阶段压缩方案(PolarQuant极坐标变换+QJL残差校正),在保持零精度损失的前提下,将内存占用减少6倍、推理速度提升8倍。相比传统量化方法,TurboQuant无需额外训练,可直接应用于现有模型,突破了AI领域的内存墙限制。这项技术有望显著降低大模型部署成本,推动更长上下文窗口的实用化发展。

2026-03-30 20:53:42 276

原创 Ubuntu 24.04 环境实战:ROS 2 Kilted 实现 SLAM 建图与 Nav2 导航

本文介绍了使用ROS2和TurtleBot3进行SLAM建图与自主导航的完整流程。首先安装slam_toolbox和TurtleBot3相关依赖包,配置清华源加速下载。通过Gazebo启动仿真环境后,使用slam_toolbox进行地图构建,并在RViz中可视化建图过程。完成地图扫描后,通过map_saver保存地图文件。在自主导航部分,使用Nav2实现路径规划与导航功能,展示了从环境搭建到实际应用的完整工作流程。文中包含详细命令、参数配置和可视化效果截图,为ROS2下的机器人建图导航提供了实用参考。

2026-03-25 17:17:44 397

原创 在 Deepin 20.9 + N卡 930MX(2GB) 上跑 Qwen3.5 模型

折腾日志。

2026-03-20 09:52:29 434

原创 Agent Skills 实战(.NET):理论 × 代码 × 企业案例

本文介绍了2025年10月Anthropic发布Claude Skills后AI Agent生态的变革,重点解析了Agent Skills的核心思想——渐进式披露与工具调用。文章从.NET开发者视角出发,详细指导如何构建Agent Skills简易框架和企业级实战案例,并解析OpenClaw原理,最后实现一个MiniClaw。

2026-03-19 14:59:18 460

原创 高效AI编程:国内开发者必备的IDE与插件盘点

国内开发者必备的IDE与插件盘点。

2026-03-17 17:59:36 796

原创 零成本养虾指南:OpenClaw从入门到卸载

本文介绍OpenClaw使用指南。

2026-03-17 14:53:56 1823

原创 OpenCode 入门宝典:小白也能玩转编程

OpenCode是一款开源、模型无关的AI编程助手,支持75+模型提供商和本地部署,提供双Agent模式(Build/Plan)确保安全开发。具备隐私优先设计、强大工具集和扩展能力,支持多平台安装和自定义配置。通过自然语言交互可完成代码分析、编写、调试等任务,适用于重视数据隐私和控制力的开发者及团队。支持本地模型部署和技能配置,提供灵活高效的AI辅助编程体验。

2026-03-12 18:01:06 720

原创 Agent Skills 完全构建指南:从理论到代码落地

Agent Skills是一种模块化格式,用于为AI智能体赋予专业能力。它将领域知识、工作流程打包成可复用的技能包,采用三层渐进式加载架构:元数据(常驻)、指令(按需)、资源(触发执行)。相比传统提示词,Agent Skills具有持久化、可复用、执行可靠等优势,能有效解决智能体缺乏专业上下文的问题。典型应用包括文档处理、开发运维、业务流程自动化等。开发者可构建跨平台技能,终端用户可快速获得新能力,企业可编码组织知识。该技术代表AI从聊天助手向工作伙伴的演进方向。

2026-03-12 17:19:42 661

原创 实战指南:造相 Z-Image 文生图模型

Z-Image是专为高质量图像生成设计的基础模型,具备强生成多样性和广泛风格覆盖能力,文本介绍Z-Image的实战使用。

2026-03-02 21:08:27 625

原创 实战指南:Qwen3-ASR-1.7B 语音识别

本文介绍了Qwen3-ASR语音识别模型的安装与使用。

2026-02-28 09:06:56 1044

原创 Windows 10 环境下 Poppler 库的编译指南

本文详细介绍了在Windows环境下编译Poppler库的完整流程。

2026-01-21 23:23:34 1012

原创 Qt for Python:PySide6 入门指南(下篇)

本文介绍了使用PySide6和QML进行GUI开发的基础知识和集成方法,详细说明了QML与Python之间的信号槽连接、数据类型转换和UI元素属性控制,为开发者提供了PySide6与QML结合开发的实用指南。

2026-01-20 12:43:57 781

原创 Qt for Python:PySide6 入门指南(中篇)

本文介绍了使用PySide6进行Qt Widgets开发的基础知识。首先通过Hello World示例展示了创建基本窗口程序的方法,包括QApplication初始化、QLabel控件使用和主循环启动。接着讲解了两种使用.ui文件的方式:通过pyside6-uic工具生成Python类或使用QUiLoader直接加载。最后介绍了控件样式设置方法,包括使用setStyleSheet直接定义样式和通过.qss文件实现样式分离。文章提供了完整的代码示例和效果截图,帮助开发者快速上手PySide6的GUI开发。

2026-01-20 12:42:22 1291 1

原创 零基础玩转 C++ OpenCV(Ubuntu 24.04实战指南)

本文介绍了如何在Ubuntu 24.04上搭建C++和OpenCV开发环境,并实现基本的图像处理功能。主要内容包括:安装必要的编译工具和OpenCV库;编写并运行简单的C++程序;理解OpenCV核心的Mat类概念;实现图像的加载、显示和保存操作。文章采用循序渐进的方式,从环境配置到实际应用,帮助读者快速掌握计算机视觉开发的基础技能。

2026-01-16 17:46:50 926

原创 Qt for Python:PySide6 入门指南(上篇)

PySide6 是 Qt 官方为 Python 提供的跨平台图形界面(GUI)开发库,是 Qt C++ 框架的官方 Python 绑定,让你能用 Python 的简洁语法调用 Qt 的强大功能,开发出专业、美观的桌面应用。

2026-01-16 16:04:12 1270

原创 为什么在 Windows 上用 Clang/LLVM?

Clang/LLVM是一套开源的现代化编译器工具链,由Clang(C/C++前端)和LLVM(优化与代码生成后端)组成。它将源代码转换为LLVM中间表示(IR),经优化后生成目标平台机器码。相比MSVC/GCC,Clang具有更快的编译速度、更清晰的错误提示和更好的跨平台一致性,支持现代C++标准。在Windows上需配合MSVC标准库使用,工具链包含clang++、lld、clang-tidy等实用工具。

2026-01-16 15:01:55 839

原创 突破语言边界:Python 与 C/C++ 集成方案年度深度总结

技术融合与边界拓展:Python 3.10+ 中 C/C++ 集成方案年度深度总结

2025-12-27 19:39:07 1304 1

原创 实战指南:DeepSeek OCR

DeepSeek OCR 是一款两阶段 Transformer 文档 AI,先将页面图像压缩成紧凑的视觉 Token,再以高容量的专家混合语言模型解码。

2025-12-19 15:47:37 706

原创 实战指南:Hunyuan OCR

HunyuanOCR是一款基于混元多模态架构的轻量级端到端OCR模型,仅1B参数即可实现行业领先性能,该模型支持多语言文档解析、文本识别、信息提取等多种任务。

2025-12-19 12:24:00 304

转载 (转载)真正的缘分,“推背感”都很强

真正的缘分,从来不需要你千挑万选。它只需要你,在别无选择时,选择相信。

2025-12-18 17:52:24 103

原创 Ubuntu24.04 日常运维合集

本文汇总了Ubuntu 24.04系统运维中的常见问题解决方案。

2025-12-18 16:55:18 1466 1

原创 Tauri 开发初体验:从安装到运行全流程

Tauri 是一个跨平台桌面应用开发框架,支持使用前端技术构建轻量级应用。它利用系统原生 webview 减小应用体积(可小于600KB),并基于 Rust 提供安全可靠的基础架构。开发者可以灵活选择前端框架(如React、Vue)和多种后端语言(Rust/Swift/Kotlin)。

2025-12-18 15:53:05 1567

原创 LangChain实战:基于图数据库的问答

本文介绍了如何在图数据库Neo4j上构建语义层,使用大型语言模型(LLM)进行交互。主要内容包括:1)环境配置,安装依赖包、LLM大模型和Neo4j数据库;2)数据库操作,创建连接并导入电影数据集;3)实现自定义工具,通过Cypher模板检索电影和演员信息;4)构建智能体,使用LangGraph实现ReAct模式的交互流程。该方法避免了直接生成Cypher语句的不稳定性,通过语义层工具实现更可靠的数据库交互。

2025-12-16 15:11:55 188

原创 实战指南:通义万相2.2-图文生视频模型

Wan2.2是一款创新的视频生成模型,具有以下核心优势:1)采用MoE架构提升模型容量而不增加计算成本;2)整合电影级美学数据实现精细风格控制;3)基于大量训练数据(图像+65.6%,视频+83.2%)实现卓越运动生成能力;4)支持720P@24fps高清视频生成,可在消费级显卡运行。安装步骤包括克隆仓库、安装依赖和下载模型,需注意解决librosa依赖和Flash-Attention版本兼容问题(需2.7.1-2.8.2版本)。该模型为目前最快的720P视频生成方案之一,适用于工业与学术领域。

2025-12-15 17:22:59 628

原创 LangChain核心组件:流式传输与结构化输出

本文介绍了LangChain框架中的流式传输与结构化输出。

2025-12-15 14:56:43 99

原创 实战指南:Stable Diffusion 3.5 文生图模型

Stable Diffusion 3.5是Stability AI推出的新一代开源AI图像生成模型,具有80亿参数,支持生成百万像素级高质量图像。文章详细介绍了SD3.5的环境搭建、模型下载和推理实现方法,包括基础安装步骤(pip安装modelscope、torch等依赖)和显存优化方案(CPU offload和量化模型)。针对不同硬件配置提供了最佳实践:标准配置推荐1024×1024分辨率、28步推理;低显存设备建议使用4bit量化技术。

2025-12-08 17:59:50 266

原创 实战指南:Qwen3-VL 视觉语言模型

Qwen3-VL是阿里云推出的新一代视觉语言模型,具有以下核心特点:1) 采用交错MRoPE和DeepStack架构,增强视频理解和细粒度图像对齐;2) 支持256K长上下文,可扩展至1M;3) 具备视觉代理、空间感知、OCR识别等增强功能。使用指南包括:通过ModelScope下载模型、安装flash attention优化推理速度、提供标准API调用示例及推荐生成参数。该模型在图像描述、视频理解、GUI操作等场景表现优异,支持从边缘到云端的灵活部署。

2025-12-08 09:43:34 375

原创 实战指南:HunyuanWorld-Mirror 3D几何预测模型

本文介绍混元世界1.1模型

2025-12-06 10:52:42 171

原创 实战指南:HunyuanVideo-1.5 视频生成模型

HunyuanVideo-1.5是一款轻量高效的视频生成模型,仅需8.3B参数即可提供专业级质量。该模型采用创新的扩散变换器架构,结合3D因果VAE和SSTA注意力机制,实现16倍空间压缩和4倍时间压缩,推理速度比FlashAttention-3快1.87倍。支持1080p超分辨率增强,并优化端到端训练流程。硬件要求为14GB显存的NVIDIA GPU,软件需Linux系统、Python 3.10+和兼容CUDA版本。社区提供了多种集成方案,包括Diffusers、ComfyUI插件等。

2025-12-06 10:30:28 345

原创 实战指南:造相-Z-Image-Turbo 文生图模型

本文介绍Z-Image-Turbo文生图模型

2025-11-30 22:01:00 916

原创 OpenTCS 7.0.1 开发手册(下篇)

本文介绍了OpenTCS内核应用程序的自定义和扩展方法。主要内容包括:1)通过Guice模块配置内核组件,包括注册自定义模块和替换默认内核组件;2)自定义车辆数据传输转换器,实现坐标系统转换等功能;3)开发车辆驱动程序的方法,详细说明了内核和控制中心的关键接口,以及创建驱动程序的步骤和注册流程。开发者可以通过这些扩展点实现特定业务需求,如自定义调度算法、车辆通信协议等。

2025-11-27 11:46:55 769

原创 OpenTCS 7.0.1 开发手册(上篇)

OpenTCS是一款开源的自动导引车(AGV)控制系统框架,采用MIT许可证。本文介绍了OpenTCS 7.0.1的安装部署步骤,包括JDK21环境配置和软件包下载。OpenTCS作为一个通用框架,提供车辆路径规划、任务调度等核心功能,但需要自行开发车辆驱动适配器。系统包含多个模块,开发者可通过Maven集成所需组件。文档详细说明了各模块功能及API兼容性,并提供了技术支持渠道。该软件适用于需要协调多类型AGV的工业场景,但需根据实际需求进行二次开发。

2025-11-27 10:10:19 1272

原创 OpenTCS 7.0.1 用户手册(下篇)

OpenTCS系统提供了多种默认策略模块,包括分派器、路由器、调度器和外围设备作业分派器。分派器负责运输订单和车辆的分配决策,考虑路线可行性、车辆状态等因素。路由器采用Dijkstra算法计算最优路径,支持多种成本函数和路由组配置。调度器实现简单的交通管理策略,通过互斥资源分配确保安全性。外围设备作业分派器处理外围作业分配,考虑设备状态和预约令牌。这些默认实现可根据项目需求灵活替换和配置,为自动化运输控制系统提供基础功能框架。

2025-11-26 16:53:29 968 2

原创 OpenTCS 7.0.1 用户手册(上篇)

本文介绍了OpenTCS(开放式运输控制系统)的安装配置与系统概述。首先详细说明了如何下载OpenTCS 7.0.1版本并配置JDK21运行环境。然后阐述了OpenTCS的核心功能:作为开源AGV控制系统框架,采用MIT许可证,提供车辆路径规划、任务调度等基础功能,但需自行开发通信适配器实现与具体车辆的对接。系统采用客户端-服务器架构,包含内核服务器、模型编辑器、操作台等组件,支持多类型车辆同时管理。文章还说明了工厂模型的基本元素(如点、路径等)和系统运行所需的软硬件环境,并提供了开发者文档和技术支持渠道。

2025-11-26 11:50:14 1390

转载 (转载)古人常说:“法不轻传,道不贱卖,师不顺路,医不叩门”,何意?

“法不轻传,道不贱卖,师不顺路,医不叩门”,这绝非是在摆架子,而是在漫长的历史长河与复杂的人际交往中总结出的智慧。人性是复杂的,经不得随意考验。天雨虽大,不润无根之草;道法虽宽,只渡有缘之人。只有那些真正有根基、有诚意、有缘分的人,才能领悟法与道的精髓,才能得到老师的悉心教导,才能在医生的帮助下恢复健康。我们应当尊重这些古老的智慧,让它们在现代社会中继续发挥积极的作用 。

2025-11-24 16:22:02 838

转载 (转载)天雨虽大,不润无根之草;道法虽宽,只渡有缘之人!

人不自救,天也难佑。与其等待天来渡我,不如做自己的“摆渡人”。

2025-11-24 16:01:14 192

转载 (转载)最好的生活方式:不说闲话,不管闲事,不做闲人

人生,是一场自我的修行。每个人都有自己的活法,你不能拿你的尺子去度量他人的人生。更何况,我们也管不了那么多,过好自己的生活,已经足矣。

2025-11-24 10:44:11 99

转载 (转载)别焦虑,生活不过是见招拆招

人生下半场,希望我们都放下焦虑,允许自己出错,允许自己平庸,允许事与愿违,去经历、去体验,去享受人间一趟的美好。

2025-11-24 10:07:29 89

原创 Tree-sitter:AI Code Review 的底层基石与实践指南

本文深入介绍了Tree-sitter这一革命性的代码解析技术。

2025-11-21 16:36:10 762

NVIDIA-Linux-x86-64-570.207.run

# N卡驱动 # 版本:570.207 # 适用于:Linux # 安装指令:sudo bash NVIDIA-Linux-x86_64-570.207.run

2025-12-03

AGV调度系统(简版)-251128.zip

# AGV调度系统 # 开发语言:C#,SQL

2025-11-28

node-v24.11.1-linux-x64.tar.xz

# nodejs # 24.11.1 # 适用于linux系统 # 使用方法:解压后直接使用

2025-11-27

gradle-8.14.3-bin.zip

# gradle # 版本:8.14.3 # 适用于:linux # 免安装,解压直接使用

2025-11-27

openjdk-21.0.2_linux-x64_bin.zip

描述:openjdk-21.0.2 适用于:linux系统 使用方式:解压后,配置环境变量即可 export JAVA_HOME=/home/sam/jdk-21.0.2 export PATH=${JAVA_HOME}/bin:$PATH

2025-11-24

opentcs-7.0.1-bin.zip

可执行的控制系统软件及文档(面向用户和开发人员)。 官网:https://opentcs.org/en/download.html

2025-11-24

Tree-sitter:AI Code Review 的底层基石与实践指南.ipynb

# https://jianshengma.blog.csdn.net/article/details/155069839 # Tree-sitter:AI Code Review 的底层基石与实践指南 # 案例源码

2025-11-21

LangChain核心组件:短期记忆.ipynb

# LangChain核心组件:短期记忆 # https://blog.csdn.net/weixin_47560078/article/details/154943677 # python # LangChain # 智能体

2025-11-18

FoundationStereo仓库源码2025.zip

FoundationStereo是NVIDIA推出的首个专注于‌零样本泛化‌的立体深度估计基础模型,其核心目标是通过大规模合成数据训练和创新的架构设计,实现在无需微调的情况下跨领域(如室内/室外、无纹理/反射/透明物体等场景)的高精度深度估计‌。

2025-11-17

深度学习入门指南:从零开始,手把手教你理解、构建与应用神经网络.ipynb

深度学习入门指南:从零开始,手把手教你理解、构建与应用神经网络 https://jianshengma.blog.csdn.net/article/details/154773234

2025-11-13

LangChain v1.0 快速入门.ipynb

# 文章源码 https://blog.csdn.net/weixin_47560078/article/details/154567332 # 框架:LangChain v1.0 # 语言:python3.10

2025-11-08

零基础入门AI智能体:你的第一个数字伙伴是如何思考与行动的?.ipynb

# 文章链接:https://blog.csdn.net/weixin_47560078/article/details/154388419 # 内容:智能体零基础入门 # python,人工智能 # 形式:notebook

2025-11-04

从零到一:用C#玩转OpenAI大模型的完整指南.pdf

内容概要:本文是一份面向C#开发者的OpenAI大模型集成指南,系统讲解了如何使用C#调用OpenAI兼容的API实现大语言模型、图像生成、语音识别与合成、文本嵌入等核心功能。文章从环境搭建开始,涵盖API密钥获取、.NET项目配置、第三方库安装,并深入介绍Chat Completion、DALL·E图像生成、Whisper语音转录、TTS语音合成及Embeddings向量化等技术的实现方式,结合硅基流动等国内平台降低学习门槛。通过构建智能客服机器人的实战案例,展示了上下文管理、服务封装和错误处理等工程实践,并提供了安全配置、成本控制、提示工程和单元测试等高级技巧。; 适合人群:具备基础C#编程能力(熟悉异步编程、类与对象),有一定.NET开发经验的研发人员,尤其是希望将AI能力集成到企业应用、桌面软件或Unity游戏中的开发者;适合工作1-3年想拓展AI技能栈的程序员。; 使用场景及目标:①学习如何在C#项目中调用主流大模型API完成文本对话、图像生成、语音处理和语义向量提取;②掌握AI服务封装、上下文管理、流式响应、Mock测试等实际开发技术;③构建可落地的AI应用如智能客服、内容生成工具等;④理解提示工程、安全性控制与成本优化策略。; 阅读建议:此资源以动手实践为主线,建议边学边练,配合代码调试加深理解。优先使用国内兼容OpenAI的平台(如硅基流动)避免网络问题,注意API密钥安全管理,推荐使用环境变量或.NET User Secrets。学习过程中应重点关注异步编程模式、错误处理机制与项目结构设计,为后续扩展到Web API或移动后端打下基础。

2025-11-03

Python OpenAI库完全指南:从零开始掌握大模型编程.pdf

内容概要:本文是一份全面的《Python OpenAI库完全指南》,旨在帮助初学者和有一定Python基础的开发者掌握如何使用Python调用OpenAI及其兼容平台的大模型服务。内容涵盖环境搭建、API密钥配置、文本生成、图像生成(DALL·E)、语音识别(Whisper)、嵌入向量与语义搜索、错误处理、成本控制、安全实践以及实际应用案例(如智能客服、内容创作、代码辅助等),并介绍了性能优化技巧如异步调用和缓存策略。文中还推荐使用国内兼容OpenAI接口的平台(如硅基流动)以降低学习门槛,并提供免费模型用于实践。 适合人群:零基础或具备一定Python编程经验、希望入门大模型开发的初学者,以及想系统掌握OpenAI库功能的初级开发者。 使用场景及目标:①学习如何通过Python调用大模型实现文本对话、图像生成、语音转写和语义搜索等功能;②构建智能客服、内容生成工具、代码助手等AI应用原型;③掌握API调用的安全规范、成本控制与性能优化方法。 阅读建议:建议边读边实践,按照章节顺序完成环境配置与代码示例,重点关注API调用方式、参数调优和错误处理机制。同时结合国内平台资源进行低成本实验,深入理解大模型集成开发全流程。

2025-10-31

Python与人工智能:初学者的编程指南.pdf

内容概要:本文是一份针对初学者的Python编程入门指南,重点介绍Python在人工智能领域的核心地位及其易学性。文章通过实践导向的方式,系统讲解了Python基础语法、变量与数据类型、运算符、控制流、循环、函数、容器类型、文件操作、错误处理及面向对象编程等核心概念,并结合Anaconda环境搭建和Jupyter Lab等工具使用,帮助读者快速上手。同时,文档进一步延伸至AI学习路径,涵盖数据科学三剑客(NumPy、Pandas、Matplotlib)、机器学习(Scikit-learn)和深度学习框架(TensorFlow/PyTorch),并深入探讨了装饰器、生成器、上下文管理器等高级编程技巧,为后续AI开发奠定坚实基础。; 适合人群:零基础或具备少量编程经验、希望进入人工智能、数据科学领域的初学者,以及从事科研或工程实践需快速掌握Python技能的研发人员。; 使用场景及目标:①系统学习Python编程基础知识并应用于AI领域;②掌握数据处理、模型训练与项目开发的完整流程;③理解并运用高级编程机制如装饰器、生成器、上下文管理器提升代码质量与效率;④为后续深入学习机器学习与深度学习打下扎实的编程基础。; 阅读建议:建议按照章节顺序逐步学习,注重动手实践,每学完一个知识点即编写相应代码进行验证,配合官方文档查阅加深理解,并尝试完成文中提出的小项目以巩固所学。

2025-10-30

GPT结构剖析:从“词袋”到“思想”的魔法之旅.pdf

内容概要:本文深入剖析了GPT模型的核心结构——Transformer,揭示其从“词袋”匹配到具备上下文理解能力的技术演进路径。文章首先指出传统模型在语义理解上的局限,进而介绍词嵌入技术如何赋予词语丰富的语义表示,并重点解析Transformer中的自注意力机制、多头注意力、前馈神经网络及残差连接等关键技术组件。随后阐明GPT为何采用纯解码器架构及其掩码自注意力机制的工作原理,完整呈现GPT从输入分词、嵌入编码、多层解码器处理到自回归生成的全流程。最后探讨了GPT强大的原因在于规模效应、全局视野、预训练范式和并行计算优势,同时也客观指出其存在幻觉、缺乏真实理解和推理局限等问题。; 适合人群:具备一定自然语言处理基础知识、对深度学习模型感兴趣的研发人员或学生,尤其是希望理解大模型底层机制的技术从业者; 使用场景及目标:①理解Transformer如何解决长期依赖问题并实现上下文感知;②掌握自注意力与多头注意力的运作机制;③了解GPT为何采用解码器架构及其实现文本生成的全过程;④认识当前大模型的优势与局限,指导实际应用中的优化与规避风险;

2025-10-28

从单轮到多轮:大模型对话API的上下文管理艺术与工程实践.pdf

内容概要:本文深入探讨了大模型对话API中单轮与多轮对话的区别及其核心技术实现,重点剖析了多轮对话中的上下文管理机制。文章从单轮对话的无状态特性入手,逐步引出多轮对话在实现连贯交互中的必要性,并详细分析了上下文窗口限制带来的技术挑战,提出了包括滑动窗口、上下文摘要、RAG(检索增强生成)在内的多种解决方案。同时,文章还讨论了角色漂移、成本性能权衡等问题,并给出了服务端状态管理、Function Calling、日志监控等最佳实践建议,旨在帮助开发者构建稳定、高效、用户体验优良的多轮对话系统。; 适合人群:具备一定AI和API开发经验的工程师、技术负责人及对话系统设计人员,尤其适合从事智能客服、虚拟助手等交互式应用开发的研发人员; 使用场景及目标:①理解单轮与多轮对话API的设计差异与技术选型依据;②掌握上下文管理的核心策略(如RAG、摘要)以应对长对话场景;③构建具备记忆能力、意图连贯性和高可靠性的AI对话应用; 阅读建议:此资源不仅涵盖理论原理,更强调工程实践,建议结合实际项目场景边学边练,重点关注上下文管理策略的选择与Function Calling的集成应用,并注意在实现过程中平衡性能、成本与用户体验。

2025-10-28

【人工智能开发】基于API调用的大模型应用:电商智能客服系统构建与性能优化全流程解析

内容概要:本文系统讲解了如何通过API调用大语言模型(LLM)的全流程,涵盖技术原理、主流平台对比、开发实现、参数调优、性能优化、安全合规及常见问题解决方案。重点介绍了OpenAI、Anthropic、阿里通义、深度求索、百度文心等国内外主流大模型API平台的选择与使用方法,并以Python为例演示了通过官方SDK或requests库进行API调用的具体代码实现。文章还结合电商智能客服的实战案例,展示多轮对话、意图识别、上下文管理及外部系统集成的完整流程,并提供了降低延迟、控制成本、保护密钥和数据隐私的最佳实践。; 适合人群:具备基本编程能力,尤其是熟悉Python的开发者,以及希望快速集成大模型能力的产品经理、AI应用开发者和技术决策者;适合工作1-3年、希望进入AI应用层开发的技术人员; 使用场景及目标:① 学习如何通过API快速接入大模型能力,避免从零训练;② 掌握智能客服、自动化问答等实际业务场景的构建方法;③ 优化API调用性能与成本,确保安全合规;④ 理解提示工程、上下文管理、token控制等关键技术细节; 阅读建议:建议边读边动手实践,优先使用硅基流动等支持免费额度的平台进行测试,从简单问答开始逐步实现多轮对话与系统集成,同时关注参数调优与安全规范,深入理解API背后的设计逻辑。

2025-10-28

人工智能RAG+Agent+小模型协同架构:构建可靠高效经济的企业级AI应用系统设计

内容概要:本文系统阐述了RAG(检索增强生成)、Agent(智能体)和小模型三大技术协同构建可靠、高效、经济的AI应用新范式。文章指出大模型存在幻觉、知识固化、成本高和缺乏行动力等问题,提出通过RAG解决知识准确性与时效性,借助Agent赋予AI规划与执行能力,利用小模型实现低成本、低延迟的高效推理。三者构成分层协作架构:小模型作为“守门员”处理简单请求与路由,RAG提供基于私有知识库的精准问答,Agent则完成复杂任务的自主规划与操作执行,共同打造面向企业级应用的智能化解决方案。; 适合人群:AI开发者、技术负责人、产品经理及对AI应用落地感兴趣的从业者,具备一定机器学习或软件开发基础者更佳; 使用场景及目标:①构建企业级智能客服、知识助手等需要高准确性和自动化的AI系统;②优化AI应用成本结构,提升响应效率与安全性;③实现私有知识融合、任务自动化执行与模型资源的合理分配; 阅读建议:此资源强调技术组合的系统性设计,建议结合实际业务场景深入理解各模块协作逻辑,并参考架构图进行原型搭建与迭代验证。

2025-10-28

一文读懂大模型推理框架:10大工具的优缺点、适用场景与选型推荐-.pdf

内容概要:本文系统梳理了当前主流的十大大型语言模型推理框架,涵盖其核心定位、主要优缺点、适用场景及推荐指数。通过对Hugging Face Transformers、vLLM、TensorRT-LLM、TGI、SGLang、llama.cpp、LM Studio、Ollama、LMDeploy和ModelScope等框架的深入对比分析,帮助读者理解各工具的技术特点与生态定位,进而做出合理的选型决策。文章强调不同框架在性能、易用性、部署环境、硬件依赖和应用场景等方面的差异,为研究、开发和生产提供了清晰的指导路径。; 适合人群:具备一定机器学习或深度学习基础,从事大模型研发、部署或应用的工程师、技术负责人及研究人员,尤其是需要进行推理框架选型的技术人员;同时也适合希望在本地运行大模型的开发者和非技术背景的探索者。; 使用场景及目标:①为大模型推理服务选择合适的高性能框架(如vLLM、TensorRT-LLM用于生产部署);②在本地或边缘设备上轻量级运行模型(如llama.cpp、Ollama);③快速原型验证与模型管理;④复杂提示工程与智能体应用优化;⑤中文模型部署与国内合规环境适配。; 阅读建议:此资源以实际应用为导向,建议读者结合自身硬件环境、部署需求和模型生态进行对照选择,并在实践中验证不同框架的性能表现与集成成本,重点关注兼容性、量化支持与服务化能力。

2025-10-27

world-map-slam建图-ros2(kilted).zip

# ros2(kilted) 使用 slam 建图 # 世界模型 world 地图 # 包含地图文件 pgm 与 yaml

2026-03-21

MiniClaw-.Net8框架.zip

# 相关文章:Agent Skills 实战(.NET):理论 × 代码 × 企业案例 # 文章链接:https://jianshengma.blog.csdn.net/article/details/159200856 # 文章介绍了2025年10月Anthropic发布Claude Skills后AI Agent生态的变革,重点解析了Agent Skills的核心思想:渐进式披露与工具调用,从.NET开发者视角出发,详细指导如何构建Agent Skills简易框架和企业级实战案例,并解析OpenClaw原理,最后实现一个MiniClaw。 # 本资源包含:Agent Skills概念框架、Agent Skills企业级案例、MiniClaw基础框架,基于 .Net8。

2026-03-19

Agent-Skills-Demo-V1.0.zip

# 相关文章:Agent Skills 完全构建指南:从理论到代码落地 # https://blog.csdn.net/weixin_47560078/article/details/158961626 # 使用Python从零到一带你实现Agent Skills

2026-03-12

qt5-poppler-demo.zip

# qt5.14.2实现poppler库移植,渲染pdf文件 # 注意:示例代码仅适用于mingw-64

2026-01-21

poppler-26.01.0-vcpkg.zip

# poppler-26.01.0 QT5依赖库 # vcpkg 下载的依赖文件,下载后放入vcpkg\downloads即可

2026-01-21

vs2022-Community.exe

# vs2022 社区版在线安装包

2026-01-21

poppler-26.01.0.tar.xz

The latest stable release is poppler-26.01.0.tar.xz, released on January 6, 2026: core: * Improve signature compatibiluty on some files * Add support for de-facto standard annotation icons * Splash: Implement more blending modes for mono1/8 * Internal code improvements * Fix crashes in malformed documents utils: * pdfinfo: Print alt text in -struct cpp: * Remove deprecated time functions qt: * Add reading order option for getText()

2026-01-20

QmlExample.zip

# Qt for Python:PySide6 入门指南 # QML 示例源码以及打包环境 # https://jianshengma.blog.csdn.net/article/details/157138161 # 基于 Pyside6

2026-01-20

WidgetExample.zip

# Qt for Python:PySide6 入门指南 # QML 示例源码 # https://jianshengma.blog.csdn.net/article/details/157060137 # 基于 Pyside6

2026-01-20

零基础玩转 C++ OpenCV(Ubuntu 24.04实战指南)

零基础玩转 C++ OpenCV(Ubuntu 24.04实战指南),文章示例源码,以及文档扫描案例。

2026-01-16

tauri-1.92.0-build-tools-win10.zip

# 解压后,将文件夹覆盖到:C:\Users\你的用户名\AppData\Local\tauri\ # 参考文章:Tauri 开发初体验:从安装到运行全流程 https://blog.csdn.net/weixin_47560078/article/details/155309548

2026-01-06

nsis-3.11.zip

# nsis-3.11 离线包,使用于Win10 # 解压后使用

2026-01-06

突破语言边界:Python 与 C/C++ 集成方案年度深度总结

在Python中调用C++源代码,共6个案例,包含智能订单算法

2025-12-27

transformers-82a06d-hunyuanocr.zip

# transformers 源码 # 适用于 hunyuanocr # 解压后安装即可:pip install -e .

2025-12-19

构建基于图数据库的问答应用程序.ipynb

# 框架:LangChain 0.3 # 开发语言:python

2025-12-16

apoc-2025.05.0-core.jar

# apoc 插件 # neo4j 2025.05.0

2025-12-16

apoc-2025.05.0-extended.jar

# apoc 插件 # neo4j 2025.05.0

2025-12-16

LangChain 流式传输.ipynb

# 适用于:LangChain v1.0 # 开发语言:python

2025-12-15

video_hunyuan_video_1.5_720p_i2v.json

# ComfyUI工作流模板 # hunyuan_video_1.5 # 720p_i2v # 使用方式:直接拖入UI界面 # 图生视频模板

2025-12-08

video_hunyuan_video_1.5_720p_t2v.json

# ComfyUI工作流模板 # hunyuan_video_1.5 # 720p_t2v # 使用方式:直接拖入UI界面 # 文生视频模板

2025-12-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除