自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

举世誉之而不加劝,举世非之而不加沮,定乎内外之分,辩乎荣辱之境,斯已矣。

作为一名热衷于探索未知领域的博主,我希望通过我的文章能够启发读者在技术领域不断进步,同时在人生的旅途中找到更深层次的意义。

  • 博客(232)
  • 资源 (4)
  • 问答 (1)
  • 收藏
  • 关注

原创 实战指南:Qwen3-ASR-1.7B 语音识别

本文介绍了Qwen3-ASR语音识别模型的安装与使用。

2026-02-28 09:06:56 413

原创 Windows 10 环境下 Poppler 库的编译指南

本文详细介绍了在Windows环境下编译Poppler库的完整流程。

2026-01-21 23:23:34 904

原创 Qt for Python:PySide6 入门指南(下篇)

本文介绍了使用PySide6和QML进行GUI开发的基础知识和集成方法,详细说明了QML与Python之间的信号槽连接、数据类型转换和UI元素属性控制,为开发者提供了PySide6与QML结合开发的实用指南。

2026-01-20 12:43:57 719

原创 Qt for Python:PySide6 入门指南(中篇)

本文介绍了使用PySide6进行Qt Widgets开发的基础知识。首先通过Hello World示例展示了创建基本窗口程序的方法,包括QApplication初始化、QLabel控件使用和主循环启动。接着讲解了两种使用.ui文件的方式:通过pyside6-uic工具生成Python类或使用QUiLoader直接加载。最后介绍了控件样式设置方法,包括使用setStyleSheet直接定义样式和通过.qss文件实现样式分离。文章提供了完整的代码示例和效果截图,帮助开发者快速上手PySide6的GUI开发。

2026-01-20 12:42:22 937 1

原创 零基础玩转 C++ OpenCV(Ubuntu 24.04实战指南)

本文介绍了如何在Ubuntu 24.04上搭建C++和OpenCV开发环境,并实现基本的图像处理功能。主要内容包括:安装必要的编译工具和OpenCV库;编写并运行简单的C++程序;理解OpenCV核心的Mat类概念;实现图像的加载、显示和保存操作。文章采用循序渐进的方式,从环境配置到实际应用,帮助读者快速掌握计算机视觉开发的基础技能。

2026-01-16 17:46:50 870

原创 Qt for Python:PySide6 入门指南(上篇)

PySide6 是 Qt 官方为 Python 提供的跨平台图形界面(GUI)开发库,是 Qt C++ 框架的官方 Python 绑定,让你能用 Python 的简洁语法调用 Qt 的强大功能,开发出专业、美观的桌面应用。

2026-01-16 16:04:12 1083

原创 为什么在 Windows 上用 Clang/LLVM?

Clang/LLVM是一套开源的现代化编译器工具链,由Clang(C/C++前端)和LLVM(优化与代码生成后端)组成。它将源代码转换为LLVM中间表示(IR),经优化后生成目标平台机器码。相比MSVC/GCC,Clang具有更快的编译速度、更清晰的错误提示和更好的跨平台一致性,支持现代C++标准。在Windows上需配合MSVC标准库使用,工具链包含clang++、lld、clang-tidy等实用工具。

2026-01-16 15:01:55 729

原创 突破语言边界:Python 与 C/C++ 集成方案年度深度总结

技术融合与边界拓展:Python 3.10+ 中 C/C++ 集成方案年度深度总结

2025-12-27 19:39:07 1226 1

原创 实战指南:DeepSeek OCR

DeepSeek OCR 是一款两阶段 Transformer 文档 AI,先将页面图像压缩成紧凑的视觉 Token,再以高容量的专家混合语言模型解码。

2025-12-19 15:47:37 688

原创 实战指南:Hunyuan OCR

HunyuanOCR是一款基于混元多模态架构的轻量级端到端OCR模型,仅1B参数即可实现行业领先性能,该模型支持多语言文档解析、文本识别、信息提取等多种任务。

2025-12-19 12:24:00 268

转载 (转载)真正的缘分,“推背感”都很强

真正的缘分,从来不需要你千挑万选。它只需要你,在别无选择时,选择相信。

2025-12-18 17:52:24 82

原创 Ubuntu24.04 日常运维合集

本文汇总了Ubuntu 24.04系统运维中的常见问题解决方案。

2025-12-18 16:55:18 1318 1

原创 Tauri 开发初体验:从安装到运行全流程

Tauri 是一个跨平台桌面应用开发框架,支持使用前端技术构建轻量级应用。它利用系统原生 webview 减小应用体积(可小于600KB),并基于 Rust 提供安全可靠的基础架构。开发者可以灵活选择前端框架(如React、Vue)和多种后端语言(Rust/Swift/Kotlin)。

2025-12-18 15:53:05 1465

原创 LangChain实战:基于图数据库的问答

本文介绍了如何在图数据库Neo4j上构建语义层,使用大型语言模型(LLM)进行交互。主要内容包括:1)环境配置,安装依赖包、LLM大模型和Neo4j数据库;2)数据库操作,创建连接并导入电影数据集;3)实现自定义工具,通过Cypher模板检索电影和演员信息;4)构建智能体,使用LangGraph实现ReAct模式的交互流程。该方法避免了直接生成Cypher语句的不稳定性,通过语义层工具实现更可靠的数据库交互。

2025-12-16 15:11:55 174

原创 实战指南:通义万相2.2-图文生视频模型

Wan2.2是一款创新的视频生成模型,具有以下核心优势:1)采用MoE架构提升模型容量而不增加计算成本;2)整合电影级美学数据实现精细风格控制;3)基于大量训练数据(图像+65.6%,视频+83.2%)实现卓越运动生成能力;4)支持720P@24fps高清视频生成,可在消费级显卡运行。安装步骤包括克隆仓库、安装依赖和下载模型,需注意解决librosa依赖和Flash-Attention版本兼容问题(需2.7.1-2.8.2版本)。该模型为目前最快的720P视频生成方案之一,适用于工业与学术领域。

2025-12-15 17:22:59 572

原创 LangChain核心组件:流式传输与结构化输出

本文介绍了LangChain框架中的流式传输与结构化输出。

2025-12-15 14:56:43 80

原创 实战指南:Stable Diffusion 3.5 文生图模型

Stable Diffusion 3.5是Stability AI推出的新一代开源AI图像生成模型,具有80亿参数,支持生成百万像素级高质量图像。文章详细介绍了SD3.5的环境搭建、模型下载和推理实现方法,包括基础安装步骤(pip安装modelscope、torch等依赖)和显存优化方案(CPU offload和量化模型)。针对不同硬件配置提供了最佳实践:标准配置推荐1024×1024分辨率、28步推理;低显存设备建议使用4bit量化技术。

2025-12-08 17:59:50 253

原创 实战指南:Qwen3-VL 视觉语言模型

Qwen3-VL是阿里云推出的新一代视觉语言模型,具有以下核心特点:1) 采用交错MRoPE和DeepStack架构,增强视频理解和细粒度图像对齐;2) 支持256K长上下文,可扩展至1M;3) 具备视觉代理、空间感知、OCR识别等增强功能。使用指南包括:通过ModelScope下载模型、安装flash attention优化推理速度、提供标准API调用示例及推荐生成参数。该模型在图像描述、视频理解、GUI操作等场景表现优异,支持从边缘到云端的灵活部署。

2025-12-08 09:43:34 343

原创 实战指南:HunyuanWorld-Mirror 3D几何预测模型

本文介绍混元世界1.1模型

2025-12-06 10:52:42 155

原创 实战指南:HunyuanVideo-1.5 视频生成模型

HunyuanVideo-1.5是一款轻量高效的视频生成模型,仅需8.3B参数即可提供专业级质量。该模型采用创新的扩散变换器架构,结合3D因果VAE和SSTA注意力机制,实现16倍空间压缩和4倍时间压缩,推理速度比FlashAttention-3快1.87倍。支持1080p超分辨率增强,并优化端到端训练流程。硬件要求为14GB显存的NVIDIA GPU,软件需Linux系统、Python 3.10+和兼容CUDA版本。社区提供了多种集成方案,包括Diffusers、ComfyUI插件等。

2025-12-06 10:30:28 317

原创 实战指南:造相-Z-Image-Turbo 文生图模型

本文介绍Z-Image-Turbo文生图模型

2025-11-30 22:01:00 848

原创 OpenTCS 7.0.1 开发手册(下篇)

本文介绍了OpenTCS内核应用程序的自定义和扩展方法。主要内容包括:1)通过Guice模块配置内核组件,包括注册自定义模块和替换默认内核组件;2)自定义车辆数据传输转换器,实现坐标系统转换等功能;3)开发车辆驱动程序的方法,详细说明了内核和控制中心的关键接口,以及创建驱动程序的步骤和注册流程。开发者可以通过这些扩展点实现特定业务需求,如自定义调度算法、车辆通信协议等。

2025-11-27 11:46:55 733

原创 OpenTCS 7.0.1 开发手册(上篇)

OpenTCS是一款开源的自动导引车(AGV)控制系统框架,采用MIT许可证。本文介绍了OpenTCS 7.0.1的安装部署步骤,包括JDK21环境配置和软件包下载。OpenTCS作为一个通用框架,提供车辆路径规划、任务调度等核心功能,但需要自行开发车辆驱动适配器。系统包含多个模块,开发者可通过Maven集成所需组件。文档详细说明了各模块功能及API兼容性,并提供了技术支持渠道。该软件适用于需要协调多类型AGV的工业场景,但需根据实际需求进行二次开发。

2025-11-27 10:10:19 1220

原创 OpenTCS 7.0.1 用户手册(下篇)

OpenTCS系统提供了多种默认策略模块,包括分派器、路由器、调度器和外围设备作业分派器。分派器负责运输订单和车辆的分配决策,考虑路线可行性、车辆状态等因素。路由器采用Dijkstra算法计算最优路径,支持多种成本函数和路由组配置。调度器实现简单的交通管理策略,通过互斥资源分配确保安全性。外围设备作业分派器处理外围作业分配,考虑设备状态和预约令牌。这些默认实现可根据项目需求灵活替换和配置,为自动化运输控制系统提供基础功能框架。

2025-11-26 16:53:29 924 2

原创 OpenTCS 7.0.1 用户手册(上篇)

本文介绍了OpenTCS(开放式运输控制系统)的安装配置与系统概述。首先详细说明了如何下载OpenTCS 7.0.1版本并配置JDK21运行环境。然后阐述了OpenTCS的核心功能:作为开源AGV控制系统框架,采用MIT许可证,提供车辆路径规划、任务调度等基础功能,但需自行开发通信适配器实现与具体车辆的对接。系统采用客户端-服务器架构,包含内核服务器、模型编辑器、操作台等组件,支持多类型车辆同时管理。文章还说明了工厂模型的基本元素(如点、路径等)和系统运行所需的软硬件环境,并提供了开发者文档和技术支持渠道。

2025-11-26 11:50:14 1312

转载 (转载)古人常说:“法不轻传,道不贱卖,师不顺路,医不叩门”,何意?

“法不轻传,道不贱卖,师不顺路,医不叩门”,这绝非是在摆架子,而是在漫长的历史长河与复杂的人际交往中总结出的智慧。人性是复杂的,经不得随意考验。天雨虽大,不润无根之草;道法虽宽,只渡有缘之人。只有那些真正有根基、有诚意、有缘分的人,才能领悟法与道的精髓,才能得到老师的悉心教导,才能在医生的帮助下恢复健康。我们应当尊重这些古老的智慧,让它们在现代社会中继续发挥积极的作用 。

2025-11-24 16:22:02 589

转载 (转载)天雨虽大,不润无根之草;道法虽宽,只渡有缘之人!

人不自救,天也难佑。与其等待天来渡我,不如做自己的“摆渡人”。

2025-11-24 16:01:14 118

转载 (转载)最好的生活方式:不说闲话,不管闲事,不做闲人

人生,是一场自我的修行。每个人都有自己的活法,你不能拿你的尺子去度量他人的人生。更何况,我们也管不了那么多,过好自己的生活,已经足矣。

2025-11-24 10:44:11 81

转载 (转载)别焦虑,生活不过是见招拆招

人生下半场,希望我们都放下焦虑,允许自己出错,允许自己平庸,允许事与愿违,去经历、去体验,去享受人间一趟的美好。

2025-11-24 10:07:29 76

原创 Tree-sitter:AI Code Review 的底层基石与实践指南

本文深入介绍了Tree-sitter这一革命性的代码解析技术。

2025-11-21 16:36:10 625

原创 单目与双目深度估计新范式:Depth Pro 和 Foundation Stereo 实战指南

本文介绍了两种先进的深度估计方法:单目深度估计的Depth Pro和双目深度估计的Foundation Stereo。

2025-11-19 16:21:28 856

原创 LangChain核心组件:中间件

控制并定制智能体(Agent)执行的每一个步骤。

2025-11-19 14:54:47 160

原创 穿越像素,看见深度:基于OpenCV的双目深度估计全解析

本文介绍了基于双目视觉的深度估计技术。首先从人类双眼感知深度的生物机制出发,解释了视差与深度感知的关系。随后详细阐述了双目深度估计的数学原理——极线几何约束和三角测量法,推导出深度与视差成反比的核心公式。文章还分析了立体匹配的挑战及解决算法(BM、SGBM等)。实践部分包括硬件搭建、相机标定、立体校正等关键步骤,并提供了完整的Python+OpenCV实现方案。该技术无需专用传感器,仅需双摄像头即可实现三维场景深度测量,在自动驾驶、机器人、AR/VR等领域具有广泛应用。

2025-11-19 09:49:04 1320

原创 LangChain核心组件:短期记忆

文章摘要 本文探讨了AI智能体的记忆系统实现方法。

2025-11-18 17:02:53 189

原创 YOLO目标检测框架完全指南:从零开始,手把手带你理解、训练、部署AI视觉系统

不讲数学公式,不堆术语,只讲人话 + 图解 + 实践。

2025-11-14 14:52:17 1019

原创 深度学习入门指南:从零开始,手把手教你理解、构建与应用神经网络

全程无公式推导,无晦涩术语,所有概念都用生活类比、可视化图示、真实代码呈现。

2025-11-13 15:33:58 2254

转载 (转载)为什么普通人难逃“20w定律”?

这不是个人意志的失败,当我们深入剖析消费主义的运作机制,会发现那串消失的数字背后,隐藏着某些平时少有人关注的真相。

2025-11-13 14:45:34 102

原创 LangChain核心组件:工具

本文介绍了AI工具与外部系统交互的实现方法。通过@tool装饰器可快速创建工具,函数文档字符串作为工具描述,类型提示定义输入架构。文中展示了客户查询、订单检索、库存检查等多种实用工具示例。此外,还介绍了如何自定义工具名称、描述,以及使用Pydantic模型定义复杂输入架构。高级功能包括通过ToolRuntime访问运行时状态、上下文和持久存储,使工具具备上下文感知能力。这些方法有效扩展了AI模型的功能边界,使其能够与现实世界系统进行结构化交互。

2025-11-12 16:52:17 104

原创 C语言程序设计入门:从零开始,亲手编写你的第一个程序

我们将从“Hello, World!”开始,一步步带你走进C语言的世界,直到你能独立编写一个完整的“学生成绩管理系统”。

2025-11-12 15:53:49 1571

原创 LangChain核心组件:信息

LangChain框架中的消息模块是构建AI对话的核心组件,支持三种交互方式:1)直接文本提示(适用于简单查询);2)结构化的消息对象(支持多轮对话和多模态内容);3)兼容OpenAI格式的字典消息。每种方式都包含角色标识、内容主体和元数据属性,确保跨模型交互的一致性。开发者可根据场景需求选择合适的方式,如文本提示适合一次性查询,而消息对象更适合复杂的对话管理。系统通过标准化消息格式实现了灵活且统一的模型交互体验。

2025-11-12 11:46:16 53

gradle-8.14.3-bin.zip

# gradle # 版本:8.14.3 # 适用于:linux # 免安装,解压直接使用

2025-11-27

openjdk-21.0.2_linux-x64_bin.zip

描述:openjdk-21.0.2 适用于:linux系统 使用方式:解压后,配置环境变量即可 export JAVA_HOME=/home/sam/jdk-21.0.2 export PATH=${JAVA_HOME}/bin:$PATH

2025-11-24

opentcs-7.0.1-bin.zip

可执行的控制系统软件及文档(面向用户和开发人员)。 官网:https://opentcs.org/en/download.html

2025-11-24

Tree-sitter:AI Code Review 的底层基石与实践指南.ipynb

# https://jianshengma.blog.csdn.net/article/details/155069839 # Tree-sitter:AI Code Review 的底层基石与实践指南 # 案例源码

2025-11-21

LangChain核心组件:短期记忆.ipynb

# LangChain核心组件:短期记忆 # https://blog.csdn.net/weixin_47560078/article/details/154943677 # python # LangChain # 智能体

2025-11-18

FoundationStereo仓库源码2025.zip

FoundationStereo是NVIDIA推出的首个专注于‌零样本泛化‌的立体深度估计基础模型,其核心目标是通过大规模合成数据训练和创新的架构设计,实现在无需微调的情况下跨领域(如室内/室外、无纹理/反射/透明物体等场景)的高精度深度估计‌。

2025-11-17

深度学习入门指南:从零开始,手把手教你理解、构建与应用神经网络.ipynb

深度学习入门指南:从零开始,手把手教你理解、构建与应用神经网络 https://jianshengma.blog.csdn.net/article/details/154773234

2025-11-13

LangChain v1.0 快速入门.ipynb

# 文章源码 https://blog.csdn.net/weixin_47560078/article/details/154567332 # 框架:LangChain v1.0 # 语言:python3.10

2025-11-08

零基础入门AI智能体:你的第一个数字伙伴是如何思考与行动的?.ipynb

# 文章链接:https://blog.csdn.net/weixin_47560078/article/details/154388419 # 内容:智能体零基础入门 # python,人工智能 # 形式:notebook

2025-11-04

从零到一:用C#玩转OpenAI大模型的完整指南.pdf

内容概要:本文是一份面向C#开发者的OpenAI大模型集成指南,系统讲解了如何使用C#调用OpenAI兼容的API实现大语言模型、图像生成、语音识别与合成、文本嵌入等核心功能。文章从环境搭建开始,涵盖API密钥获取、.NET项目配置、第三方库安装,并深入介绍Chat Completion、DALL·E图像生成、Whisper语音转录、TTS语音合成及Embeddings向量化等技术的实现方式,结合硅基流动等国内平台降低学习门槛。通过构建智能客服机器人的实战案例,展示了上下文管理、服务封装和错误处理等工程实践,并提供了安全配置、成本控制、提示工程和单元测试等高级技巧。; 适合人群:具备基础C#编程能力(熟悉异步编程、类与对象),有一定.NET开发经验的研发人员,尤其是希望将AI能力集成到企业应用、桌面软件或Unity游戏中的开发者;适合工作1-3年想拓展AI技能栈的程序员。; 使用场景及目标:①学习如何在C#项目中调用主流大模型API完成文本对话、图像生成、语音处理和语义向量提取;②掌握AI服务封装、上下文管理、流式响应、Mock测试等实际开发技术;③构建可落地的AI应用如智能客服、内容生成工具等;④理解提示工程、安全性控制与成本优化策略。; 阅读建议:此资源以动手实践为主线,建议边学边练,配合代码调试加深理解。优先使用国内兼容OpenAI的平台(如硅基流动)避免网络问题,注意API密钥安全管理,推荐使用环境变量或.NET User Secrets。学习过程中应重点关注异步编程模式、错误处理机制与项目结构设计,为后续扩展到Web API或移动后端打下基础。

2025-11-03

Python OpenAI库完全指南:从零开始掌握大模型编程.pdf

内容概要:本文是一份全面的《Python OpenAI库完全指南》,旨在帮助初学者和有一定Python基础的开发者掌握如何使用Python调用OpenAI及其兼容平台的大模型服务。内容涵盖环境搭建、API密钥配置、文本生成、图像生成(DALL·E)、语音识别(Whisper)、嵌入向量与语义搜索、错误处理、成本控制、安全实践以及实际应用案例(如智能客服、内容创作、代码辅助等),并介绍了性能优化技巧如异步调用和缓存策略。文中还推荐使用国内兼容OpenAI接口的平台(如硅基流动)以降低学习门槛,并提供免费模型用于实践。 适合人群:零基础或具备一定Python编程经验、希望入门大模型开发的初学者,以及想系统掌握OpenAI库功能的初级开发者。 使用场景及目标:①学习如何通过Python调用大模型实现文本对话、图像生成、语音转写和语义搜索等功能;②构建智能客服、内容生成工具、代码助手等AI应用原型;③掌握API调用的安全规范、成本控制与性能优化方法。 阅读建议:建议边读边实践,按照章节顺序完成环境配置与代码示例,重点关注API调用方式、参数调优和错误处理机制。同时结合国内平台资源进行低成本实验,深入理解大模型集成开发全流程。

2025-10-31

Python与人工智能:初学者的编程指南.pdf

内容概要:本文是一份针对初学者的Python编程入门指南,重点介绍Python在人工智能领域的核心地位及其易学性。文章通过实践导向的方式,系统讲解了Python基础语法、变量与数据类型、运算符、控制流、循环、函数、容器类型、文件操作、错误处理及面向对象编程等核心概念,并结合Anaconda环境搭建和Jupyter Lab等工具使用,帮助读者快速上手。同时,文档进一步延伸至AI学习路径,涵盖数据科学三剑客(NumPy、Pandas、Matplotlib)、机器学习(Scikit-learn)和深度学习框架(TensorFlow/PyTorch),并深入探讨了装饰器、生成器、上下文管理器等高级编程技巧,为后续AI开发奠定坚实基础。; 适合人群:零基础或具备少量编程经验、希望进入人工智能、数据科学领域的初学者,以及从事科研或工程实践需快速掌握Python技能的研发人员。; 使用场景及目标:①系统学习Python编程基础知识并应用于AI领域;②掌握数据处理、模型训练与项目开发的完整流程;③理解并运用高级编程机制如装饰器、生成器、上下文管理器提升代码质量与效率;④为后续深入学习机器学习与深度学习打下扎实的编程基础。; 阅读建议:建议按照章节顺序逐步学习,注重动手实践,每学完一个知识点即编写相应代码进行验证,配合官方文档查阅加深理解,并尝试完成文中提出的小项目以巩固所学。

2025-10-30

GPT结构剖析:从“词袋”到“思想”的魔法之旅.pdf

内容概要:本文深入剖析了GPT模型的核心结构——Transformer,揭示其从“词袋”匹配到具备上下文理解能力的技术演进路径。文章首先指出传统模型在语义理解上的局限,进而介绍词嵌入技术如何赋予词语丰富的语义表示,并重点解析Transformer中的自注意力机制、多头注意力、前馈神经网络及残差连接等关键技术组件。随后阐明GPT为何采用纯解码器架构及其掩码自注意力机制的工作原理,完整呈现GPT从输入分词、嵌入编码、多层解码器处理到自回归生成的全流程。最后探讨了GPT强大的原因在于规模效应、全局视野、预训练范式和并行计算优势,同时也客观指出其存在幻觉、缺乏真实理解和推理局限等问题。; 适合人群:具备一定自然语言处理基础知识、对深度学习模型感兴趣的研发人员或学生,尤其是希望理解大模型底层机制的技术从业者; 使用场景及目标:①理解Transformer如何解决长期依赖问题并实现上下文感知;②掌握自注意力与多头注意力的运作机制;③了解GPT为何采用解码器架构及其实现文本生成的全过程;④认识当前大模型的优势与局限,指导实际应用中的优化与规避风险;

2025-10-28

从单轮到多轮:大模型对话API的上下文管理艺术与工程实践.pdf

内容概要:本文深入探讨了大模型对话API中单轮与多轮对话的区别及其核心技术实现,重点剖析了多轮对话中的上下文管理机制。文章从单轮对话的无状态特性入手,逐步引出多轮对话在实现连贯交互中的必要性,并详细分析了上下文窗口限制带来的技术挑战,提出了包括滑动窗口、上下文摘要、RAG(检索增强生成)在内的多种解决方案。同时,文章还讨论了角色漂移、成本性能权衡等问题,并给出了服务端状态管理、Function Calling、日志监控等最佳实践建议,旨在帮助开发者构建稳定、高效、用户体验优良的多轮对话系统。; 适合人群:具备一定AI和API开发经验的工程师、技术负责人及对话系统设计人员,尤其适合从事智能客服、虚拟助手等交互式应用开发的研发人员; 使用场景及目标:①理解单轮与多轮对话API的设计差异与技术选型依据;②掌握上下文管理的核心策略(如RAG、摘要)以应对长对话场景;③构建具备记忆能力、意图连贯性和高可靠性的AI对话应用; 阅读建议:此资源不仅涵盖理论原理,更强调工程实践,建议结合实际项目场景边学边练,重点关注上下文管理策略的选择与Function Calling的集成应用,并注意在实现过程中平衡性能、成本与用户体验。

2025-10-28

【人工智能开发】基于API调用的大模型应用:电商智能客服系统构建与性能优化全流程解析

内容概要:本文系统讲解了如何通过API调用大语言模型(LLM)的全流程,涵盖技术原理、主流平台对比、开发实现、参数调优、性能优化、安全合规及常见问题解决方案。重点介绍了OpenAI、Anthropic、阿里通义、深度求索、百度文心等国内外主流大模型API平台的选择与使用方法,并以Python为例演示了通过官方SDK或requests库进行API调用的具体代码实现。文章还结合电商智能客服的实战案例,展示多轮对话、意图识别、上下文管理及外部系统集成的完整流程,并提供了降低延迟、控制成本、保护密钥和数据隐私的最佳实践。; 适合人群:具备基本编程能力,尤其是熟悉Python的开发者,以及希望快速集成大模型能力的产品经理、AI应用开发者和技术决策者;适合工作1-3年、希望进入AI应用层开发的技术人员; 使用场景及目标:① 学习如何通过API快速接入大模型能力,避免从零训练;② 掌握智能客服、自动化问答等实际业务场景的构建方法;③ 优化API调用性能与成本,确保安全合规;④ 理解提示工程、上下文管理、token控制等关键技术细节; 阅读建议:建议边读边动手实践,优先使用硅基流动等支持免费额度的平台进行测试,从简单问答开始逐步实现多轮对话与系统集成,同时关注参数调优与安全规范,深入理解API背后的设计逻辑。

2025-10-28

人工智能RAG+Agent+小模型协同架构:构建可靠高效经济的企业级AI应用系统设计

内容概要:本文系统阐述了RAG(检索增强生成)、Agent(智能体)和小模型三大技术协同构建可靠、高效、经济的AI应用新范式。文章指出大模型存在幻觉、知识固化、成本高和缺乏行动力等问题,提出通过RAG解决知识准确性与时效性,借助Agent赋予AI规划与执行能力,利用小模型实现低成本、低延迟的高效推理。三者构成分层协作架构:小模型作为“守门员”处理简单请求与路由,RAG提供基于私有知识库的精准问答,Agent则完成复杂任务的自主规划与操作执行,共同打造面向企业级应用的智能化解决方案。; 适合人群:AI开发者、技术负责人、产品经理及对AI应用落地感兴趣的从业者,具备一定机器学习或软件开发基础者更佳; 使用场景及目标:①构建企业级智能客服、知识助手等需要高准确性和自动化的AI系统;②优化AI应用成本结构,提升响应效率与安全性;③实现私有知识融合、任务自动化执行与模型资源的合理分配; 阅读建议:此资源强调技术组合的系统性设计,建议结合实际业务场景深入理解各模块协作逻辑,并参考架构图进行原型搭建与迭代验证。

2025-10-28

一文读懂大模型推理框架:10大工具的优缺点、适用场景与选型推荐-.pdf

内容概要:本文系统梳理了当前主流的十大大型语言模型推理框架,涵盖其核心定位、主要优缺点、适用场景及推荐指数。通过对Hugging Face Transformers、vLLM、TensorRT-LLM、TGI、SGLang、llama.cpp、LM Studio、Ollama、LMDeploy和ModelScope等框架的深入对比分析,帮助读者理解各工具的技术特点与生态定位,进而做出合理的选型决策。文章强调不同框架在性能、易用性、部署环境、硬件依赖和应用场景等方面的差异,为研究、开发和生产提供了清晰的指导路径。; 适合人群:具备一定机器学习或深度学习基础,从事大模型研发、部署或应用的工程师、技术负责人及研究人员,尤其是需要进行推理框架选型的技术人员;同时也适合希望在本地运行大模型的开发者和非技术背景的探索者。; 使用场景及目标:①为大模型推理服务选择合适的高性能框架(如vLLM、TensorRT-LLM用于生产部署);②在本地或边缘设备上轻量级运行模型(如llama.cpp、Ollama);③快速原型验证与模型管理;④复杂提示工程与智能体应用优化;⑤中文模型部署与国内合规环境适配。; 阅读建议:此资源以实际应用为导向,建议读者结合自身硬件环境、部署需求和模型生态进行对照选择,并在实践中验证不同框架的性能表现与集成成本,重点关注兼容性、量化支持与服务化能力。

2025-10-27

大模型推理指南:Hugging Face Transformers.pdf

内容概要:本文详细介绍了如何使用Hugging Face Transformers库进行大模型推理,涵盖环境配置、模型下载、缓存管理、离线使用、文本生成、推理pipeline及模型量化技术。重点讲解了使用LLMs进行自回归生成的核心流程,包括token选择策略、生成参数配置(如max_new_tokens、do_sample)、填充方式(左填充的重要性)以及常见陷阱的规避方法。同时深入探讨了多种量化技术(如GPTQ、AWQ、bitsandbytes的4位/8位量化),并通过实例演示了如何加载本地模型、应用聊天模板、结合Flash Attention优化性能,并实现CPU-GPU混合卸载以应对显存不足的问题。; 适合人群:具备Python编程基础和深度学习基础知识,熟悉Transformer架构,从事NLP或大模型相关工作的研究人员、工程师和技术爱好者;尤其适合需要在资源受限环境下部署大模型的开发者。; 使用场景及目标:①掌握Hugging Face Transformers库的核心API,实现大模型的本地加载与高效推理;②理解和避免大模型生成过程中的常见问题(如输出过短、重复生成、填充错误等);③应用量化技术降低大模型内存占用,实现在消费级GPU或CPU上的部署;④构建支持批量处理和多模态任务的推理流水线。; 阅读建议:此资源理论与实践紧密结合,建议读者边阅读边动手实践,复现文中的代码示例,并尝试在不同模型和硬件环境下进行调优。重点关注生成配置、量化参数和设备映射策略,结合具体应用场景灵活调整。

2025-10-25

大模型入门指南:从“人工智障”到“超级大脑”的进化之旅.pdf

内容概要:本文系统介绍了大模型的基本概念、发展历程、技术原理及其广泛应用。文章从“人工智障”到“超级大脑”的比喻出发,阐述了大模型通过海量参数、数据和算力实现“涌现能力”,如上下文学习、指令遵循和思维链推理。详细解析了文本、多模态及其他新兴大模型的技术架构与应用场景,并从能力侧重和架构设计两个维度对大模型进行分类。进一步揭示了大模型的工作流程,包括分词、嵌入、Transformer处理和生成机制,以及预训练、微调、提示工程和检索增强生成等关键阶段。最后展示了其在办公、创意、教育、医疗、企业等领域的变革性应用,并客观分析了幻觉、偏见、安全、成本等挑战与未来发展方向。; 适合人群:对人工智能感兴趣的零基础学习者、高校学生、初级开发者及希望了解大模型技术趋势的企业从业者。; 使用场景及目标:①帮助初学者建立对大模型的全面认知,理解其如何从“小模型”演进为“通用智能”;②掌握大模型的核心技术原理与工作流程,明确其在不同行业的落地场景与实际价值;③认识当前局限与未来趋势,理性看待大模型在通往AGI道路上的角色。; 阅读建议:此资源以通俗易懂的语言和生动比喻降低理解门槛,适合配合实例视频和动手实践结合学习,建议读者在阅读过程中关注技术逻辑与现实应用的联系,并批判性思考其伦理与社会影响。

2025-10-25

AI大模型十大核心概念:从参数量到温度,一文读懂大模型的“黑话”.pdf

内容概要:本文系统解读了AI大模型领域的十大核心概念,包括参数量、Token、上下文窗口、温度、Top-p、推理、微调、RAG、幻觉和对齐,帮助读者理解大模型的工作机制与关键技术指标。文章以通俗语言结合专业定义,解析每个概念的作用及其对模型性能的影响,并辅以实例和图示说明,揭示大模型并非“魔法”,而是可被掌握的技术体系。同时强调各概念间的关联性,构建起完整的认知框架。; 适合人群:对AI大模型感兴趣的产品经理、应用开发者、技术决策者及初学者,具备基本技术背景即可理解; 使用场景及目标:①提升对大模型术语的理解能力,精准评估模型性能;②指导实际应用中参数调优、架构选择与风险控制;③避免因误解导致的技术误用或决策偏差; 阅读建议:建议结合文中推荐工具(如Tokenizer、LangChain)进行实践验证,在真实场景中体验参数调整对输出效果的影响,并重点关注RAG、微调与对齐等提升模型可靠性的技术路径。

2025-10-24

qt5-poppler-demo.zip

# qt5.14.2实现poppler库移植,渲染pdf文件 # 注意:示例代码仅适用于mingw-64

2026-01-21

poppler-26.01.0-vcpkg.zip

# poppler-26.01.0 QT5依赖库 # vcpkg 下载的依赖文件,下载后放入vcpkg\downloads即可

2026-01-21

vs2022-Community.exe

# vs2022 社区版在线安装包

2026-01-21

poppler-26.01.0.tar.xz

The latest stable release is poppler-26.01.0.tar.xz, released on January 6, 2026: core: * Improve signature compatibiluty on some files * Add support for de-facto standard annotation icons * Splash: Implement more blending modes for mono1/8 * Internal code improvements * Fix crashes in malformed documents utils: * pdfinfo: Print alt text in -struct cpp: * Remove deprecated time functions qt: * Add reading order option for getText()

2026-01-20

QmlExample.zip

# Qt for Python:PySide6 入门指南 # QML 示例源码以及打包环境 # https://jianshengma.blog.csdn.net/article/details/157138161 # 基于 Pyside6

2026-01-20

WidgetExample.zip

# Qt for Python:PySide6 入门指南 # QML 示例源码 # https://jianshengma.blog.csdn.net/article/details/157060137 # 基于 Pyside6

2026-01-20

零基础玩转 C++ OpenCV(Ubuntu 24.04实战指南)

零基础玩转 C++ OpenCV(Ubuntu 24.04实战指南),文章示例源码,以及文档扫描案例。

2026-01-16

tauri-1.92.0-build-tools-win10.zip

# 解压后,将文件夹覆盖到:C:\Users\你的用户名\AppData\Local\tauri\ # 参考文章:Tauri 开发初体验:从安装到运行全流程 https://blog.csdn.net/weixin_47560078/article/details/155309548

2026-01-06

nsis-3.11.zip

# nsis-3.11 离线包,使用于Win10 # 解压后使用

2026-01-06

突破语言边界:Python 与 C/C++ 集成方案年度深度总结

在Python中调用C++源代码,共6个案例,包含智能订单算法

2025-12-27

transformers-82a06d-hunyuanocr.zip

# transformers 源码 # 适用于 hunyuanocr # 解压后安装即可:pip install -e .

2025-12-19

构建基于图数据库的问答应用程序.ipynb

# 框架:LangChain 0.3 # 开发语言:python

2025-12-16

apoc-2025.05.0-core.jar

# apoc 插件 # neo4j 2025.05.0

2025-12-16

apoc-2025.05.0-extended.jar

# apoc 插件 # neo4j 2025.05.0

2025-12-16

LangChain 流式传输.ipynb

# 适用于:LangChain v1.0 # 开发语言:python

2025-12-15

video_hunyuan_video_1.5_720p_i2v.json

# ComfyUI工作流模板 # hunyuan_video_1.5 # 720p_i2v # 使用方式:直接拖入UI界面 # 图生视频模板

2025-12-08

video_hunyuan_video_1.5_720p_t2v.json

# ComfyUI工作流模板 # hunyuan_video_1.5 # 720p_t2v # 使用方式:直接拖入UI界面 # 文生视频模板

2025-12-08

NVIDIA-Linux-x86-64-570.207.run

# N卡驱动 # 版本:570.207 # 适用于:Linux # 安装指令:sudo bash NVIDIA-Linux-x86_64-570.207.run

2025-12-03

AGV调度系统(简版)-251128.zip

# AGV调度系统 # 开发语言:C#,SQL

2025-11-28

node-v24.11.1-linux-x64.tar.xz

# nodejs # 24.11.1 # 适用于linux系统 # 使用方法:解压后直接使用

2025-11-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除