- 博客(242)
- 资源 (4)
- 问答 (1)
- 收藏
- 关注
原创 零精度损失,6倍内存缩减:TurboQuant如何重新定义AI效率
谷歌研究院推出的TurboQuant算法解决了大语言模型KV Cache内存占用的关键难题。该技术通过创新的两阶段压缩方案(PolarQuant极坐标变换+QJL残差校正),在保持零精度损失的前提下,将内存占用减少6倍、推理速度提升8倍。相比传统量化方法,TurboQuant无需额外训练,可直接应用于现有模型,突破了AI领域的内存墙限制。这项技术有望显著降低大模型部署成本,推动更长上下文窗口的实用化发展。
2026-03-30 20:53:42
276
原创 Ubuntu 24.04 环境实战:ROS 2 Kilted 实现 SLAM 建图与 Nav2 导航
本文介绍了使用ROS2和TurtleBot3进行SLAM建图与自主导航的完整流程。首先安装slam_toolbox和TurtleBot3相关依赖包,配置清华源加速下载。通过Gazebo启动仿真环境后,使用slam_toolbox进行地图构建,并在RViz中可视化建图过程。完成地图扫描后,通过map_saver保存地图文件。在自主导航部分,使用Nav2实现路径规划与导航功能,展示了从环境搭建到实际应用的完整工作流程。文中包含详细命令、参数配置和可视化效果截图,为ROS2下的机器人建图导航提供了实用参考。
2026-03-25 17:17:44
397
原创 Agent Skills 实战(.NET):理论 × 代码 × 企业案例
本文介绍了2025年10月Anthropic发布Claude Skills后AI Agent生态的变革,重点解析了Agent Skills的核心思想——渐进式披露与工具调用。文章从.NET开发者视角出发,详细指导如何构建Agent Skills简易框架和企业级实战案例,并解析OpenClaw原理,最后实现一个MiniClaw。
2026-03-19 14:59:18
460
原创 OpenCode 入门宝典:小白也能玩转编程
OpenCode是一款开源、模型无关的AI编程助手,支持75+模型提供商和本地部署,提供双Agent模式(Build/Plan)确保安全开发。具备隐私优先设计、强大工具集和扩展能力,支持多平台安装和自定义配置。通过自然语言交互可完成代码分析、编写、调试等任务,适用于重视数据隐私和控制力的开发者及团队。支持本地模型部署和技能配置,提供灵活高效的AI辅助编程体验。
2026-03-12 18:01:06
720
原创 Agent Skills 完全构建指南:从理论到代码落地
Agent Skills是一种模块化格式,用于为AI智能体赋予专业能力。它将领域知识、工作流程打包成可复用的技能包,采用三层渐进式加载架构:元数据(常驻)、指令(按需)、资源(触发执行)。相比传统提示词,Agent Skills具有持久化、可复用、执行可靠等优势,能有效解决智能体缺乏专业上下文的问题。典型应用包括文档处理、开发运维、业务流程自动化等。开发者可构建跨平台技能,终端用户可快速获得新能力,企业可编码组织知识。该技术代表AI从聊天助手向工作伙伴的演进方向。
2026-03-12 17:19:42
661
原创 实战指南:造相 Z-Image 文生图模型
Z-Image是专为高质量图像生成设计的基础模型,具备强生成多样性和广泛风格覆盖能力,文本介绍Z-Image的实战使用。
2026-03-02 21:08:27
625
原创 Qt for Python:PySide6 入门指南(下篇)
本文介绍了使用PySide6和QML进行GUI开发的基础知识和集成方法,详细说明了QML与Python之间的信号槽连接、数据类型转换和UI元素属性控制,为开发者提供了PySide6与QML结合开发的实用指南。
2026-01-20 12:43:57
781
原创 Qt for Python:PySide6 入门指南(中篇)
本文介绍了使用PySide6进行Qt Widgets开发的基础知识。首先通过Hello World示例展示了创建基本窗口程序的方法,包括QApplication初始化、QLabel控件使用和主循环启动。接着讲解了两种使用.ui文件的方式:通过pyside6-uic工具生成Python类或使用QUiLoader直接加载。最后介绍了控件样式设置方法,包括使用setStyleSheet直接定义样式和通过.qss文件实现样式分离。文章提供了完整的代码示例和效果截图,帮助开发者快速上手PySide6的GUI开发。
2026-01-20 12:42:22
1291
1
原创 零基础玩转 C++ OpenCV(Ubuntu 24.04实战指南)
本文介绍了如何在Ubuntu 24.04上搭建C++和OpenCV开发环境,并实现基本的图像处理功能。主要内容包括:安装必要的编译工具和OpenCV库;编写并运行简单的C++程序;理解OpenCV核心的Mat类概念;实现图像的加载、显示和保存操作。文章采用循序渐进的方式,从环境配置到实际应用,帮助读者快速掌握计算机视觉开发的基础技能。
2026-01-16 17:46:50
926
原创 Qt for Python:PySide6 入门指南(上篇)
PySide6 是 Qt 官方为 Python 提供的跨平台图形界面(GUI)开发库,是 Qt C++ 框架的官方 Python 绑定,让你能用 Python 的简洁语法调用 Qt 的强大功能,开发出专业、美观的桌面应用。
2026-01-16 16:04:12
1270
原创 为什么在 Windows 上用 Clang/LLVM?
Clang/LLVM是一套开源的现代化编译器工具链,由Clang(C/C++前端)和LLVM(优化与代码生成后端)组成。它将源代码转换为LLVM中间表示(IR),经优化后生成目标平台机器码。相比MSVC/GCC,Clang具有更快的编译速度、更清晰的错误提示和更好的跨平台一致性,支持现代C++标准。在Windows上需配合MSVC标准库使用,工具链包含clang++、lld、clang-tidy等实用工具。
2026-01-16 15:01:55
839
原创 突破语言边界:Python 与 C/C++ 集成方案年度深度总结
技术融合与边界拓展:Python 3.10+ 中 C/C++ 集成方案年度深度总结
2025-12-27 19:39:07
1304
1
原创 实战指南:DeepSeek OCR
DeepSeek OCR 是一款两阶段 Transformer 文档 AI,先将页面图像压缩成紧凑的视觉 Token,再以高容量的专家混合语言模型解码。
2025-12-19 15:47:37
706
原创 实战指南:Hunyuan OCR
HunyuanOCR是一款基于混元多模态架构的轻量级端到端OCR模型,仅1B参数即可实现行业领先性能,该模型支持多语言文档解析、文本识别、信息提取等多种任务。
2025-12-19 12:24:00
304
原创 Tauri 开发初体验:从安装到运行全流程
Tauri 是一个跨平台桌面应用开发框架,支持使用前端技术构建轻量级应用。它利用系统原生 webview 减小应用体积(可小于600KB),并基于 Rust 提供安全可靠的基础架构。开发者可以灵活选择前端框架(如React、Vue)和多种后端语言(Rust/Swift/Kotlin)。
2025-12-18 15:53:05
1567
原创 LangChain实战:基于图数据库的问答
本文介绍了如何在图数据库Neo4j上构建语义层,使用大型语言模型(LLM)进行交互。主要内容包括:1)环境配置,安装依赖包、LLM大模型和Neo4j数据库;2)数据库操作,创建连接并导入电影数据集;3)实现自定义工具,通过Cypher模板检索电影和演员信息;4)构建智能体,使用LangGraph实现ReAct模式的交互流程。该方法避免了直接生成Cypher语句的不稳定性,通过语义层工具实现更可靠的数据库交互。
2025-12-16 15:11:55
188
原创 实战指南:通义万相2.2-图文生视频模型
Wan2.2是一款创新的视频生成模型,具有以下核心优势:1)采用MoE架构提升模型容量而不增加计算成本;2)整合电影级美学数据实现精细风格控制;3)基于大量训练数据(图像+65.6%,视频+83.2%)实现卓越运动生成能力;4)支持720P@24fps高清视频生成,可在消费级显卡运行。安装步骤包括克隆仓库、安装依赖和下载模型,需注意解决librosa依赖和Flash-Attention版本兼容问题(需2.7.1-2.8.2版本)。该模型为目前最快的720P视频生成方案之一,适用于工业与学术领域。
2025-12-15 17:22:59
628
原创 实战指南:Stable Diffusion 3.5 文生图模型
Stable Diffusion 3.5是Stability AI推出的新一代开源AI图像生成模型,具有80亿参数,支持生成百万像素级高质量图像。文章详细介绍了SD3.5的环境搭建、模型下载和推理实现方法,包括基础安装步骤(pip安装modelscope、torch等依赖)和显存优化方案(CPU offload和量化模型)。针对不同硬件配置提供了最佳实践:标准配置推荐1024×1024分辨率、28步推理;低显存设备建议使用4bit量化技术。
2025-12-08 17:59:50
266
原创 实战指南:Qwen3-VL 视觉语言模型
Qwen3-VL是阿里云推出的新一代视觉语言模型,具有以下核心特点:1) 采用交错MRoPE和DeepStack架构,增强视频理解和细粒度图像对齐;2) 支持256K长上下文,可扩展至1M;3) 具备视觉代理、空间感知、OCR识别等增强功能。使用指南包括:通过ModelScope下载模型、安装flash attention优化推理速度、提供标准API调用示例及推荐生成参数。该模型在图像描述、视频理解、GUI操作等场景表现优异,支持从边缘到云端的灵活部署。
2025-12-08 09:43:34
375
原创 实战指南:HunyuanVideo-1.5 视频生成模型
HunyuanVideo-1.5是一款轻量高效的视频生成模型,仅需8.3B参数即可提供专业级质量。该模型采用创新的扩散变换器架构,结合3D因果VAE和SSTA注意力机制,实现16倍空间压缩和4倍时间压缩,推理速度比FlashAttention-3快1.87倍。支持1080p超分辨率增强,并优化端到端训练流程。硬件要求为14GB显存的NVIDIA GPU,软件需Linux系统、Python 3.10+和兼容CUDA版本。社区提供了多种集成方案,包括Diffusers、ComfyUI插件等。
2025-12-06 10:30:28
345
原创 OpenTCS 7.0.1 开发手册(下篇)
本文介绍了OpenTCS内核应用程序的自定义和扩展方法。主要内容包括:1)通过Guice模块配置内核组件,包括注册自定义模块和替换默认内核组件;2)自定义车辆数据传输转换器,实现坐标系统转换等功能;3)开发车辆驱动程序的方法,详细说明了内核和控制中心的关键接口,以及创建驱动程序的步骤和注册流程。开发者可以通过这些扩展点实现特定业务需求,如自定义调度算法、车辆通信协议等。
2025-11-27 11:46:55
769
原创 OpenTCS 7.0.1 开发手册(上篇)
OpenTCS是一款开源的自动导引车(AGV)控制系统框架,采用MIT许可证。本文介绍了OpenTCS 7.0.1的安装部署步骤,包括JDK21环境配置和软件包下载。OpenTCS作为一个通用框架,提供车辆路径规划、任务调度等核心功能,但需要自行开发车辆驱动适配器。系统包含多个模块,开发者可通过Maven集成所需组件。文档详细说明了各模块功能及API兼容性,并提供了技术支持渠道。该软件适用于需要协调多类型AGV的工业场景,但需根据实际需求进行二次开发。
2025-11-27 10:10:19
1272
原创 OpenTCS 7.0.1 用户手册(下篇)
OpenTCS系统提供了多种默认策略模块,包括分派器、路由器、调度器和外围设备作业分派器。分派器负责运输订单和车辆的分配决策,考虑路线可行性、车辆状态等因素。路由器采用Dijkstra算法计算最优路径,支持多种成本函数和路由组配置。调度器实现简单的交通管理策略,通过互斥资源分配确保安全性。外围设备作业分派器处理外围作业分配,考虑设备状态和预约令牌。这些默认实现可根据项目需求灵活替换和配置,为自动化运输控制系统提供基础功能框架。
2025-11-26 16:53:29
968
2
原创 OpenTCS 7.0.1 用户手册(上篇)
本文介绍了OpenTCS(开放式运输控制系统)的安装配置与系统概述。首先详细说明了如何下载OpenTCS 7.0.1版本并配置JDK21运行环境。然后阐述了OpenTCS的核心功能:作为开源AGV控制系统框架,采用MIT许可证,提供车辆路径规划、任务调度等基础功能,但需自行开发通信适配器实现与具体车辆的对接。系统采用客户端-服务器架构,包含内核服务器、模型编辑器、操作台等组件,支持多类型车辆同时管理。文章还说明了工厂模型的基本元素(如点、路径等)和系统运行所需的软硬件环境,并提供了开发者文档和技术支持渠道。
2025-11-26 11:50:14
1390
转载 (转载)古人常说:“法不轻传,道不贱卖,师不顺路,医不叩门”,何意?
“法不轻传,道不贱卖,师不顺路,医不叩门”,这绝非是在摆架子,而是在漫长的历史长河与复杂的人际交往中总结出的智慧。人性是复杂的,经不得随意考验。天雨虽大,不润无根之草;道法虽宽,只渡有缘之人。只有那些真正有根基、有诚意、有缘分的人,才能领悟法与道的精髓,才能得到老师的悉心教导,才能在医生的帮助下恢复健康。我们应当尊重这些古老的智慧,让它们在现代社会中继续发挥积极的作用 。
2025-11-24 16:22:02
838
转载 (转载)最好的生活方式:不说闲话,不管闲事,不做闲人
人生,是一场自我的修行。每个人都有自己的活法,你不能拿你的尺子去度量他人的人生。更何况,我们也管不了那么多,过好自己的生活,已经足矣。
2025-11-24 10:44:11
99
转载 (转载)别焦虑,生活不过是见招拆招
人生下半场,希望我们都放下焦虑,允许自己出错,允许自己平庸,允许事与愿违,去经历、去体验,去享受人间一趟的美好。
2025-11-24 10:07:29
89
NVIDIA-Linux-x86-64-570.207.run
2025-12-03
openjdk-21.0.2_linux-x64_bin.zip
2025-11-24
Tree-sitter:AI Code Review 的底层基石与实践指南.ipynb
2025-11-21
LangChain核心组件:短期记忆.ipynb
2025-11-18
FoundationStereo仓库源码2025.zip
2025-11-17
深度学习入门指南:从零开始,手把手教你理解、构建与应用神经网络.ipynb
2025-11-13
LangChain v1.0 快速入门.ipynb
2025-11-08
零基础入门AI智能体:你的第一个数字伙伴是如何思考与行动的?.ipynb
2025-11-04
从零到一:用C#玩转OpenAI大模型的完整指南.pdf
2025-11-03
Python OpenAI库完全指南:从零开始掌握大模型编程.pdf
2025-10-31
Python与人工智能:初学者的编程指南.pdf
2025-10-30
GPT结构剖析:从“词袋”到“思想”的魔法之旅.pdf
2025-10-28
从单轮到多轮:大模型对话API的上下文管理艺术与工程实践.pdf
2025-10-28
【人工智能开发】基于API调用的大模型应用:电商智能客服系统构建与性能优化全流程解析
2025-10-28
人工智能RAG+Agent+小模型协同架构:构建可靠高效经济的企业级AI应用系统设计
2025-10-28
一文读懂大模型推理框架:10大工具的优缺点、适用场景与选型推荐-.pdf
2025-10-27
world-map-slam建图-ros2(kilted).zip
2026-03-21
MiniClaw-.Net8框架.zip
2026-03-19
Agent-Skills-Demo-V1.0.zip
2026-03-12
poppler-26.01.0-vcpkg.zip
2026-01-21
poppler-26.01.0.tar.xz
2026-01-20
QmlExample.zip
2026-01-20
WidgetExample.zip
2026-01-20
tauri-1.92.0-build-tools-win10.zip
2026-01-06
transformers-82a06d-hunyuanocr.zip
2025-12-19
video_hunyuan_video_1.5_720p_i2v.json
2025-12-08
video_hunyuan_video_1.5_720p_t2v.json
2025-12-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅