- 博客(167)
- 收藏
- 关注
原创 【C++项目】微服务即时通讯系统:服务端
本文介绍了聊天室项目的服务器功能设计、微服务拆分、通信接口设计及实现,以及后台服务器的部署。项目采用微服务架构,将功能拆分为网关、用户管理、好友管理、文件管理、消息管理、转发管理和语音转换等子服务,通过 HTTP 和 Websocket 与客户端通信,使用多种框架和库实现服务功能。微服务通信接口详细定义了各子服务的请求响应格式和流程。部署时,利用 Docker 和 docker-compose 实现一键式部署,通过编写 Dockerfile、entrypoint.sh 和 docker-compose.ym
2025-09-20 13:32:15
13887
5
原创 【C++项目】:仿 muduo 库 One-Thread-One-Loop 式并发服务器
本文介绍了一个基于Reactor模型的高性能HTTP服务器组件实现方案。该项目分为SERVER模块和协议模块两大模块,采用主从Reactor多线程架构,主Reactor负责监听新连接,从Reactor处理IO事件。SERVER模块包含Buffer缓冲、Socket操作、Channel事件管理、Connection连接管理、Acceptor监听管理等子模块,通过Connection实现完整的套接字生命周期管理。项目采用One Thread One Loop思想,每个线程独立处理事件循环,同时支持自定义协议模块
2025-05-29 23:50:20
11572
69
原创 【C++项目】从零实现RPC框架「二」:项⽬设计
本文概述了RPC分布式系统的设计,涵盖基本概念、服务注册发现机制及负载均衡,并详细介绍了服务端与客户端的功能模块,最后展示了系统的三层架构设计。
2025-03-14 00:15:49
6023
93
原创 CANN ops-math 算子库深度解析:数学原子算子的指令流水线调度、存储对齐与数值精度机制
开发者必须编写 Tiling 函数来计算分块元数据,包括 Tile 的尺寸和数量。这确保了算子的执行适应不同的输入张量规模。CANN PyPTO 编程范式通过将复杂的异构计算任务转化为结构化的 Tile 操作,提供了一种兼具开发效率与极致性能的解决方案。它通过显式内存控制、双缓冲流水线和自动化的并行调度,成功地解决了传统算子开发中面临的内存瓶颈和调度复杂性问题,是释放昇腾 AI 处理器并行算力的关键工具。
2026-02-06 21:52:58
288
原创 CANN PyPTO 编程范式深度解析:Tile 级并行调度、异构内存协同与高性能指令编排
开发者必须编写 Tiling 函数来计算分块元数据,包括 Tile 的尺寸和数量。这确保了算子的执行适应不同的输入张量规模。CANN PyPTO 编程范式通过将复杂的异构计算任务转化为结构化的 Tile 操作,提供了一种兼具开发效率与极致性能的解决方案。它通过显式内存控制、双缓冲流水线和自动化的并行调度,成功地解决了传统算子开发中面临的内存瓶颈和调度复杂性问题,是释放昇腾 AI 处理器并行算力的关键工具。
2026-02-06 21:51:00
183
原创 CANN PyPTO 编程范式深度解析:并行张量与 Tile 分块操作的架构原理、内存控制与流水线调度机制
开发者必须编写 Tiling 函数来计算分块元数据,包括 Tile 的尺寸和数量。这确保了算子的执行适应不同的输入张量规模。CANN PyPTO 编程范式通过将复杂的异构计算任务转化为结构化的 Tile 操作,提供了一种兼具开发效率与极致性能的解决方案。它通过显式内存控制、双缓冲流水线和自动化的并行调度,成功地解决了传统算子开发中面临的内存瓶颈和调度复杂性问题,是释放昇腾 AI 处理器并行算力的关键工具。
2026-02-06 21:49:28
152
原创 CANN Catlass 算子模板库深度解析:高性能矩阵乘(GEMM)架构、片上缓存优化与融合算子实现
Catlass 算子模板库是 CANN 架构下实现高性能矩阵乘法的关键基础设施。它通过对 NPU Cube 单元的深度指令映射、精细的 Tiling 策略以及灵活的融合算子模板,解决了深度学习模型中的核心计算瓶颈。掌握 Catlass 模板,是开发者在昇腾平台上构建高效计算核函数、实现算力极致释放的关键途径。
2026-02-06 21:48:06
202
原创 CANN Catlass 算子模板库深度解析:矩阵乘法(GEMM)性能实现、Cube Unit 流水线与融合算子架构
Catlass 算子模板库是 CANN 架构下实现高性能矩阵乘法的关键基础设施。它通过对 NPU Cube 单元的深度指令映射、精细的 Tiling 策略以及灵活的融合算子模板,解决了深度学习模型中的核心计算瓶颈。掌握 Catlass 模板,是开发者在昇腾平台上构建高效计算核函数、实现算力极致释放的关键途径。
2026-02-06 21:47:03
197
原创 CANN Catlass 算子模板库深度解析:高性能 GEMM 融合计算、Cube Unit Tiling 机制与编程范式实践
Catlass 算子模板库是 CANN 架构下实现高性能矩阵乘法的关键基础设施。它通过对 NPU Cube 单元的深度指令映射、精细的 Tiling 策略以及灵活的融合算子模板,解决了深度学习模型中的核心计算瓶颈。掌握 Catlass 模板,是开发者在昇腾平台上构建高效计算核函数、实现算力极致释放的关键途径。
2026-02-06 21:45:54
186
原创 CANN Catlass 算子模板库深度解析:高性能矩阵乘(GEMM)原理、融合优化与模板化开发实践
Catlass 算子模板库是 CANN 架构下实现高性能矩阵乘法的核心基础设施。它通过对 NPU Cube 单元的深度指令映射、精细的 Tiling 策略以及灵活的融合算子模板,解决了深度学习模型中的核心计算瓶颈。掌握 Catlass 模板,是开发者在昇腾平台上构建高效计算核函数、实现算力极致释放的关键途径。
2026-02-06 21:44:01
201
原创 CANN ops-math 算子库深度解析:基础数学运算的向量化、非线性函数逼近与存储访问优化机制
CANN GE 是连接上层 AI 生态与底层昇腾硬件算力的核心智能引擎。它通过算子融合、内存复用、多流并行调度和模型下沉等技术手段,解决了异构计算中的效率、内存和并发难题。GE 的强大优化能力使得开发者可以将精力集中在算法创新上,而将复杂的硬件适配与性能优化交给底层的编译和执行机制。
2026-02-06 21:42:59
93
原创 CANN GE 深度解析:图编译器与执行引擎的后端优化策略、OM 文件结构与 Stream 调度机制
CANN GE 是连接上层 AI 生态与底层昇腾硬件算力的核心智能引擎。它通过算子融合、内存复用、多流并行调度和模型下沉等技术手段,解决了异构计算中的效率、内存和并发难题。GE 的强大优化能力使得开发者可以将精力集中在算法创新上,而将复杂的硬件适配与性能优化交给底层的编译和执行机制。
2026-02-06 21:42:14
203
原创 CANN GE 深度解析:图编译与执行引擎的优化管线、Stream 调度与模型下沉机制
CANN GE 是连接深度学习算法与昇腾硬件算力的核心智能引擎。它通过算子融合、静态内存规划、多流并行以及模型下沉等技术手段,实现了计算图在异构处理器上的极致优化。GE 的强大功能确保了开发者可以利用熟悉的上层框架进行开发,而将性能优化的复杂性留给底层的编译和执行机制。
2026-02-06 21:13:07
143
原创 【Docker#4】Docker Registry 镜像仓库
文章系统梳理了 Docker Registry 的概念、分类与工作机制,涵盖公共/私有仓库、国内外镜像加速方案及 Harbor 等企业级方案;手把手演示 Nginx 镜像拉取、运行、定制首页并推送至 Docker Hub 与腾讯云私有仓库的全过程,附常见报错与排障技巧,是快速掌握镜像仓库管理与实战的完整指南。
2026-02-02 22:14:52
6015
原创 【节点小宝】:一个APP解决所有设备互联问题!附免费抽两年会员+NAS惊喜
设备太多管理不过来?这个APP让我实现了数字生活大一统!作为一个拥有十多台电子设备的重度用户,我曾经饱受设备间文件传输的折磨。直到发现节点小宝,才终于实现了所有设备的无缝互联。数了数,我目前正在使用的设备有:2台笔记本、3部手机、1台平板、1台NAS、1台台式机,还有各种智能设备。以前最头疼的就是如何在它们之间传输文件。
2026-01-30 12:00:00
20185
原创 【Docker#3】Docker 介绍 & 环境安装
文章系统梳理 Docker 本质、引擎演进与虚拟机差异,手把手示范 Ubuntu 22.04 安装、镜像加速及 hello-world 验证,用酒店入住类比架构,揭示镜像与 Hub 在海量数据时代的价值,适合零基础快速入门。
2026-01-26 21:34:38
6407
原创 【Docker#2】容器化虚拟化
文章系统梳理了虚拟化与容器化的核心概念:从物理机、虚拟机到容器的资源隔离演进,对比了虚拟机管理器(Type1/Type2)与 Linux Namespace/Cgroup 的底层实现,并借助 LXC 实操展示如何创建、启动、限制与销毁容器。作者用“庄园-楼盘-合租”类比,帮助读者秒懂三种形态差异;随后给出 dd、mkfs、mount、unshare、pidstat、stress 等命令实战,验证隔离与资源控制效果;最后总结容器化带来的标准化、弹性、轻量、安全七大收益,为后续学习 Docker 打下坚实底层基
2026-01-24 23:42:43
5399
原创 【节点小宝】实现全网络无缝互联!网关模式正式上线!
节点小宝推出网关模式,只需在路由器/NAS装一次客户端,即可让网下所有设备免装端异地组网,北京电脑可直接访问深圳NAS,像在同一局域网,P2P高速低延迟。
2026-01-23 09:00:00
11962
原创 【Docker#1】技术架构演进之路
文章以电商演进为例,梳理单机→分布式→微服务→容器编排完整架构升级路线,对比分布式与集群、HA与HC,列评价指标与中间件选型,给出决策思路:按业务需求逐步加层扩容,用Docker+K8s实现弹性交付。
2026-01-18 13:22:27
1752
原创 保姆级教程:如何设置Windows电脑,实现最安全的远程文件共享?
想随时随地访问家中Windows电脑里的学习资料、工作备份,又担心整个C盘暴露不安全?节点小宝的远程文件支持精准共享。本文手把手教你,如何像设置手机APP权限一样,只将你指定的文件夹安全地共享到公网。
2026-01-14 09:00:00
18798
原创 【C++20】特性解析 (上)
这篇长文系统梳理了 C++20 四大核心特性:Concepts 借编译期谓词让模板接口清晰、错误友好;Coroutines 以无栈协程实现异步暂停-恢复,演示生成器、线程调度与 Echo 服务器;Modules 用“编译一次”替代 #include,大幅缩短构建时间并解耦宏污染;Ranges 提供惰性视图与投影算法,使链式容器操作简洁安全。辅以详尽代码、偏序规则、异常处理及编译器配置,为现代 C++ 高效编程铺就进阶之路。
2026-01-01 17:51:01
7804
2
原创 逐梦编程路——从学生到实习生的技术沉淀
这是一篇真诚朴实的2025年终总结,作者回顾了自己从C++菜鸟到两次实习、坚持写90多篇技术博客的成长历程,坦然分享踩过的坑、熬过的夜和微小的进步,传递出“笨拙但坚持”的普通技术学习者的真实心声。
2025-12-30 20:42:57
2736
27
原创 无缝穿越系统边界:节点小宝4.0如何让我的Mac/iOS像访问本地盘一样操控Windows
本文结合三设备(Windows台式机、MacBook Pro、iPhone 14)使用场景,深度测评节点小宝4.0在跨平台远程访问与文件传输中的表现。通过真实案例和性能数据,展现其在校园网环境下相较传统方案(如SMB、微信、网盘)在速度、稳定性、操作自然度等方面的显著优势,突出其“无缝穿越系统边界”的协同效率价值。
2025-12-25 11:54:16
34522
3
原创 【CMake#1】:CMake 安装快速上手
CMake是跨平台C/C++构建利器,一次编写CMakeLists.txt,即可生成VS、Makefile、Xcode等工程。文章从起源、设计哲学到安装、Hello World实战,带你快速入门现代CMake,告别手写多平台脚本。
2025-12-14 14:31:16
1177
3
原创 【Go】反射
Go 的反射机制由 reflect 包提供,核心是两个函数:reflect.TypeOf 返回接口 reflect.Type,描述静态类型信息;reflect.ValueOf 返回结构体 reflect.Value,携带运行时值。功能强大但须区分指针、结构体,多次转换与调用带来明显性能损耗,宜只用于框架、序列化等通用场景。
2025-12-04 10:14:04
3836
2
原创 【Go】异常处理、泛型和文件操作
Go异常靠error逐层返回,panic/recover仅作兜底;1.18起支持泛型,函数、结构体、切片、map均可加类型参数;文件读写提供一次性、分片、缓冲、指定分隔符等多种方式,并支持复制与目录遍历。
2025-12-02 20:53:53
990
1
原创 【Go】 协程和 channel
本文详解Go协程、channel、select及线程安全。先以WaitGroup解决主线程不等协程,展示无缓冲与缓冲channel数据传递,用select多路复用与超时控制。最后剖析并发读写变量与map的竞态,给出Mutex锁与sync.Map两种同步方案,并附完整代码示例。
2025-12-01 21:28:22
1016
原创 【Go】结构体、自定义类型与接口
文章介绍了Go语言中结构体、自定义类型和接口的核心用法:包括结构体定义、继承、指针方法、tag标签;自定义类型与类型别名的区别;接口的定义、实现、类型断言及空接口的应用,涵盖JSON序列化、方法绑定等实用技巧。
2025-12-01 15:56:38
3942
1
原创 【Go】环境搭建与基本使用
本文是一站式 Go 入门教程,围绕环境搭建、语法基础、复合类型、控制结构、函数与高阶特性、资源管理六条主线展开。结合大量示例代码,帮助零基础读者快速上手并建立完整语言体系。
2025-11-30 09:29:29
4213
1
原创 LangChain与LangGraph介绍
LangChain把提示词、模型、工具串成链,快速搭AI应用;LangGraph用状态图代替单链,支持循环、分支、长期记忆和人机协同,补LangChain短板,适合复杂流程。
2025-11-22 11:02:59
1881
原创 LangChain-大模型介绍
模型是“数据炼成的规律工厂”。大语言模型借千亿参数、自监督“完形填空”习得通用语言,聊天写代码样样通。嵌入模型把文字转语义向量,支撑搜索推荐RAG。API、本地、SDK三法接入,敏感数据选本地,快速原型用API。
2025-11-18 20:17:25
3626
原创 CANN多核编程终局:同步、规约与全局结果的诞生
先到的人不能先走,必须在集合点等待,直到最后一个人也到达。这样的**规约类(Reduction)**算子,情况发生了根本性的变化。每个核心都像一个高效的独立王国,处理着自己的“一亩三分地”。这标志着一名CANN开发者,从能够实现“组件”,成长为了能够构建“系统”的真正专家。在上一篇中,我们学会了如何将一个大任务分发给所有AICore,实现了宏伟的数据并行。这意味着,所有核心必须以某种方式进行“沟通”和“协作”,将它们各自计算的局部结果,汇总成一个全局结果。它们唯一的“共同广场”,就是速度较慢的。
2025-11-18 12:31:36
592
原创 最后一公里:我的CANN算子“部署”记,从C++代码到PyTorch函数
对于昇腾NPU,这个桥梁就是**torch_npu**插件。我们的任务,就是把我们用C++写的CANN算子,包装成一个符合torch_npu规范的“插件”,让PyTorch能够认识并调用它。
2025-11-18 12:30:47
593
原创 榨干硬件性能:在CANN算子中实现Double Buffering来隐藏数据搬运延迟
这次,我们直奔主题,讲解一个CANN算子开发中,能显著提升性能的高级优化技巧——**Double Buffering(双缓冲)**。这篇文章将全是技术细节、代码逻辑和原理解析。
2025-11-18 12:30:04
632
原创 我的CANN算子开发“炼成记”:从一行代码都不懂到“手撕”Tiling
幸运的是,对于简单的Add算子,训练营提供了模板化的实现,我依葫芦画瓢,修改了一下数据类型和计算逻辑,然后紧张地按下了编译按钮。“算子”,这个词我听过无数次,知道它是构成神经网络的“原子”,是真正执行计算的单元。大厨每需要一个土豆,就亲自跑到遥远的冰库里,拿一个,再跑回来,在菜板上切好,再跑回去放好。我暂停了视频,在网上查阅了大量资料,又结合昇腾的文档,终于,我构建了一个自认为比较贴切的比喻,才算把这个概念彻底搞明白。跟着老师的引导,我创建了我的第一个算子工程——一个最简单的向量加法(Add)算子。
2025-11-18 12:10:44
13348
原创 从“算子工匠”到“系统架构师”:我的CANN开发之旅终极复盘
它让我们从一个API的“使用者”,变成了技术的“驾驭者”。这篇文章将不再引入新的技术点,而是站在更高的维度,审视我们整个学习旅程,探讨从一个应用开发者,转变为一个底层系统工程师,所必须经历的思维蜕变。这些工作,与算子核心的计算逻辑无关,但它们决定了一个算子是“代码片段”,还是一个健壮、易用、可维护的“软件产品”。它为我构建的,不仅仅是一个关于CANN的知识图谱,更是一个如何学习和掌握任何一门复杂底层技术的通用“心法”。从“点”到“面”,从“知其然”到“知其所以然”,从“实现”到“交付”。
2025-11-18 12:09:54
16452
原创 【C++17】特性解析
C++17 带来 20 余项重大改进:结构化绑定、inline 变量、if/switch 初始化让代码更简洁;optional、variant、any 统一“可能有值”语义;string_view 零拷贝视图;filesystem 跨平台文件系统;并行算法提速;强制省略拷贝、折叠表达式、模板参数推导、嵌套命名空间等全面提升开发效率与运行性能。
2025-11-15 10:28:08
1393
原创 CANN深度实践:从理论到代码的全面解析
CANN是华为AI计算架构,提供ACL接口、ACLNN算子库和自定义算子开发框架。通过资源调度优化、算子融合和内存管理等技术,显著提升AI应用性能,简化开发流程。
2025-11-12 00:11:51
5627
原创 CANN在智能视频分析场景中的实践应用
CANN实践:城市交通监控,车辆识别。ACL+DVPP,推理提速8倍,功耗降60%,开发周期缩40%。
2025-11-10 21:40:37
14556
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅