三贝勒文子-CSDN博客

原创动态时间规整算法——DTW

动态时间规整算法——DTW

2022-06-27 20:44:22 23795 16

原创 C/C++的指针传递和引用传递

C/C++指针传递和引用传递傻傻分不清楚

2022-04-12 21:09:34 26920 2

本文系统讲解了结构体对齐规则、CacheLine机制和伪共享问题。结构体对齐部分详细阐述了默认对齐三步规则（成员偏移对齐、顺序存储、整体对齐）、嵌套结构体处理及手动调整对齐方法（#pragma pack）。CacheLine部分解析了其作为CPU缓存最小单元的工作原理（64字节常见），以及基于程序局部性原理的设计初衷。重点探讨了CacheLine对程序性能的两大影响：内存对齐优化和伪共享问题。伪共享部分深入分析了多线程环境下因共享CacheLine导致的性能下降机制，并提供了缓存行填充、C++17标准常量和

2026-03-20 08:30:00 372

原创内存模型和生命周期（二）

本文深入解析了C++中三个关键概念：placement new、全局对象初始化顺序和内存对齐。placement new是在已分配内存上构造对象的特殊运算符，主要用于内存池和自定义内存管理，需注意手动调用析构函数。全局对象初始化顺序在不同编译单元间无定义，建议使用Meyers单例模式解决。C++11后静态局部变量初始化具备线程安全性。内存对齐是硬件访问内存的基本要求，能显著提升性能，可通过结构体成员排序优化和alignas关键字控制。这些知识点对编写高效、安全的C++代码至关重要，特别是涉及内存管理和多线程

2026-03-16 08:30:00 356

原创 C++ 内存模型和生命周期（一）

本文深入解析C/C++程序内存管理的核心机制，分为四个部分：1）程序内存分区（代码区、常量区、全局/静态区、堆区、栈区）及其特性对比；2）栈与堆的本质差异，包括管理方式、分配机制和性能差异；3）malloc底层原理，涵盖用户态分配器(ptmalloc2)和系统调用(brk/mmap)的双层架构；4）new运算符实现细节，重点阐述new[]/delete[]必须配对使用的原因（元数据管理和析构函数调用）。全文通过对比表格、代码示例和内存布局图，系统性地揭示了内存分配的核心机制和常见问题，为编写高效、安全的C/

2026-03-12 09:18:16 396

原创从零到一：保姆级手把手教小白怎么免费安装部署 openClaw 全攻略

OpenClaw（ClawDBot）是一款新兴的免费AI工具，适合新手使用且支持自定义功能。部署只需3步：1）获取免费API密钥（推荐硅基流动或推理时代平台）；2）安装必备环境（CherryStudio、Node.js和Git）；3）在CherryStudio中一键配置并启动机器人。部署成功后，该AI可联网查询、自我优化，并接入钉钉/飞书等平台工作。整个过程无需付费，用户可逐步探索更多高级功能。

2026-03-09 09:21:26 598

原创爆火出圈！OpenClaw：AI从“只说不做“到“替你干活“，数字员工时代真来了

2026 开年 AI 圈炸场，OpenClaw凭一己之力改写行业认知，被盖章为 AI 从对话时代迈入执行时代的标志性开源项目！它不是只会唠嗑的聊天机器人，而是能 7×24 小时干活的专属数字员工，GitHub 星标直冲 24.1 万，热度直接刷新纪录！今天就用超轻松的方式，扒透这个刷屏级 AI 代理到底有多香、坑在哪、怎么玩～

2026-03-08 09:53:20 334

原创科技越发达，内心的平静反而越珍贵

AI焦虑症自救指南：当技术迭代快过学习速度时，我们该如何自处？面对GPT-5等AI技术的飞速发展，许多人陷入"追不上"的恐慌。文章将人群分为三类：逃避型、焦虑型和掌控型，并提出四个实用建议：把AI当作24小时实习生而非对手；每天强制断网一小时保持清醒；以游戏心态探索AI功能；专注发展AI无法替代的人类特质（情感体验、道德判断等）。作者认为，与其恐惧被取代，不如建立"人机协作"思维——AI是工具，人才是主体。最终解决方案是：在技术洪流中保持自己的节奏，珍惜AI永远无法复

2026-03-07 17:01:43 357

原创 C++ 指针和引用（三）

本文详细解析了C++中指针运算、指针减法、void指针、函数指针、成员函数指针和this指针的核心概念与使用场景。指针运算仅对数组/连续内存合法，指针减法用于计算元素个数差；void作为通用指针用于底层内存操作和兼容C API；函数指针支持回调与动态分发；成员函数指针需绑定对象调用；this指针作为隐式参数不可为nullptr。文章强调指针操作的合法性边界，指出未定义行为的风险，并提供现代C++替代方案（如迭代器、智能指针、lambda等）以增强安全性。

2026-02-13 08:30:00 1125

原创 C++ 指针和引用（二）

本文系统讲解了C++指针和引用的核心概念与应用场景。重点解析了常量指针与指针常量的区别（"左数右针"规则），二级指针的四大使用场景（修改外部指针、动态数组、C API交互、函数指针数组），以及nullptr相比NULL的类型安全优势。同时深入探讨了引用绑定临时变量的规则：普通引用禁止绑定，const引用可绑定并延长生命周期，右值引用专为绑定临时变量设计。最后强调了const引用在避免拷贝、保护数据、兼容参数类型方面的重要价值。这些知识点是C++内存管理和参数传递的核心基础。

2026-02-12 08:30:00 1363

原创 C++ 指针和引用（一）

本文系统分析了C++中指针与引用的本质区别、使用场景及常见问题。核心要点包括：1. 指针与引用的本质差异：指针是独立变量存储地址，引用是变量别名；2. 引用引入的必要性：解决指针语法繁琐、提升安全性、满足运算符重载需求；3. 参数传递选择原则：优先引用传参，需空值/修改指针时用指针；4. 野指针/悬空指针的危害：访问无效内存导致崩溃或数据篡改；5. 防范措施：初始化置空、释放后置空、智能指针替代、边界检查等。文章提供了详细的对比分析和实用解决方案，帮助开发者安全高效地使用指针和引用。

2026-02-10 08:30:00 651

原创 C++ 的一些基础知识（二）

本文深入探讨了C++中多个关键特性的底层原理和应用场景。关于volatile关键字，文章澄清了其核心价值在于嵌入式/硬件编程、信号处理等底层场景，而非多线程同步。对于static关键字，详细解析了其在不同上下文（全局变量、函数、类成员）中的语义差异和作用。inline关键字的真正作用是解决头文件函数重复定义问题，而非强制内联优化。命名空间的引入有效解决了全局命名污染问题，提升了代码模块化程度。文章还对比了using、typedef和#define的区别，分析了sizeof运算符的编译期特性，并澄清了stru

2026-02-06 08:30:00 1996

原创 C++ 的一些基础知识（一）

C++ 的一些基础知识

2026-02-03 10:19:05 815

原创超详细的 Sklansky 加法器解析

摘要：Sklansky加法器是一种高性能并行进位加法器，采用完全二叉树结构实现最优延迟（O(log₂n)）。相比Brent-Kung加法器，Sklansky通过层级化并行合并进位信号，消除等待节点，但代价是更大的逻辑门数量。其核心是通过(G,P)信号的分层合并规则快速计算进位，适用于对速度要求苛刻的场景（如CPU ALU）。文章详细解析了8位Sklansky加法器的5步计算过程，并与Brent-Kung加法器在结构、延迟和资源开销方面进行对比，指出两者在性能与面积间的不同取舍。

2026-01-20 10:23:36 605

原创超详细地剖析 Brent-Kung 加法器原理

本文深入解析了Brent-Kung加法器(BK加法器)在数字集成电路中的关键作用。该加法器通过创新的"稀疏进位树"结构，将32位运算延迟控制在2.3ns(28nm工艺)，逻辑门数量较标准超前进位加法器减少60%以上，实现了速度与面积的最优平衡。文章系统阐述了BK加法器的两级进位计算原理，包括局部块进位信号生成和全局稀疏连接机制，并通过8位加法器的层级化计算过程进行详细说明。性能对比显示，BK加法器在延迟、面积和功耗指标上均优于传统结构，使其成为CPU、FPGA等高性能芯片中算术运算单元的

2025-12-14 21:03:47 735

原创 Synopsys Datapath 算子：结构与实现宝典

Booth-Radix4 结构。Booth-Radix8 结构。Kogge–Stone 结构。None-Booth 结构。Sklansky 结构。mux_tree 结构。dec-sel 结构。

2025-12-09 13:51:44 223

原创 Square Root Carry Select Adder

本文详细介绍了平方根进位选择加法器（SRCSA）的设计原理与实现方法。通过不等长分组优化（每组位宽依次递增），使各组延迟趋于平衡，将总延迟从线性降低至平方根级别。文章具体阐述了16位SRCSA的分组设计（1+2+3+4+6位）、各级单元结构（双路径RCA+MUX）、级联方法及延迟分析（20级门延迟）。最后总结了SRCSA的5步实现流程：分组计算、双路径搭建、MUX选择、级联连接和结果拼接，并指出其在大位宽运算中的性能优势。

2025-12-03 08:15:00 1641

原创 Carry Select Adder

文章摘要：CSA（进位选择加法器）是RCA（串行进位加法器）和CLA（超前进位加法器）的折中方案。其核心思想是将加法器分组，每组并行计算进位为0和1两种情况的结果，再通过MUX选择正确输出。4位小组CSA由两条4位RCA路径和MUX构成，延迟为4级FA+1级MUX。大位宽CSA通过级联多个小组实现，可采用不等长分组优化时序。相比RCA减少了串行延迟，比CLA逻辑更简单，适用于8-64位中等位宽运算。

2025-11-22 16:26:04 670

原创 Carry Look Ahead Adder：让加法更快的秘密武器

摘要：进位前瞻加法器（CLA）通过逻辑展开并行计算进位信号，解决了传统波纹进位加法器（RCA）的延迟问题。CLA利用生成（G）和传播（P）信号直接预测进位，避免逐级传递，显著降低延迟（从线性到对数级）。4位CLA可扩展为分层结构处理大位宽运算，但需权衡面积和复杂度。Verilog示例展示了4位CLA的实现，其核心公式为C_{i+1}=G_i+P_iC_i。CLA是高性能加法器的关键技术，但在实际设计中常与混合结构结合优化。

2025-11-06 08:15:00 816

原创 Ripple Carry Adder 的原理与结构：最纯粹的进位传播机制

摘要： Ripple Carry Adder（RCA）是所有加法器结构的基础，通过逐级传递进位实现多位加法。其核心是由全加器级联构成，进位延迟随位数线性增长（O(n)），导致高位计算成为关键路径瓶颈。RCA结构简单、面积小，但大位宽时效率低。现代优化方法（如Carry Lookahead、Carry Skip）通过并行或预测机制缩短进位链。RCA作为“原型机”，揭示了进位依赖的本质，是理解高效加法器设计的起点。

2025-10-29 08:15:00 1018

原创加法器进位的那些事

文章摘要：本文介绍了二进制加法的进位原理及其加速方法。首先通过十进制加法类比二进制加法规则，解释每位和(Si)与进位(Ci)的计算公式。重点阐述了分组进位技术，将大位宽加法分为多组，每组独立计算生成项(Gg)和传播项(Pg)，再通过组间进位传播提高运算速度。以16位加法为例，分为4组并行计算，最后组合结果，有效减少电路延迟，实现快速加法运算。这种分组进位方法在硬件设计中具有重要应用价值。

2025-10-28 20:45:14 979

原创为什么你的 Critical Path 延迟超标？先搞懂 Fanout/Cap/Trans 的 “送货逻辑” 再说

文章用快递送货类比数字电路中的延迟问题，将数字单元比作快递员，延迟比作送货时间。关键因素包括：1）负载电容（Cap）对应包裹总重量，重量越大延迟越长；2）扇出（Fanout）对应包裹数量，数量多可能增加总重量，但不绝对；3）转换时间（Trans）对应取件准备时间，准备越久总延迟越长。三者共同影响时，延迟会显著增加。解决方案包括：更换高驱动单元（换大电动车）、插入缓冲器（分批送货）和优化前级单元（提前准备）。这种类比生动解释了数字电路延迟的影响因素和优化方法。

2025-10-16 08:15:00 863

原创 Synopsys 逻辑综合之 ICG

文章摘要： ICG（集成时钟门控单元）是一种用于降低时钟功耗的专用逻辑单元，通过控制时钟信号的传播实现节能。其核心原理是在寄存器前插入门控逻辑（如gclk=clk&en），但需避免直接使用AND门以防止毛刺，转而采用带锁存器的专用ICG单元。在RTL设计中，符合条件（如稳定使能信号）的if(en)结构可被综合工具（如DesignCompiler）自动识别并替换为ICG。使用时需配置时序检查（如PrimeTime分析使能路径、门控时钟延迟），并注意避免组合逻辑使能、多级门控等误区。ICG是芯片低功耗设

2025-07-11 08:45:00 4028

原创 Synopsys 逻辑综合之 MultiBit Flip-Flop 与 ICG

本文介绍了Multi-Bit Flip-Flop（多比特寄存器）的概念及其在芯片设计中的优势。与传统1-bit寄存器相比，Multi-Bit FF通过合并多个相同控制信号的寄存器，实现共享时钟引脚、降低功耗（减少20%-40%时钟功耗）、节省芯片面积（约15%-30%）和优化布局。文章详细说明了在Synopsys Design Compiler中如何启用Multi-Bit FF功能，并强调其与时钟门控(ICG)技术的协同优化效果。通过实际案例展示了16位寄存器合并为1个Multi-Bit FF的过程，证明该

2025-07-10 09:50:57 4121

原创行波进位加法器 (Carry-Propagate Adder)

文章摘要：行波进位加法器（RCA）是最基本的加法器结构，通过串联全加器实现逐位进位传播。其结构简单、功耗低，但延迟随位数线性增长（O(n)）。适用于低位数加法（≤8位）和非关键路径电路。文章详细介绍了RCA的原理、结构、公式、应用场景，并提供了Verilog RTL代码和C++模拟实现。虽然在高位加法中效率较低，但RCA作为数字电路基础组件，在特定场景仍具有重要应用价值。更高效的超前进位加法器（CLA）常用于高位加法实现。

2025-07-03 19:30:00 4263 2

原创半加器和全加器

摘要：本文介绍了加法器的两种基础单元——半加器和全加器。半加器用于两个二进制位的相加，通过异或门计算和位，与门计算进位位。全加器则能处理三个输入位（包括低位进位），采用两个半加器加或门实现，或直接用异或门与与门组合构建。半加器适用于最低有效位运算，全加器用于构建多位加法器，是计算机算术运算的基础模块。两者的核心区别在于全加器能处理进位链，从而支持多位数相加。

2025-07-01 12:46:59 5806

原创全面深入理解加法器架构：从全加器到并行前缀优化

本文系统介绍了数字电路中的各类加法器设计与性能对比。从基础的全加器、半加器开始，逐步分析Ripple-Carry、Carry-Skip、Carry-Lookahead等经典加法器结构，重点探讨了Parallel-Prefix加法器的实现方法及各类前缀结构特性。针对多操作数场景详细讲解了Carry-Save加法器及其在Wallace Tree中的应用，并对比了各类加法器的延迟、面积等关键指标。最后给出设计建议：初学者从RCA/CSKA入手，高性能场景推荐PPA+CSA组合，为不同应用需求提供了明确的选型指导。

2025-06-21 17:44:45 4114

原创数字系统的灵魂：深入剖析各类数值编码方式

本文系统介绍了多种数字表示系统及其应用。二进制系统包含无符号、补码、符号-幅值等编码方式；格雷码用于低功耗计数；冗余数系统实现无进位加法；余数系统（RNS）基于模运算实现并行计算；浮点数遵循IEEE 754标准；对数数制（LNS）加速乘除运算；反四重数制表示超大数值。每种系统各有优劣：补码通用但非对称，格雷码低功耗但难运算，冗余数无进位但复杂，RNS并行强但难比较，浮点范围广但精度不均，LNS乘除快但加减慢。这些系统在计算机体系结构、DSP、滤波器等场景有重要应用。

2025-06-20 17:08:45 3713

原创主成分分析（PCA）原理与实战：从0到1彻底掌握

主成分分析（PCA）原理与实战：从0到1彻底掌握

2025-06-09 19:59:08 3624

原创向量压缩方法全解析：从线性插值到小波压缩

向量压缩方法全解析：从线性插值到小波压缩

2025-06-06 16:20:56 3376

原创从加法器到乘法器：一文吃透计算机算术的秘密武器（下）

本文系统梳理了数字电路设计中常见的加法器结构及其实现特性。主要内容包括：1）Ripple Carry Adder的基本串行结构及其低功耗特性；2）Carry Lookahead Adder通过预计算提升速度的原理；3）Carry Select Adder的双路并行计算机制；4）Parallel Prefix Adders系列的高性能实现方案。文章强调实际设计中应通过综合工具约束和RTL编码引导工具自动选择最优结构，并建议通过时序报告分析关键路径，针对不同位宽和频率需求进行实验验证。核心观点是理解加法器结构的

2025-05-26 16:46:39 4518

原创从加法器到乘法器：一文吃透计算机算术的秘密武器（上）

如果你想设计出高性能芯片，必须从“写出能综合的 HDL”升级到“写出能优化、能分析的 HDL”。理解数据表示、加法器、乘法器原理，不是为了考试，而是为了让你掌握综合器的“思维逻辑”。本期只是入门篇：下一期，我们将深度对比 8 种加法器结构，从面积、速度、综合后层级逐个图解，并用真实综合脚本分析路径瓶颈。📘 后续将包括：CSA 树、多操作数加法器、浮点数综合、CORDIC 算法硬件化、Design Compiler 脚本调优全解析。

2025-05-26 09:38:03 2448

原创揭秘 AddSub Operator：Synopsys DC 中加减运算符的底层构建与优化

是 DC datapath synthesis 的核心算术运算单元，涵盖加/减两种模式。通过 HLO 调度与重写，将 ADD 和 SUB 节点统一成一个可切换模式的 datapath operator。在 Mapping 阶段，优先匹配可配置 ALU Macro，否则展开为门级网络。构建失败通常源于位宽不匹配、调度不同步或模式冲突，通过合理约束与 RTL 组织可以有效避免。

2025-05-22 10:14:22 3627

原创揭秘综合器的MUX构建逻辑：Synopsys Design Compiler中HLO与Datapath如何打造高效选择器结构

本文深入探讨了MUX（多路选择器）在RTL设计中的核心作用及其构建过程。MUX不仅是条件控制中的常见结构，还直接影响datapath的结构树形成、资源共享、功耗和面积等关键指标。文章详细介绍了MUX表达式的识别与解析、构建的关键前提、优化路径、构建结构、常见失败原因及Debug方法，并提供了优化策略。通过理解MUX的构建流程和优化技巧，设计者可以更有效地实现资源共享和面积节省，提升综合器的智能化能力。

2025-05-15 09:15:00 9619

原创深入 datapath optimization：从 expression 到结构映射的全过程解析

本文详细介绍了从RTL表达式到Datapath结构的转换过程，涵盖了表达式树生成、表达式调度、结构重写、Datapath节点构建、控制逻辑生成以及优化实例等关键步骤。通过具体示例，如assign result = (a+b)*(c-d);，展示了如何将RTL表达式转换为表达式树，并进一步调度和重写以优化结构。文章还探讨了如何将表达式映射为可复用的结构组件，如加法器、乘法器和MUX，并介绍了共享路径识别和多路复用等优化技术。此外，提供了使用Design Compiler的实际技巧和调试Datapath合成的常

2025-05-14 09:15:00 12325

空空如也

空空如也