- 博客(182)
- 收藏
- 关注
原创 FPGA:CLB资源以及Verilog编码面积优化技巧
Kintex-7系列是Xilinx 7系列FPGA中的一款高性能产品,采用28nm工艺,定位于高性价比和性能平衡,广泛用于通信、信号处理和工业应用。CLB是Kintex-7 FPGA的核心逻辑资源,用于实现组合逻辑、时序逻辑和存储功能。Kintex-7的CLB资源由Slice_L和Slice_M组成,包含LUT6、触发器、进位逻辑和分布式RAM/SRL,适合实现多种逻辑和存储功能。本文将先介绍Kintex-7系列器件的CLB(可配置逻辑块)资源,然后分享在Verilog编码时节省CLB资源的技巧。
2025-05-22 21:26:42
1312
原创 硬件描述语言:Verilog和VHDL的区别
本文将从多个方面详细对比Verilog和VHDL这两种硬件描述语言(HDL),包括语法、设计哲学、应用场景、工具支持等,以帮助你全面理解它们的区别。以下内容将尽量简洁但全面,涵盖关键点,并以清晰的结构组织。
2025-05-21 17:43:15
1547
原创 C++语言的跨平台挑战和应对策略
C++在跨平台开发中的主要挑战源于操作系统、编译器、硬件架构和第三方库的差异。使用跨平台库和标准C++特性(如)抽象平台差异。借助CMake等工具统一构建流程。封装平台特定代码,减少条件编译的使用。选择成熟的跨平台第三方库,并通过vcpkg/Conan管理依赖。实现自动化测试和日志系统,提高调试效率。统一字符编码(如UTF-8)并支持国际化。通过合理的设计和工具支持,C++可以实现高效、可靠的跨平台开发,充分发挥其高性能和灵活性的优势。
2025-05-21 17:33:36
1015
原创 CAN总线
成为嵌入式领域的关键通信协议。设计时需重点关注物理层抗干扰、ID优先级分配及错误处理机制。在汽车和工业场景中,CAN仍是不可替代的选择,但对于高带宽需求(如ADAS摄像头),可结合Ethernet或CAN FD(灵活数据率,支持64字节)扩展使用。的串行通信协议,广泛应用于汽车电子、工业控制、医疗设备等领域。CAN总线(Controller Area Network,控制器局域网)是一种。
2025-05-20 21:27:25
564
原创 EtherCAT通信协议
EtherCAT(Ethernet for Control Automation Technology)是一种高性能的实时工业以太网通信协议,专为工业自动化和控制系统的需求设计。它结合了以太网的灵活性和工业实时通信的高效性,广泛应用于运动控制、机器人、过程自动化等领域。EtherCAT凭借其高速、高实时性、灵活的拓扑和低成本部署,成为工业自动化领域的领先协议。尤其适用于需要精确同步和大规模设备协同的场景,是未来工业4.0和智能制造的关键技术之一。
2025-05-20 21:21:28
389
原创 FPGA:高速接口JESD204B以及FPGA实现
JESD204B是由JEDEC(固态技术协会)制定的一种高速串行通信标准,主要用于数据转换器(如ADC、DAC)与数字处理单元(如FPGA、ASIC)之间的高速数据传输。高速串行通信JESD204B采用差分对(SerDes)进行高速串行数据传输,单通道速率可达12.5 Gbps(JESD204C进一步提升至32 Gbps)。通过多通道(lanes)并行传输,支持更高的总带宽,适合高采样率、高分辨率的数据转换器。主要特性同步性。
2025-05-19 23:37:14
1782
原创 AI:人形机器人一定是人的形状吗?
人形机器人并非必须是人的形状,其形态应由功能需求驱动。人形机器人在人类环境适应性和社交交互上有优势,但复杂性高、能效低;非人形机器人在效率、稳定性和成本上占优,但通用性和交互性较弱。技术选型需根据具体应用场景权衡,例如家庭护理选人形,工业生产或野外探索选非人形。未来,技术进步可能模糊两者的界限,催生更多混合形态的机器人。
2025-05-17 18:47:43
1130
原创 FPGA:Lattice的FPGA产品线以及器件选型建议
超低功耗/小型设备: iCE40系列(IoT、可穿戴设备)。高速视频/传感器接口: CrossLink系列(嵌入式视觉、汽车ADAS)。中高端性能/成本平衡: ECP5或Certus-NX(工业、通信)。系统控制/安全: MachXO系列(桥接、安全启动)。高性能/未来趋势: Avant系列或Nexus 2(5G、AI推理)。通用需求: Certus系列或Nexus平台(多领域通用)。
2025-05-16 21:11:22
1122
原创 FPGA: XILINX Kintex 7系列器件的架构
Kintex-7是Xilinx 7系列FPGA中的中高端产品线,基于28nm HKMG(高K金属栅极)工艺,旨在提供高性能、低功耗和成本效益的平衡,适用于通信、工业、医疗、航空航天等领域。其架构继承了Xilinx 7系列的统一设计理念,结合了可扩展的逻辑资源、丰富的I/O能力以及高性能信号处理模块。可编程逻辑资源(CLB)时钟管理单元(CMT)存储资源(Block RAM)数字信号处理单元(DSP48E1)高速串行收发器(GTX)I/O资源(SelectIO)片上互连网络配置和电源管理。
2025-05-16 20:24:15
1557
原创 FPGA: Xilinx Kintex 7实现PCIe接口
在Kintex-7 FPGA上实现PCIe接口,核心是使用Xilinx 7 Series PCIe IP核,配置GTX收发器和AXI-Stream接口,结合用户逻辑实现数据传输。流程包括IP配置、逻辑设计、仿真验证和硬件调试。参考Xilinx文档和示例工程,可快速搭建PCIe通信系统。
2025-05-14 22:11:27
1561
原创 FPGA:Xilinx Kintex 7实现DDR3 SDRAM读写
通过MIG IP核,Kintex-7 FPGA可以高效实现DDR3 SDRAM的读写。核心步骤包括:配置MIG生成控制器、设计用户逻辑、验证时序、仿真测试和硬件调试。结合Xilinx文档和参考设计,可快速搭建可靠的DDR3接口。
2025-05-14 22:07:49
1300
1
原创 FPGA:XILINX FPGA产品线以及器件选型建议
Xilinx FPGA产品线从Spartan的低成本到Versal的尖端计算,覆盖了消费电子、通信、工业、AI和国防等多个领域。选型时需明确应用需求,评估逻辑、DSP、I/O和收发器资源,平衡成本与性能,并借助Vivado和官方文档进行验证。
2025-05-13 22:35:54
1310
原创 芯片:金线的作用
金线因其导电性、稳定性和工艺成熟度,仍是芯片互联的“黄金标准”。尽管成本压力推动替代材料发展,但在高可靠性领域,金线短期内不可替代。技术进步将逐步平衡性能、成本与工艺复杂度,推动封装技术的多元化发展。
2025-05-13 22:14:31
850
原创 人形机器人主控芯片:NVIDIA Jetson Orin系列
NVIDIA Jetson Orin 家族是专为边缘 AI 和自动化机器设计的嵌入式计算平台,特别适合人形机器人、自动驾驶和工业自动化等高性能场景。它的 AI 性能高达 275 TOPS,显著提升了生成式 AI 和多模态推理能力。NVIDIA Jetson Orin 系列以其强大的 AI 算力、低功耗设计和丰富的软件生态,成为人形机器人主控芯片的领先选择。它在运动控制、感知融合和自主决策方面表现卓越,广泛应用于波士顿动力、优必选等厂商的机器人中。
2025-05-11 11:11:18
1065
原创 人形机器人:主控芯片
人形机器人主控芯片涵盖通用(NVIDIA Jetson、高通)、半定制(地平线征程)和全定制(特斯拉Dojo)类型。国际厂商偏向高性能AI芯片,中国厂商注重性价比和国产化。未来,定制化、低功耗芯片将主导市场。目前人形机器人领域的主控芯片因厂商和应用场景不同而有所差异,以下是一些主要人形机器人及其可能使用的主控芯片概况,基于公开信息和行业趋势。
2025-05-10 22:11:10
688
原创 分析AMD业绩突飞猛进的原因
AMD的崛起得益于技术突破(Zen架构+台积电代工)、战略聚焦(高性能计算+AI)、市场机遇(云计算+AI热潮)以及苏姿丰的卓越领导。其通过灵活的Fabless模式和高性价比产品,成功抢占了PC、服务器和AI市场的份额。英特尔的衰退则源于技术瓶颈(制程工艺落后)、战略失误(错失移动和AI市场)、高成本的IDM模式以及管理层的频繁动荡。其在传统市场的份额被AMD蚕食,同时未能有效进入新兴的AI GPU市场。展望未来,英特尔若能解决制程问题、优化代工业务并抓住AI PC机遇,仍有翻盘可能。
2025-05-10 15:37:08
738
原创 分析NVIDIA的股价和业绩暴涨的原因
技术领先:GPU与CUDA生态奠定了AI计算的领导地位。战略前瞻:从游戏到数据中心、汽车的多元化布局。市场风口:AI、云计算、HPC需求的爆发。财务稳健:高增长、高利润率与资本回报。外部助力:竞争格局与资本市场支持。展望未来,NVIDIA凭借Blackwell、Rubin等新架构及AI全栈生态,有望继续领跑,但需警惕竞争与地缘政治风险。其成功为芯片行业提供了宝贵经验:技术创新、生态构建与市场敏锐度是长期增长的关键。
2025-05-09 23:59:15
839
原创 FPGA:如何提高RTL编码能力?
打基础:理解RTL与硬件的映射关系,掌握组合/时序逻辑、状态机的标准编码。练分析:通过阅读优秀代码、对比综合报告,学习资源优化技巧。做项目:从模块级到系统级实践,积累工程经验(如时序收敛、跨时钟域处理)。坚持“编码-仿真-综合-上板”的闭环验证,逐步形成“写代码时能预判电路结构,看综合报告能反推代码问题”的能力,RTL编码水平会显著提升。
2025-05-09 23:38:49
1292
原创 存储器:DDR和独立显卡的GDDR有什么区别?
DDR:通用内存,延迟低,容量大,成本低,适合CPU系统内存。GDDR:图形专用内存,带宽高,延迟较高,适合GPU驱动的高吞吐量任务。
2025-05-08 23:38:45
640
原创 存储器:DDR和HBM的区别
DDR:适合通用计算,成本低,容量大,延迟低,但带宽受限。HBM:专为高带宽、低功耗设计,适合高性能计算和AI,成本高,容量有限。
2025-05-08 23:31:27
754
原创 AI大模型基础设施:NVIDIA GPU和AMD MI300系列的区别
英伟达优势:成熟的CUDA生态、高性能互连技术、市场主导地位;AMD优势:硬件参数领先、高性价比、灵活架构设计;关键挑战:AMD需加速完善ROCm生态,而英伟达需应对供应链压力与技术迭代风险。预测:短期内英伟达仍主导高端市场,但AMD凭借硬件创新和客户多元化,有望在2025年后逐步抢占20%-30%份额,尤其在性价比敏感领域。
2025-05-07 23:05:14
877
原创 计算机硬件(南桥):主板芯片组FCH和PCH的区别
在计算机主板设计中,(Fusion Controller Hub)和(Platform Controller Hub)分别是AMD和Intel对主板芯片组中“南桥”(Southbridge)部分的命名。尽管两者功能相似,但受不同厂商架构设计的影响,存在一些关键区别。
2025-05-07 22:46:54
1201
原创 计算机硬件:AMD X670E与B650主板的PCIe通道分配
X670E适合追求极致扩展性与多设备支持的高端用户,而B650则以性价比满足主流需求。选择时需结合具体主板型号的通道分配设计(参考官网规格),避免带宽冲突或性能损失。(两颗Promontory 21芯片),通过菊花链连接,总扩展能力更强。,仅一颗Promontory 21芯片,扩展能力有限。
2025-05-06 18:41:38
961
原创 CPU:为什么Ryzen 7000系列处理器PCIe通道总数是28,而可用的通道数是24?
Ryzen 7000系列处理器的28条PCIe通道中,24条直连高速设备,4条用于芯片组通信。用户“可用”的24条是直接可控的高性能通道,而芯片组的通道属于扩展资源,带宽和优先级较低,因此不计入用户直接可用的范畴。
2025-05-06 18:38:38
414
原创 高速接口:PCIe 3.0 Link Training的详细过程
PCIe链路训练(Link Training)是物理层自动协商链路参数的关键过程,确保两端设备(如根复合体和端点)能以最优速率和配置建立稳定连接。PCIe 3.0的链路训练在兼容前代协议的基础上,引入了更复杂的均衡(Equalization)机制以支持8.0 GT/s的高速率。若检测到有效接收器,双方以PCIe Gen1的默认速率2.5 GT/s启动通信。完成上述步骤后,链路进入L0状态,开始正常数据传输。若链路需要调整速率或宽度,会触发恢复(Recovery)状态重新训练。
2025-05-05 15:20:37
676
原创 高速互联技术:NVLink和PCIe有什么区别
NVLink是英伟达在高性能计算领域的核心技术,凭借带宽和延迟优势成为大规模AI训练的标配。而PCIe凭借通用性和低成本,仍是中小规模场景的主流选择。用户需根据模型规模、预算和扩展需求综合决策。
2025-05-05 15:01:13
826
原创 Python:AI大模型Transformer架构的CPU和GPU版本前向推理代码实现
Transformer是目前最常见的AI大语言模型架构,以下是Transformer架构的CPU和GPU版本前向推理代码实现,并且会会自动计算推理时间。比如,定义一个小型的Transformer模型,比如有12层,每层有12个注意力头,隐藏层维度为768,这样比较接近BERT-base的结构。GPU版本:模型在CUDA上,数据移动到CUDA,用CUDA事件或同步后的时间记录。CPU版本:模型在CPU上,输入数据在CPU,用time模块记录时间。确保代码正确,比如模型结构正确,张量尺寸正确,时间测量准确。
2025-05-04 15:22:37
489
原创 低速总线:IIC和SMBUS
I²C(Inter-Integrated Circuit)和SMBus(System Management Bus)是两种广泛应用于嵌入式系统的串行通信总线协议,主要用于连接低速外设。上拉电阻:SCL/SDA需外接上拉电阻(典型值:4.7kΩ~10kΩ,依总线电容调整)。传感器接口:温度传感器(如LM75)、加速度计(MPU6050)。地址帧:主设备发送从机地址 + 读写位(1位,0写/1读)。数据帧:每字节(8位)后跟随1位ACK/NACK确认信号。选I²C:简单外设、成本敏感、无需严格错误检测。
2025-05-04 14:53:06
775
原创 AI大模型基础设施:AMD的霄龙系列CPU
霄龙(EPYC)系列CPU是AMD专为服务器和数据中心市场设计的高性能处理器,以其卓越的计算能力、能效和安全性在行业中广受认可。总的来说,霄龙系列展示了AMD在CPU设计上的创新实力,为全球数据中心和企业提供了强大的计算支持。此外,霄龙支持**同时多线程(SMT)**技术,每个物理核心可运行两个线程,进一步提升并行处理能力,使其非常适合需要高并发的工作负载。,预计在性能和能效上进一步突破,特别是在AI和高性能计算领域。以及架构优化,霄龙在提供高性能的同时保持了出色的能效比,帮助数据中心降低。
2025-05-03 14:19:18
359
原创 AI大模型基础设施:为什么CUDA是NVIDIA最重要的护城河?
CUDA不仅是技术平台,更是英伟达构建的生态壁垒。技术领先:高效工具链与GPU架构的深度整合。生态锁定:广泛支持主流框架和庞大的开发者社区。市场惯性:高迁移成本和行业标准地位。持续创新:软硬件协同优化和先发优势。方面CUDA竞争方案(如ROCm、oneAPI)生态成熟度高度成熟,广泛采用较新,采用率低开发者支持社区庞大,资源丰富社区较小,文档有限硬件优化与英伟达GPU深度整合适配性较差,性能不足市场地位行业标准,网络效应强市场份额小,难以挑战。
2025-05-03 13:59:13
940
原创 CPU:AMD的线程撕裂者(Threadripper)和霄龙(EPYC)的区别
霄龙(EPYC)**虽然都是面向高性能市场的处理器,但它们在定位、功能和技术规格上有显著区别。AMD的**线程撕裂者(Threadripper)
2025-05-02 23:49:53
1249
原创 CPU:AMD的线程撕裂者(Threadripper)系列
AMD的线程撕裂者(Threadripper)系列是AMD面向高性能计算(HPC)、工作站(Workstation)和高端桌面(HEDT)市场推出的顶级处理器产品线。该系列以极高的核心数、强大的多线程性能、丰富的PCIe通道和内存支持著称,主要服务于专业创作者、工程师、科研人员以及极客发烧友。AMD线程撕裂者系列凭借超多核心、极致扩展性和专业级特性,成为高性能计算领域的标杆。从早期的HEDT市场扩展到工作站和服务器领域,该系列不断突破极限,满足专业用户的需求。
2025-05-02 23:47:12
1417
原创 FPGA:介绍几款高速ADC及其接口形式
推荐ADC芯片:AD9680、AD9684、ADC12DJ3200、AD9213,采样率均≥500Msps,适合高性能应用。接口形式:并行LVDS适合中速系统(<1Gsps),JESD204B适合超高速系统(>500Msps),CMOS较少使用。FPGA读取数据LVDS:使用ISERDES解串,FIFO缓存,状态机控制。JESD204B:配置IP核,处理SYSREF/SYNC,解析AXI-Stream数据。硬件设计需保证时钟质量、信号完整性和电源稳定性。
2025-05-02 15:18:20
1404
原创 AI大模型基础设施:主流的几款开源AI大语言模型的本地部署成本
DeepSeek R1(671B参数,MoE架构)特点:由中国DeepSeek公司开发,基于混合专家(MoE)架构,擅长逻辑推理、数学问题解决和实时决策。提供多个精炼版本(如1.5B、7B、14B、32B、70B),支持本地部署,MIT许可证允许商业使用。适用场景:数学推理、代码生成、复杂问题解决,适合研究和企业级应用。LLaMA 3.1(8B、70B、405B参数)特点:Meta AI开发的开源模型,以高效推理著称,仅限研究用途(非完全开源许可证)。405B模型性能媲美闭源模型如GPT-4。
2025-05-01 22:44:25
1451
原创 AI大模型基础设施:NVIDIA的用于AI大语言模型训练和推理的几款主流显卡
英伟达(NVIDIA)在AI大语言模型(LLM)的训练和推理领域占据主导地位,其GPU因强大的并行计算能力和专为深度学习优化的架构而广受青睐。以下介绍几款主流的NVIDIA GPU,适用于AI大语言模型的训练和推理,涵盖其关键特性和适用场景,并根据性能、显存、架构等进行简要分析。
2025-05-01 22:32:38
1213
原创 Verilog如何求解log以2为底N的对数?
,log_value=2(对应log₂(5)≈2.32向下取整)。• 向下取整:取最高有效位位置减1,如上述动态计算模块。根据具体场景选择最合适的方法,确保设计资源与时序的平衡。• 注意:若N=0,结果未定义,需确保N≥1。• 动态信号:用组合逻辑遍历位宽或优化编码器。• 适用场景:非精确计算,需要硬件资源优化。• 优点:简洁高效,综合工具自动优化。• 非2幂处理:明确需求选择取整方式。• 输出解释:若输入N=5(二进制。或预计算函数,适合地址宽度。• 静态参数:优先使用。
2025-04-30 11:49:38
310
原创 外部存储器接口:EMIF总线
作为嵌入式系统中的关键接口之一,EMIF(External Memory Interface,外部存储器接口) 是处理器与外部存储器或外设进行高速数据交换的核心总线。连接外部存储器:如SDRAM、SRAM、NOR Flash、NAND Flash等。存储器类型寄存器(MTYPE):定义接口模式(SDRAM/Async/SRAM)。多协议支持:支持同步(SDRAM)、异步(SRAM/Flash)等不同时序协议。灵活配置:可编程时序参数(建立时间、保持时间、等待周期等)。
2025-04-29 10:30:06
908
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人