GPGPU&CUDA&FPGA&ASIC&SOC
文章平均质量分 83
图形引擎,GPU开发,异构计算,GPGPU&CUDA&FPGA&ASIC&SOC
普通网友
这个作者很懒,什么都没留下…
展开
-
云计算-存算一体-EDA-技术杂谈
云计算-存算一体-EDA-技术杂谈原创 2022-08-06 06:18:30 · 958 阅读 · 0 评论 -
GPU-CUDA-图形渲染分析
GPU-CUDA-图形渲染分析原创 2022-08-05 05:42:11 · 2122 阅读 · 0 评论 -
汽车与芯片算力杂谈
汽车与芯片算力杂谈原创 2022-07-05 05:50:51 · 1194 阅读 · 0 评论 -
半导体动态杂谈
半导体动态杂谈原创 2022-06-30 07:31:44 · 600 阅读 · 0 评论 -
小芯片chiplet技术杂谈
小芯片chiplet技术杂谈原创 2022-06-27 11:27:00 · 961 阅读 · 0 评论 -
CPU与chiplet技术杂谈
CPU与chiplet技术杂谈中央处理器(central processing unit,简称CPU)作为计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元。CPU自产生以来,在逻辑结构、运行效率以及功能外延上取得了巨大发展。CPU出现于大规模集成电路时代,处理器架构设计的迭代更新以及集成电路工艺的不断提升促使其不断发展完善。从最初专用于数学计算到广泛应用于通用计算,从4位到8位、16位、32位处理器,最后到64位处理器,从各厂商互不兼容到不同指令集架构规范的出现,CPU 自诞生以来一直在飞原创 2022-06-27 05:57:33 · 407 阅读 · 0 评论 -
AI芯片技术-2022年
AI芯片技术-2022年原创 2022-06-23 05:56:33 · 1140 阅读 · 0 评论 -
CPU与RISC-V ISA架构
CPU与RISC-V ISA架构原创 2022-06-19 05:36:20 · 651 阅读 · 0 评论 -
EDA技术杂谈
EDA技术杂谈原创 2022-06-16 05:45:20 · 494 阅读 · 0 评论 -
计算机视觉几个应用
计算机视觉几个应用原创 2022-06-14 07:10:18 · 414 阅读 · 1 评论 -
汽车SoC芯片IP供应商
汽车SoC芯片IP供应商原创 2022-06-04 07:25:26 · 770 阅读 · 0 评论 -
CUDA开发流程解析
CUDA开发流程解析原创 2022-06-03 07:16:59 · 1395 阅读 · 0 评论 -
TPU原理技术与xPU
TPU原理技术与xPU原创 2022-06-01 08:34:53 · 2185 阅读 · 0 评论 -
CUDA技术体系分析
CUDA技术体系分析原创 2022-05-31 06:18:01 · 506 阅读 · 0 评论 -
GPU与cuda技术协调
GPU与cuda技术协调原创 2022-05-30 06:16:04 · 441 阅读 · 0 评论 -
CUDA架构与应用杂谈
CUDA架构与应用杂谈原创 2022-05-29 06:35:55 · 820 阅读 · 0 评论 -
云计算服务器技术概述
云计算服务器技术概述概述云主机也叫云服务器ECS (Elastic Compute Server),是一种按需获取的云端服务器,提供高可靠、弹性扩展的计算资源服务,可以根据需求选择不同规格的CPU、内存、操作系统、硬盘和网络来创建云主机,满足个性化业务需求。云主机从订购到开通使用仅需数分钟时间,助快速灵活地构建企业应用。本文参考文献链接https://mp.weixin.qq.com/s/V3w6KA2u829DPY70_2Yd_ghttps://ecloud.10086.cn/home/solu原创 2022-04-15 05:37:48 · 831 阅读 · 0 评论 -
CPU技术演进方向
CPU技术演进方向中央处理器(CPU),是电子计算机的主要设备之一,电脑中的核心配件。其功能主要是解释计算机指令以及处理计算机软件中的数据。CPU是计算机中负责读取指令,对指令译码并执行指令的核心部件。中央处理器主要包括两个部分,即控制器、运算器,包括高速缓冲存储器及实现联系的数据、控制的总线。电子计算机三大核心部件就是CPU、内部存储器、输入/输出设备。中央处理器的功效主要为处理指令、执行操作、控制时间、处理数据。在计算机体系结构中,CPU 是对计算机的所有硬件资源(如存储器、输入输出单元) 进行控制原创 2022-04-14 06:39:19 · 602 阅读 · 0 评论 -
半导体技术基础
半导体技术基础AI的许多数据处理涉及矩阵乘法和加法。大量并行工作的GPU提供了一种廉价的方法,但缺点是更高的功率。具有内置DSP模块和本地存储器的FPGA更节能,但它们通常更昂贵。AI芯片该使用什么方法原理去实现,仍然众说纷纭,这是新技术的特点,探索阶段百花齐放,这也与深度学习等算法模型的研发并未成熟有关,即AI的基础理论方面仍然存在很大空白。这是指导芯片如何设计的基本前提。因此,集中在如何更好的适应已有的数据流式处理模式进行的芯片优化设计。原创 2022-04-13 06:55:29 · 3296 阅读 · 1 评论 -
OpenCL与Cuda技术
OpenCL与Cuda技术CUDA只针对NVIDIA的GPGPU,OpenCL是并行运算的通用接口。想用CUDA就必须有NVIDIA的显卡或者计算卡。OpenCL对应的设备更广泛,CPU、显卡、FPGA、DSP等等都可能可以用OpenCL开发。但是在显卡领域OpenCL表现并不好。显卡厂商并没在OpenCL上进行很大的投入,导致在基于显卡的高性能运算领域OpenCL并不好用。CUDA和OpenCL的芯片结构类似,都是按等级划分的,并逐渐提高等级。然而OpenCL更具通用性并使用更加一般的技术,如Ope原创 2022-04-11 05:32:48 · 2720 阅读 · 0 评论 -
GPU架构与桌面级图形显卡
GPU架构与桌面级图形显卡GPU芯片 设计为主的集成电路高科技公司。致力于创新面向元计算应用的新一代GPU,构建融合视觉计算、3D图形计算、科学计算及人工智能计算的综合计算平台,建立基于云原生GPU计算的生态系统,助力驱动数字经济发展。注于研发设计国产全功能GPU芯片及相关产品,构建面向数据中心、边缘计算、高性能PC及工作站的计算加速平台,为中国科技生态合作伙伴提供强大的计算加速能力。本文参考链接https://www.mthreads.com/news重磅发布第一代MUSA架构GPU,以元计算赋原创 2022-03-31 14:32:40 · 8994 阅读 · 0 评论 -
英伟达GPU造物?从原子开始3D模拟活细胞
英伟达GPU造物?从原子开始3D模拟活细胞【新智元导读】在计算机里以原子级模拟一个活细胞需要多少个「肝」?最近有研究人员创造了一个完整的支原体细胞,还是活的!能够在电脑上模拟全部的物理、化学性质,整个模拟时间不到20分钟!从原子级开始,亲手创造一个细胞是什么体验?最近,来自伊利诺伊大学厄巴纳·香槟分校(University of Illinois at Urbana-Champaign)的研究人员成功在原子粒度上模拟了一个最小的活细胞(living minimal cell),使用到的加速设备为Nv原创 2022-02-06 08:52:46 · 5876 阅读 · 6 评论 -
光刻机技术创新
光刻机技术创新光刻机是芯片制造的关键工艺,光刻机的生产技术由荷兰ASML 、日本的尼康和佳能公司垄断。在“缺芯”之势蔓延、美国推动半导体产业链回流的背景下,国产光刻机的真实水平是什么样的?光刻机的全球产业链格局光刻技术是使微电子和纳米电子器件在过去半个世纪中不断微缩的基础技术之一,光刻制造是晶圆制造最关键、最复杂和时间占比最高的环节。全球光刻机已由荷兰ASML、日本尼康和佳能公司完全垄断。据芯思想研究院(ChipInsights)数据,2020年上述三家公司半导体用光刻机出货413台,较2019年的原创 2022-01-31 11:28:53 · 3722 阅读 · 0 评论 -
芯片面积与算力
芯片面积与算力芯片面积的估算IO neck 和 core neck 一般称作 IO limited 和 core limited,IO limited :这个芯片的面积是因为IO个数限制(太多),而不得不做得那么大。core部分其实用不了那么大。这时面积计算就简化为每边IO个数的计算了。Core limited:芯片面积是有core部分的决定的,IO没有那么多在Core limited情况下,die size的估算如下:芯片面积 = core面积+ power ring面积 +PAD ring原创 2022-01-30 06:12:51 · 6074 阅读 · 1 评论 -
亚马逊云科技造芯
亚马逊云科技造芯二十五年前,亚马逊是一个卖书的公司;十五年前,亚马逊是一个电商公司。云计算公司事实上,从2006年开始,亚马逊就开始考虑在云计算领域的战略布局了,成立了亚马逊云科技AWS。通过十几年的发展,这部分业务已经成为了驱动亚马逊下一个阶段发展的最重要的力量。这里的驱动有两个方面的含义,一个是财务方面,另外一个是技术方面。亚马逊在过去的很长一段时间里都是持续亏损的,但在2000年之后就开始慢慢的扭亏为盈。这里面很重要的原因,就是高附加值高利润的云计算的逐渐兴起。经过将近20年的发展,202原创 2022-01-28 06:15:10 · 799 阅读 · 0 评论 -
晶体管逻辑芯片设计微缩图形化
晶体管逻辑芯片设计微缩图形化伴随着晶体管大小不断逼近原子的物理体积极限,传统摩尔定律下的2D微缩技术不再能同时改善芯片的性能、功率、面积成本和上市时间(即:PPACt),晶体管设计、互连微缩、图形化和设计技术协同优化(DTCO)成为横亘在逻辑微缩道路上的三座大山。逻辑芯片,电子产品中主要的处理引擎,功耗和性能对其至关重要。本文围绕晶体管设计、互连微缩以及图形化和设计技术协同化等方面进行了系统分析。逻辑芯片,电子产品中主要的处理引擎,功耗和性能对其至关重要。以苹果A14芯片为例,这颗采用5nm节点工艺制原创 2022-01-27 06:01:15 · 709 阅读 · 0 评论 -
功率半导体介绍
功率半导体介绍“半导体”,指同时具有容易导电的“导体”和不导电的“绝缘体”两方面特性的物质。能够将交流电转为直流电——“整流”、增大电信号——“增幅”、导通或者阻断电——“开关”等。功率半导体是能够支持高电压、大电流的半导体。具有不同于一般半导体的结构,在使用高电压、大电流时也不会损坏。另外,由于使用大功率容易发热产生高温,成为故障发生的原因。 因此,正努力减少功率半导体本身因发热而导致的功率损失,有效地将其产生的热量释放到外部。功率半导体主要用于改变电压和频率;或将直流转换为交流,交流转换为直流原创 2022-01-26 05:59:26 · 1577 阅读 · 0 评论 -
CPU三级缓存技术解析
CPU三级缓存技术解析cpu存取数据cpu存取数据大致可以认为是下图的流程(此处图比较简单)cpu拿到需要的内存地址,之后这个地址会被mmu转换成真正的物理地址,接下来会去查接下来查L1 cache,L1 cache不命中查L2 cache,L2 cache不命中查L3 cache,L3 cache不能命中查内存。其实现在查到内存还算完,现在有了虚拟内存,内存其实也是一层cache,是磁盘的cache,也就是说查内存也有可能不会命中,因为内存中的数据可能被虚拟内存系统放到磁盘中了,如果内存也不能命原创 2022-01-25 06:02:23 · 2743 阅读 · 0 评论 -
电子产品解决方案
电子产品解决方案移动电源行车记录仪路灯控制器BL6810系列单灯控制器是是路灯控制系统及商业照明系统的重要组成部分,核心芯片是采用自主研发的PLC载波通信模块,产品具有功能强大,易实施,免布线,工作可靠,易于维护等特点,专门用于路灯控制及商业照明而研发的节能产品。智能电表机顶盒完整的电源、音频、智能卡接口、MOSFET和LNB供电解决方案平板电脑高性价比DC-DC、LDO的电源解决方案参考链接:https://www.belling.com.cn/...原创 2022-01-24 05:23:39 · 141 阅读 · 0 评论 -
AI芯片设计流程
AI芯片设计流程对于消费者,一个可以使用的系统,有数字集成电路部分、模拟集成电路部分、系统软件及上层应用部分。关于各个部分的功能,借用IC 咖啡胡总的精品图可以一目了然。外部世界是一个模拟世界,故所有需要与外部世界接口的部分都需要模拟集成电路,模拟集成电路将采集到的外部信息转化成0/1 交给数字集成电路运算处理,再将数字集成电路运算处理完的信号转化成模拟信号输出;这一切的运算过程都是在系统软件的号令跟监控下完成的。芯片是骨架,系统软件是灵魂。数字集成电路设计实现流程是个相当漫长的过程,拿手机基带芯片原创 2022-01-23 05:52:01 · 794 阅读 · 0 评论 -
NVIDIA DPU架构
NVIDIA DPU架构本内容来自《2021中国DPU行业发展白皮书》,内容共分4章:包括智能网卡的简介及趋势分析、DPU的简介及分析、DPU产业分析及NVIDIA的DPU前景展望等。NVIDIA的BlueField DPU产品发展路线图如图所示,包括了已有的二代产品BlueField-2,目前即将面世的首款达400Gb/s速度的BlueField-3 DPU,以及未来整合了NVIDIA GPU功能,可达800Gb/s的BlueField-4 DPU。现代超大规模云技术推动数据中心走向了新的架构,利用原创 2022-01-21 05:52:20 · 1770 阅读 · 0 评论 -
数据并行与模型并行
数据并行与模型并行为了加快模型的训练,可以使用分布式计算的思路,把这个大批次分割为很多小批次,使用多个节点进行计算,在每个节点上计算一个小批次,对若干个节点的梯度进行汇总后再加权平均,最终求和就得到了最终的大批次的梯度结果。在上面这个公式中:w是模型的参数; 是采用batch_size = n计算得到的真实梯度。这个公式想要证明的是,可以在不同的节点上分别对n的一部分进行梯度的计算,将各个GPU的梯度进行汇总后的加权平均值。公式中最后一行中,在第k个节点有个数据, 是该节点上计算得到梯度。原创 2021-06-15 06:02:15 · 1127 阅读 · 1 评论