系统架构
文章平均质量分 81
系统架构
普通网友
这个作者很懒,什么都没留下…
展开
-
关于存算一体芯片技术
关于存算一体芯片技术原创 2022-07-12 05:34:47 · 1599 阅读 · 0 评论 -
Kubernetes技术分析
Kubernetes技术分析原创 2022-07-09 05:55:07 · 439 阅读 · 0 评论 -
Mobileye转变与芯片技术
Mobileye转变与芯片技术原创 2022-07-08 05:07:26 · 1307 阅读 · 0 评论 -
2022年由电子科技到整体科技
2022年由电子科技到整体科技原创 2022-05-24 07:09:06 · 1757 阅读 · 0 评论 -
EDA技术与市场分析
EDA技术与市场分析原创 2022-05-14 06:51:20 · 1675 阅读 · 0 评论 -
GPU技术与动态
GPU技术与动态图形处理器(英语:graphics processing unit,缩写:GPU),又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。GPU使显卡减少了对CPU的依赖,并进行部分原本CPU的工作,尤其是在3D图形处理时GPU所采用的核心技术有硬件T&L(几何转换和光照处理)、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等,而硬件T&L技原创 2022-05-07 06:40:34 · 798 阅读 · 0 评论 -
汽车域控制器技术
汽车域控制器技术域控制器是指在“域”模式下,至少有一台服务器负责每一台联入网络的电脑和用户的验证工作,相当于一个单位的门卫一样,称为“域控制器(Domain Controller,简写为DC)”。域控制器( Domain controller,DC)是活动目录的存储位置,安装了活动目录的计算机称为域控制器。在第一次安装活动目录时,安装活动目录的那台计算机就成为域控制器,简称“域控”。域控制器存储着目录数据并管理用户域的交互关系,其中包括用户登录过程、身份验证和目录搜索等。一个域可以有多个域控制器。为了获原创 2022-04-23 06:24:52 · 4889 阅读 · 0 评论 -
服务器技术基础
服务器技术基础服务器是计算机的一种,比普通计算机运行更快、负载更高、价格更贵。服务器在网络中为其它客户机(如PC机、智能手机、ATM等终端甚至是火车系统等大型设备)提供计算或者应用服务。服务器具有高速的CPU运算能力、长时间的可靠运行、强大的I/O外部数据吞吐能力以及更好的扩展性。根据服务器所提供的服务,服务器都具备承担响应服务请求、承担服务、保障服务的能力。服务器作为电子设备,其内部的结构十分的复杂,但与普通的计算机内部结构相差不大,如:cpu、硬盘、内存,系统、系统总线等。云主机叫云服务器ECS原创 2022-04-09 05:51:30 · 616 阅读 · 0 评论 -
边缘计算架构分析
边缘计算架构分析2021云计算十大关键词分别是:云原生、高性能、混沌工程、混合云、边缘计算、零信任、优化治理、数字政府、低碳云、企业数字化转型。本文主要参考了以下文章https://mp.weixin.qq.com/s/sULsk-JNNaLPa9NG69fb3whttps://mp.weixin.qq.com/s/LaqElDQjmr0xpZ7S9sNxwAhttps://mp.weixin.qq.com/s/Jcy_zv4xI7giktRpA4y3-A1云原生:云计算架构正在以云原生为技术原创 2022-04-04 06:00:10 · 3486 阅读 · 0 评论 -
低代码技术与市场(Mendix与 OutSystems)
低代码技术与市场(Mendix与 OutSystems)本文主要参考文章参考链接https://mp.weixin.qq.com/s/OXCBORheAx99o3fS-ZfUdghttps://blog.csdn.net/qq_38352351/article/details/110160054低代码分析低代码和无代码(称零代码)是什么关系、怎么判断一个低代码平台是否专业、国内是否有专业的低代码平台、低代码是不是新瓶装旧酒、低代码真的搞不定专业的企业应用吗、低代码不适合开发哪些应用、低代码并非银原创 2022-04-02 06:49:41 · 1626 阅读 · 0 评论 -
EDA电子设计技术与应用
EDA电子设计技术与应用电子设计自动化(英语:Electronic design automation,缩写:EDA)是指利用计算机辅助设计(CAD)软件,来完成超大规模集成电路(VLSI)芯片的功能设计、综合、验证、物理设计(包括布局、布线、版图、设计规则检查等)等流程的设计方式。EDA被誉为“芯片之母”,是电子设计的基石产业。拥有百亿美金的EDA市场构筑了整个电子产业的根基,可以说“谁掌握了EDA,谁就有了芯片领域的主导权。”在多个领域面临关键核心技术“卡脖子”的危机,对芯片技术领域的制约尤为严重原创 2022-03-11 05:51:59 · 1297 阅读 · 0 评论 -
计算机网络知识结构
计算机网络知识结构计算机网络也称计算机通信网。关于计算机网络的最简单定义是:一些相互连接的、以共享资源为目的的、自治的计算机的集合。若按此定义,则早期的面向终端的网络都不能算是计算机网络,而只能称为联机系统(因为那时的许多终端不能算是自治的计算机)。但随着硬件价格的下降,许多终端都具有一定的智能,因而“终端”和“自治的计算机”逐渐失去了严格的界限。若用微型计算机作为终端使用,按上述定义,则早期的那种面向终端的网络也可称为计算机网络。另外,从逻辑功能上看,计算机网络是以传输信息为基础目的,用通信线路将多个原创 2022-03-03 05:56:41 · 969 阅读 · 0 评论 -
计算机与计算机网络
计算机与计算机网络计算机行业框架回顾(2021)计算机行业下游遍布各个行业,包括金融、电力、 采掘、钢铁、医疗、电信、机械、汽车等各个方面,下游行业分散程度大,行业共性弱;下游客户群体则包括政府、企业和个人,范围广。由于计算机行业不同企业面对的下游行业各不相同,各行业信息化建设的进程和预算投入都会对计算机行业构成影响,从而对企业的发展造成影响。网络安全由于产业互联网发展,云计算、物联网技术的进步带来数据储存安全的问题。根据Gartner,2019年我国信息安全支出占总IT支出不到1%,国外占比约为原创 2022-02-28 06:10:34 · 676 阅读 · 0 评论 -
吉利蔚来造手机,小米造车
吉利蔚来造手机,小米造车北京时间2022年2月22日星期二,在网络上被认为是百年来最“2”的日子,又一家车企被爆出涉足手机业务,就是中国造车新势力领头羊的蔚来,招来了原美图手机总裁尹水军负责。这是继吉利正式宣布投资百亿造手机,报道称正在洽谈并购老牌手机厂商魅族后,又一家车企被爆出要涉足手机领域。实际上,全球造车新势力总龙头的特斯拉,曾被报道称要做手机,但迄今尚未正式推出。最近几年,手机厂商在遭遇行业天花板后,纷纷跨界涉足汽车领域,包括了2019年4月首次参加国际A级车展的华为、2021年3月正式宣布造原创 2022-02-23 06:01:08 · 2148 阅读 · 0 评论 -
芯片设计IP重用与集成
芯片设计IP重用与集成半导体芯片在汽车、人工智能(AI)、数据处理、智能终端等领域需求旺盛,半导体产业发展不断提速。半导体芯片变得更小、更快、更强大,灵活性和功能大幅提高。但随着设计变得越来越复杂,对验证能力和下一代验证技术的需求也在增加,功能安全合规性也变得越来越重要。本文围绕合规性与合规管理、嵌入式系统与IP集成、芯片设计中的挑战以及芯片设计工具等方面进行了系统的分析。半导体芯片在汽车、人工智能(AI)、数据处理、智能终端等领域需求旺盛,半导体产业发展不断提速,预计到2030年将飙升到8085亿美原创 2022-02-18 06:05:08 · 577 阅读 · 0 评论 -
光刻机与芯片制造竞争
光刻机与芯片制造竞争新一轮EUV光刻机争夺战开打在全球范围内,作为EUV光刻机的唯一供应商,ASML在业内受到的关注度越来越高,特别是以台积电为代表的先进制程发展得风生水起的当下,ASML的重要性与日俱增。ASML发布了2021第四季度和全年财报,内容是一如既往的亮眼。该公司2021年第四季度营收为50亿欧元,净利润为18亿欧元,毛利率54.2%,新增订单金额71亿欧元,其中,26亿欧元来自0.33 NA(数值孔径)和0.55 NA EUV系统订单;2021年全年营收达186亿欧元,其中,63亿欧元来原创 2022-02-16 06:08:37 · 649 阅读 · 0 评论 -
光刻机技术创新
光刻机技术创新光刻机是芯片制造的关键工艺,光刻机的生产技术由荷兰ASML 、日本的尼康和佳能公司垄断。在“缺芯”之势蔓延、美国推动半导体产业链回流的背景下,国产光刻机的真实水平是什么样的?光刻机的全球产业链格局光刻技术是使微电子和纳米电子器件在过去半个世纪中不断微缩的基础技术之一,光刻制造是晶圆制造最关键、最复杂和时间占比最高的环节。全球光刻机已由荷兰ASML、日本尼康和佳能公司完全垄断。据芯思想研究院(ChipInsights)数据,2020年上述三家公司半导体用光刻机出货413台,较2019年的原创 2022-01-31 11:28:53 · 3722 阅读 · 0 评论 -
芯片面积与算力
芯片面积与算力芯片面积的估算IO neck 和 core neck 一般称作 IO limited 和 core limited,IO limited :这个芯片的面积是因为IO个数限制(太多),而不得不做得那么大。core部分其实用不了那么大。这时面积计算就简化为每边IO个数的计算了。Core limited:芯片面积是有core部分的决定的,IO没有那么多在Core limited情况下,die size的估算如下:芯片面积 = core面积+ power ring面积 +PAD ring原创 2022-01-30 06:12:51 · 6074 阅读 · 1 评论 -
量子力学历史与理论
量子力学历史与理论提到量子力学,很多人的第一反应是微观、不连续、不确定,然后就是玄乎、奇怪、诡异,乃至恐怖。有这样的想法并不奇怪,毕竟,它跟经典物理的确不太一样,大家也乐于相信玻尔说的:“如果谁不为量子力学感到困惑,他就还没理解它。”许多文章、视频也喜欢把量子力学往这个方向上引,大肆宣扬“看一眼”决定猫的生死,告诉你双缝实验有多“恐怖”,把意识和量子力学扯在一起等等。于是,量子力学在大众眼里就越来越玄乎,越来越诡异,越来越恐怖了。其实,量子力学并不奇怪,你觉得它奇怪,主要是因为你老是从经典力学的视原创 2022-01-29 06:31:47 · 2088 阅读 · 2 评论 -
亚马逊云科技造芯
亚马逊云科技造芯二十五年前,亚马逊是一个卖书的公司;十五年前,亚马逊是一个电商公司。云计算公司事实上,从2006年开始,亚马逊就开始考虑在云计算领域的战略布局了,成立了亚马逊云科技AWS。通过十几年的发展,这部分业务已经成为了驱动亚马逊下一个阶段发展的最重要的力量。这里的驱动有两个方面的含义,一个是财务方面,另外一个是技术方面。亚马逊在过去的很长一段时间里都是持续亏损的,但在2000年之后就开始慢慢的扭亏为盈。这里面很重要的原因,就是高附加值高利润的云计算的逐渐兴起。经过将近20年的发展,202原创 2022-01-28 06:15:10 · 799 阅读 · 0 评论 -
晶体管逻辑芯片设计微缩图形化
晶体管逻辑芯片设计微缩图形化伴随着晶体管大小不断逼近原子的物理体积极限,传统摩尔定律下的2D微缩技术不再能同时改善芯片的性能、功率、面积成本和上市时间(即:PPACt),晶体管设计、互连微缩、图形化和设计技术协同优化(DTCO)成为横亘在逻辑微缩道路上的三座大山。逻辑芯片,电子产品中主要的处理引擎,功耗和性能对其至关重要。本文围绕晶体管设计、互连微缩以及图形化和设计技术协同化等方面进行了系统分析。逻辑芯片,电子产品中主要的处理引擎,功耗和性能对其至关重要。以苹果A14芯片为例,这颗采用5nm节点工艺制原创 2022-01-27 06:01:15 · 709 阅读 · 0 评论 -
功率半导体介绍
功率半导体介绍“半导体”,指同时具有容易导电的“导体”和不导电的“绝缘体”两方面特性的物质。能够将交流电转为直流电——“整流”、增大电信号——“增幅”、导通或者阻断电——“开关”等。功率半导体是能够支持高电压、大电流的半导体。具有不同于一般半导体的结构,在使用高电压、大电流时也不会损坏。另外,由于使用大功率容易发热产生高温,成为故障发生的原因。 因此,正努力减少功率半导体本身因发热而导致的功率损失,有效地将其产生的热量释放到外部。功率半导体主要用于改变电压和频率;或将直流转换为交流,交流转换为直流原创 2022-01-26 05:59:26 · 1577 阅读 · 0 评论 -
CPU三级缓存技术解析
CPU三级缓存技术解析cpu存取数据cpu存取数据大致可以认为是下图的流程(此处图比较简单)cpu拿到需要的内存地址,之后这个地址会被mmu转换成真正的物理地址,接下来会去查接下来查L1 cache,L1 cache不命中查L2 cache,L2 cache不命中查L3 cache,L3 cache不能命中查内存。其实现在查到内存还算完,现在有了虚拟内存,内存其实也是一层cache,是磁盘的cache,也就是说查内存也有可能不会命中,因为内存中的数据可能被虚拟内存系统放到磁盘中了,如果内存也不能命原创 2022-01-25 06:02:23 · 2743 阅读 · 0 评论 -
电子产品解决方案
电子产品解决方案移动电源行车记录仪路灯控制器BL6810系列单灯控制器是是路灯控制系统及商业照明系统的重要组成部分,核心芯片是采用自主研发的PLC载波通信模块,产品具有功能强大,易实施,免布线,工作可靠,易于维护等特点,专门用于路灯控制及商业照明而研发的节能产品。智能电表机顶盒完整的电源、音频、智能卡接口、MOSFET和LNB供电解决方案平板电脑高性价比DC-DC、LDO的电源解决方案参考链接:https://www.belling.com.cn/...原创 2022-01-24 05:23:39 · 141 阅读 · 0 评论 -
AI芯片设计流程
AI芯片设计流程对于消费者,一个可以使用的系统,有数字集成电路部分、模拟集成电路部分、系统软件及上层应用部分。关于各个部分的功能,借用IC 咖啡胡总的精品图可以一目了然。外部世界是一个模拟世界,故所有需要与外部世界接口的部分都需要模拟集成电路,模拟集成电路将采集到的外部信息转化成0/1 交给数字集成电路运算处理,再将数字集成电路运算处理完的信号转化成模拟信号输出;这一切的运算过程都是在系统软件的号令跟监控下完成的。芯片是骨架,系统软件是灵魂。数字集成电路设计实现流程是个相当漫长的过程,拿手机基带芯片原创 2022-01-23 05:52:01 · 794 阅读 · 0 评论 -
NVIDIA DPU架构
NVIDIA DPU架构本内容来自《2021中国DPU行业发展白皮书》,内容共分4章:包括智能网卡的简介及趋势分析、DPU的简介及分析、DPU产业分析及NVIDIA的DPU前景展望等。NVIDIA的BlueField DPU产品发展路线图如图所示,包括了已有的二代产品BlueField-2,目前即将面世的首款达400Gb/s速度的BlueField-3 DPU,以及未来整合了NVIDIA GPU功能,可达800Gb/s的BlueField-4 DPU。现代超大规模云技术推动数据中心走向了新的架构,利用原创 2022-01-21 05:52:20 · 1770 阅读 · 0 评论 -
自研CPU架构与品牌
自研CPU架构与品牌国产 CPU 厂商得到了相应指令集的架构授权,发展成为6大主流厂商:龙芯、飞腾、鲲鹏、海光、申威、兆芯。CPU 的指令集分为复杂指令集(CISC)和精简指令集(RISC)两大类。复杂指令集以x86架构为代表,精简指令集则包括 ARM、MIPS、Alpha、Power 等。6 大主流 CPU 厂商的技术路线和生态建设各有优势。目前在通用计算领域,优势较强的是龙芯、飞腾、鲲鹏、海光这 4 大厂商,将进行重点介绍。龙芯技术源于中科院计算产业,沿着市场化的道路不断发展,已有超过 20原创 2022-01-19 06:04:51 · 975 阅读 · 0 评论 -
ADAS技术市场总结展望(2021年-2022年)
ADAS技术市场总结展望(2021年-2022年)NV AGX 和TI的TDA4平台哪个好?作为自动驾驶的平台,NV好像用的人比较多,但TI的TDA4看起来也是不错的东西,有高手能够做个对比分析么?从CPU架构及主频来看,TDA4 介于 NV AGX的 Xavier 及 Orin 之间;但算力肯定比不上精于GPU的英伟达,毕竟 TI 是比较擅长的是 DSP 领域。再从社区及厂商采用度来看,NV AGX明显要占优势。国内的三大新能源企业都用的是NV AGX:小鹏P7(Xavier),理想 One (原创 2022-01-18 06:31:56 · 7705 阅读 · 2 评论 -
边缘网联与5G等服务器
边缘网联与5G等服务器服务器作为计算的基础资源,解决的核心问题就是数据的处理、存储和计算。因此,随着联网数据量的增加,计算场景的复杂,对服务器的需求量和需求点,也将发生变化。回顾全球服务器的历史增长情况,会看到,过去几年(2017-2018)服务器需求增长的核心驱动因素,来自于全球云计算的快速发展。这也是新的计算场景对服务器需求拉动的体现。不同的计算场景对服务器的需求点也会发生变化。在这个过程中,服务器市场的竞争格局也随之发生变化(比如,云计算场景下,标准化服务器厂商的份额有所下降,定制化开发的云服务原创 2022-01-17 05:05:41 · 321 阅读 · 0 评论 -
自动驾驶参数分析
自动驾驶参数分析实现更高级别的自动驾驶能力,主要取决于智能驾驶模块的三个重要环节:环境感知—计算决策—控制执行,分别对应于人的“眼睛-大脑-神经”。后两者暂且按下不表,只单论市面上几种主流的视觉识别方案,行业的分歧在于——摄像头,毫米波雷达,超声波雷达,激光雷达。摄像头,毫米波雷达,超声波雷达,激光雷达,作为目前自动驾驶领域最为常用的4种自动驾驶传感器方案,其在探测距离、分辨率、角分辨率等探测参数各异,对应于物体探测能力、识别分类能力、三维建模、抗恶劣天气等特性各有优劣。值得注意的是,这四种传感器方案具原创 2021-12-22 05:43:58 · 656 阅读 · 0 评论 -
Tesla Model汽车架构与FSD供应链
Tesla Model汽车架构与FSD供应链特斯拉Model 3和Model Y平台架构特斯拉model Y和Model 3 怎么做平台架构。 通过特斯拉透露的信息,Model 3 和 model Y 将近有76%的零件共用,看看机械架构平台。车身以及底盘信息轴距:Model Y的轴距(下图L101)比Model 3长1.5厘米,一般人的大拇指指甲的宽度为1.5厘米,大拇指指甲宽度差不多,是不是工程师为了表现差值写的一个数? 前悬后悬:Model Y 前后悬(L105,L107)比Mode原创 2021-10-25 06:25:14 · 840 阅读 · 0 评论 -
GPU显卡架构
GPU显卡架构GPU架构“征途之旅”即日起航如果成为一个资深DIY玩家,想与众多DIY高手“高谈阔论”GPU架构设计,先必须弄明白显卡GPU架构设计的基本思想和基本原理,读懂GPU架构图正是这万里长征的第一步。GPU显卡架构图分析如下问题:一、顶点、像素、着色器是什么;二、SIMD与MIMD的架构区别;三、A/N在统一渲染架构革新中的三次交锋情况如何;四、为什么提出并行架构设计;五、A/N两家在GPU架构设计的特点及异同点是什么。非统一架构时代的GPU架构组件上世纪的绝大多数显示原创 2021-10-21 06:34:36 · 1481 阅读 · 0 评论 -
华为公有云架构解决方案
华为公有云架构解决方案华为公有云架构华为公有云的主要服务如弹性云服务器(ECS)、弹性伸缩服务(AS)、云硬盘(EVS)、云硬盘备份(VBS)、对象存储服务(OBS) 、虚拟私有云(VPC)、弹性负载均衡(ELB)、Anti-DDOS流量清洗、云数据库(RDS)、IAM统一身份认证、云监控服务(CES)、EI、API等云服务产品。一、 公有云服务架构1、公有云全堆栈解决方案使能数字化转型2、华为公有云架构3、高可用的资源架构模型二、 公有云服务的主要服务产品1、华为云标准产品体系原创 2021-10-20 06:27:04 · 1014 阅读 · 0 评论 -
云服务与设备供应商
云服务与设备供应商云服务提供商正在摆脱硬件提供商云服务提供商通过购买基础架构将其群集,以软件的形式向用户提供服务,软件是云服务提供商的自然优势。随着云计算变得越来越成熟,云服务提供商逐渐转向硬件研发。自云计算兴起以来的十多年中,云服务提供商一直在寻找OEM、ODM来购买服务器、存储、网络设备,然后将资源集中起来,向用户提供基础设施、平台或软件形式,通常称为IaaS(基础设施即服务)、PaaS(平台即服务)和SaaS(软件即服务)。简化用户对这些资源的部署和使用,节省成本,对云计算的需求正在增加。选择原创 2021-10-19 06:17:55 · 6852 阅读 · 0 评论 -
硬件专业化和软件映射的敏捷框架
硬件专业化和软件映射的敏捷框架概述随着摩尔定律接近尾声,设计专用硬件及将应用程序映射到专用硬件的软件,都是很有前途的解决方案。硬件设计决定了峰值性能,软件也很重要,决定了实际性能。硬件/软件(HW/SW)协同优化硬件加速和软件映射,提高整体性能。当前的流程将硬件和软件设计隔离。由于编程层次低,设计空间大,硬件和软件都难以设计和优化。将介绍AHS,一个用于张量应用程序的硬件专业化和软件映射的敏捷框架。对于使用高级语言描述的张量应用程序,AHS可以自动定义硬件和软件间的接口,协同导航巨大的设计空间,自动原创 2021-10-19 05:06:38 · 480 阅读 · 0 评论 -
重卡自动驾驶技术
重卡自动驾驶技术图森未来成立于2015年,是一家无人驾驶技术企业,专注于为长途重卡开发L4级别无人驾驶解决方案,其业务分布于中国、美国、日本和欧洲。图森未来自主研发的无人驾驶卡车技术使卡车的感知距离长达1000米,持续运行几乎不受时间限制,同时比现有普通卡车低10%的燃油消耗。图森未来正在变革价值4万亿美元的全球卡车货运行业。图森未来的独特之处在于?图森未来的三个关键优势:先进的软件系统:图森未来自主研发了一个专为重卡设计的行业领先的无人驾驶系统,该系统允许卡车持续在高速公路和普通地面道路上运行,原创 2021-08-04 06:23:05 · 368 阅读 · 0 评论 -
华为云服务功能总览
华为云服务功能总览虚拟私有云虚拟私有云(Virtual Private Cloud,以下简称VPC),为云服务器、云容器、云数据库等资源构建隔离的、用户自主配置和管理的虚拟网络环境,提升用户云上资源的安全性,简化用户的网络部署。您可以在VPC中定义安全组、VPN、IP地址段、带宽等网络特性。用户可以通过VPC方便地管理、配置内部网络,进行安全、快捷的网络变更。同时,用户可以自定义安全组内与组间弹性云服务器的访问规则,加强弹性云服务器的安全保护。华为云提供了管理虚拟私有云的功能:创建虚拟私有云、修改虚原创 2021-07-30 06:28:44 · 818 阅读 · 0 评论 -
GPU编程和流式多处理器(六)
GPU编程和流式多处理器(六)5. 纹理和表面读取和写入纹理和表面的指令,所引用的隐式状态,比其他指令要多得多。header中包含诸如基地址,尺寸,格式和纹理内容的解释之类的参数,该header是一种中间数据结构,其软件抽象称为纹理参考或表面参考。当开发人员操纵纹理或表面引用时,CUDA运行时runtime和驱动程序,必须将这些更改转换为header,纹理或表面指令,将其作为索引引用。在启动在纹理或表面上运行的内核之前,驱动程序必须确保,在硬件上正确设置了所有状态。结果,启动此类内核,可能需要更长的时原创 2021-01-06 06:31:41 · 259 阅读 · 1 评论 -
GPU编程和流式多处理器(五)
GPU编程和流式多处理器(五)4. 条件代码硬件实现了“条件代码”或CC寄存器,其中包含用于整数比较的常用4位状态向量(符号,进位,零,溢出)。可以使用比较指令(例如ISET)来设置这些CC寄存器,并且它们可以通过谓词或发散来指导执行流程。预测允许(或禁止)在warp内基于每个线程执行指令,而分歧则是较长指令序列的条件执行。因为SM内的处理器以warp粒度(一次32个线程)以SIMD方式执行指令,所以如果warp内的所有线程都采用相同的代码路径,则差异会导致执行的指令更少。4.1. 谓词由于管理发散原创 2021-01-06 06:20:13 · 292 阅读 · 0 评论 -
GPU编程和流式多处理器(四)
GPU编程和流式多处理器(四)3.2. 单精度(32位)单精度浮点支持是GPU计算的主力军。GPU已经过优化,可以在此数据类型上原生提供高性能,不仅适用于核心标准IEEE操作(例如加法和乘法),还适用于非标准操作(例如对先验的近似(例如sin()和log()))。32位值与整数保存在同一寄存器文件中,因此单精度浮点值和32位整数(使用__float_as_int()和__int_as_float())之间的强制转换是免费的。加法,乘法和乘加编译器自动将浮点值的+,–和运算符转换为加,乘和乘加指令。所原创 2021-01-05 09:08:13 · 390 阅读 · 0 评论