- 博客(27)
- 资源 (11)
- 收藏
- 关注
原创 AI技术知识100问
总的来说,Transformer使用attention机制建模序列之间的全局依赖关系,取代了RNN和CNN中的局部建模,使其对长程依赖更为敏感,能够有效学习语义信息。这些技术使得LLM无需大量标注新样本就可以快速适配到新任务上,减少训练成本和人力标注量,是LLM强大推理和迁移能力的关键。MAC需要读取x,w,y这3个操作数,而FMAC只需要读取x,y,z这3个操作数。综上,FMAC在计算性能、效率、准确性和并行性上都优于MAC,是评价GPU算力更合适的指标。MAC:需要暂存x*w的中间结果,存在精度损失。
2023-09-02 11:42:42 181
原创 AI与数字芯片验证
第2节介绍了拟议工作中遵循的方法,显示了收集、组织和综合文献中现有知识的方法。在第 3 节中,介绍了不同的 ML 模型以及它们旨在解决的问题的描述。第 4 节演示了将 ML 纳入验证过程的早期工作,重点介绍了使用的关键模型。Mentor Graphics Questa Verification IP:一种验证 IP(即可复用的验证组件),可以帮助芯片设计人员快速验证数字芯片的性能。Synopsys IC Compiler:一种用于高效数字芯片设计的自动化工具,可以在设计过程中实现自动验证。
2023-07-15 16:29:22 696
原创 uvm sequence是怎么跑起来的?
所谓的sequence启动,就是将sequence中的sequencer句柄执行sequencer对象,将sequencer中的sequence句柄指向sequence对象。注意,Vsqr中的sqrA和agtA中的sqrA要指向同一个实体,否则就乱套了,因此要在connect_phase中(也就是上图中的第0步),做以下连接。完成连接后,sequencer就可以调用sequence中的方法,sequence就可以调用sequencer中的方法,从此双方就可以相互通信。(手动启动,或者自动启动时)
2023-05-05 17:29:52 380
原创 UVM组件是怎么连起来的?
如下图中的producer与consumer,producer在生产好数据后,直接通过绝对路径调用消费者的接口。当消费者的路径,名字,或者接口发生变化时,生产者的代码也必须跟着修改,即生产者和消费者直接高耦合。生产者,消费者都不需要实现接口,接口在中介fifo中实现,生产者和消费者直接负责调用中介即可。问:既想调用客户的接口,又不想关心客户的路径和名称,也不想关注客户的接口。为了避免中间商赚差价,m_imp_list,这个数据结构,直接连接到最终的客户。问:既想调用客户的接口,又不想关心客户的路径和名称。
2023-04-14 09:45:41 254
原创 UVM中树的数据结构
clone,要clone的数据结构是啥样的?本质是遍历如下数据结构。另外,也能深刻理解,clone的底层是调用copy,其本质是创建实体和copy。clone和copy遍历两个维度,一个是包含的维度,一个是继承的维度。子类的clone,如何clone基类的内容?build_phase,自定向下创建整个树。new函数的本身,嵌套创建。
2023-04-14 09:44:35 107
原创 纹理技术问题总结
而GPU的开销主要是在切换纹理单元时,需要将之前的纹理数据从显存中清除,然后将新的纹理数据加载到显存中,这个过程也会消耗一定的时间。因此,绑定纹理单元的开销是比较大的,如果需要频繁切换纹理单元,就会对性能产生影响。总的来说,Bindless Texture适合需要大量纹理访问的场景,而Binded Texture适合纹理数量较少的场景。OPENGL绑定纹理单元的开销包括CPU和GPU两部分。CPU的开销主要是在切换纹理单元时,需要将纹理数据从CPU传输到GPU,这个过程会消耗一定的时间。
2023-03-26 15:17:25 426
原创 SIMT与SIMD的区别?
来源: SIMD指令和SIMT指令有什么区别?在出现SIMD和SIMT之前,占主导地位的是SISD(Single instruction single data)。但很快人们发现,在一些逻辑简单但计算量大的场景下,这些计算可以并行完成。因此,直接想到的解决方案就是多块芯片并行计算,即多核系统,与此对应的编程模型是多线程编程。多核系统的产生使得编程变得轻松,只需解决多线程互斥、同步等一些小问题即可。但很快有人意识到,从硬件的角度看,这么做很不划算。我们只是为了并行计算,按理说只需要多块计算元件和寄存器就行了,
2023-03-12 11:58:10 2071
原创 volatile的变量学习
3 “做饭”指令执行完毕,具体指的是饭做好了,而且必须盛到碗里而不是还放在锅里,保证干饭人来了后必须立刻能吃到饭。重排指令可能会导致功能出错?编译器可能会重排指令?CPU也可能会重排指令。2 “叫吃饭”时,一定要保证“做饭”指令执行完毕;1 “做饭”和“叫吃饭”的指令不能乱序;
2022-10-31 23:32:16 102
原创 UVM与桥梁模式
port和consumer之间?port与port之间的connect?1 将接口(想要扩展的功能)封装成另一个类来实现,以此和consumer解除耦合。consumer提供put函数,producer调用consumer的put函数。顺序关系,创建了了之后再传递,拿到上游的东西之后再传递给下游。cons: 路径变化,名字变化,传输方式变化。bottom-up的执行序列能满足。
2022-10-30 20:38:12 71
原创 UVM与组合模式
背景#场景:验证平台中,各组件以一颗树的形式构成,每个组件都有自己的程序(demo_phase())。#问题:如何启动这些组件的程序?#方案 - 朴素:将各个组件的demo_phase()程序添加到traverse_demo_phase()中。
2022-10-30 20:34:36 111
原创 UVM与工厂模式和策略模式
模式说明:指对象有某个行为,但是在不同的场景中,该行为有不同的实现算法定义了一族算法(业务规则);封装了每个算法;这族的算法可互换代替(interchangeable)。UVM应用:模式说明:工厂通常是一个用来创建其他对象的对象。工厂是构造方法的抽象,用来实现不同的分配方案。应用场景:创建对象需要大量重复的代码。可以把这些代码写在工厂基类中。创建对象需要访问某些信息,而这些信息不应该包含在复合类中。UVM应用:run_test()
2022-10-30 20:32:11 136
原创 UVM与订阅者模式
模式说明:一个目标对象管理所有相依于它的观察者对象,并且在它本身的状态改变时主动发出通知应用场景:当其中一个对象的变更会影响其他对象,却又不知道多少对象必须被同时变更时。
2022-10-30 19:12:56 95
原创 UVM与单例模式
模式说明:单例对象的类必须保证只有一个实例存在应用场景:整个系统只需要拥有一个全局对象应用举例:多进程/多模块共享资源/通信/同步等信息UVM应用:UVM RootUVM Pool,
2022-10-30 19:09:16 274
原创 可视化技术&工具学习
思考,开源编译工具,编译出verilog/sv/uvm后的中间结果的数据结构长什么样?class内变量利用json dump与load。echarts 数据库格式。mySql基本用法学习。学习其中的demo视频。
2022-09-25 09:24:03 236
原创 verilog的$test$plusargs与$value$plusargs实验
跑完以上例子,我相信您对$test$plusargs和$value$plusargs已经有一个初步的了解。VERILOG的参数可以用define和parameter的方式定义,然而,有时候我们在进行仿真时,需要从外部传递参数,这个要求怎么满足呢?这种方法要求我们在编译前将变量必须定义好,编译完成之后再也不能修改;命令:simv +TAISHAN +TESTNAME=HUASHAN。命令:simv +TAISHAN。TAISHANHAO也会触发分支。完成后,以VCS仿真为例,在仿真时,若采用命令。
2022-09-12 22:30:49 364
原创 计算机架构100问
ca中的100个问题计算机是如何创建的?1.1 能不能在框图中,构建计算机的结构(画出计算机的datapath?)1.2 从逻辑门的角度,画出计算机架构1.3 指令的执行过程是怎么样的,手画出来。计算机是如何被控制的?(ISA)计算机如何提高性能? (pipelining -> data harzards -> forward, branch prediction, caches, and parallelism)ISA有哪些分类(data operations, data tr
2022-04-25 12:31:06 217
原创 图形学100问
图形学的rayTracing与graphic pipeline区别?理论坐标系什么是线性变换?为什么要引入齐次坐标系?存在那些坐标空间,各个空间的转换关系?透视的特点是怎样的?怎么可视化的理解透视行为?屏幕坐标的z与三维空间的z的关系是?图形学上的z与w的区别?为什么引入第四维度的w?z-test中,为什么一定要用透视后的z? 能不能用世界坐标系的z?z-interpolation中,参与插值的(x,y)有什么特点?XV-A-RY中,插值时,用的(x,y)要有什么特点,在sa.
2022-04-23 11:30:36 259
原创 处理器的朴素思想
文章目录前言生产者与消费者模型生产者与消费者模型 --- 竞争(做对)吃饭&做饭同步&异步赛跑的例子理解竞争生产者与消费者模型 --- 效率(做快)提高效率的方法怎么吃饭的问题调度调度实例调度方法调度涉及的数据结构公交车/高铁/机场调度车站项目管理技术(过程也是一个调度问题)大学课程安排工作调度(工作安排)调度效率-流水线/并行/...包工思想大包工头与小包工头包工头与加工厂资源资源分配与释放资源粒度资源编号如何提高资源利用率?资源粒度切分资源合并?虚拟资源资源复用不能出错---初始化与扫尾
2022-04-13 22:00:52 590
Digital Image Processing Using Matlab
2016-02-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人