![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
计算机系统结构
七爷OK
这个作者很懒,什么都没留下…
展开
-
如何解释 iTLB-loads 小于 iTLB-load-misses
1,262,817 dTLB-loads 13,950 dTLB-load-misses # 1.10% of all dTLB cache hits 75 iTLB-loads 6,88...原创 2021-11-08 16:58:17 · 798 阅读 · 0 评论 -
来自root 的进程对 CPU占用高解决方法
有时候,CPU 占用很高,而且是root的进程。比如 topTasks: 558 total, 1 running, 557 sleeping, 0 stopped, 0 zombie%Cpu(s): 61.4 us, 0.0 sy, 0.0 ni, 38.6 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 stKiB Mem : 13191446...原创 2019-06-10 15:56:40 · 6173 阅读 · 0 评论 -
Cache Thrashing
考虑如下代码,三个大向量结合到第四个向量。parameter max = 1024 * 1024dimension a(max), b(max), c(max), d(max).do i = 1, max a(i) = b(i) + c(i)d(i)enddo这四个向量逐个声明,因此他们在内存连续分配。每个向量都是 4MB 大小,102410244 bytes。因此这四个元素地址的...原创 2019-05-31 15:48:58 · 2325 阅读 · 1 评论 -
【计算机系统结构】near return instructions 近返回 。Far return instructions 远程返回指令
Opcode Mnemonic DescriptionC3 RET Near return to calling procedure.CB RET Far return to calling procedure.C2 iw RET imm16 Near return to calling procedure and pop imm16 bytes from...原创 2019-03-24 09:38:40 · 444 阅读 · 0 评论 -
【计算机系统结构】 LEA Load Effective Address 有效地址加载
LEA — Load Effective AddressDescriptionComputes the effective address of the second operand (the source operand) and stores it in the first operand (destination operand). The source operand is a mem...原创 2019-01-16 15:19:15 · 1218 阅读 · 0 评论 -
【tensorflow 解析】-【2】
tensorflow 结构我们为大规模分布式训练与推理设计了tensorflow,但它也是足够灵活地支持实验与新的机器学习模型和系统级的优化。该文档描述了尽可能灵活与可扩展相结合的系统结构。总览tensorflow 运行时是一个交叉平台库,图1 阐明了它的通用结构,一个C API 核心运行时在不同编程语言上分离了用户层代码。本文聚焦下列层:Client定义了作为数据流的计算...原创 2019-01-03 11:43:08 · 235 阅读 · 0 评论 -
【计算机系统结构】Micro-operation微操作
在CPU 中,micro-operations (also known as a micro-ops or μops) 是用于一些设计复杂机器指令的详细底层指令。通常,微操作在数据存储方面的一个或多个寄存器执行基本的操作,包括寄存器之间传输数据或寄存器与CPU的额外总线之间传输数据,还有在寄存器上的算术运算或逻辑运算。在典型的取值-译码-执行周期,在执行时微操作的每一步被分解,因此CPUCPU确...原创 2018-12-10 17:52:51 · 2949 阅读 · 0 评论 -
【计算机系统结构】 Instructions Retired 退役指令
退役指令是一个重要的硬件性能事件,它表示多少个指令已经完成执行。现代处理器执行着比程序流所需多很多的指令。称为猜测执行(speculative execution)。指令通过程序执行流的完成来证明其是确实需要的。在核心的乱序执行流水线,离开退役单元意味着指令是被最后执行,他们的结果在系统结构上而言是正确的可见的,就好像它们按顺序执行一样。如下图:只有指令或uops 在正确的执行路径上,可见...原创 2018-12-20 20:46:08 · 4238 阅读 · 0 评论 -
【计算机系统结构】Self-modifying code 自修改代码
Self-modifying code在计算机科学中,自修改代码是一种代码,当代码执行时修改它自身的指令,通常用于减少指令路径长度以提高性能或简单地减少额外的,重复的,相似的代码,以此来简化维护。自修改是“标志设置”和程序的条件分支方法的代替方法,主要用于减少需要被测试的条件(分支条件)的次数。它通常只用于有意进行自修改的代码,而不适用于由于一个错误如缓冲区溢出而导致的意外修改其自身代码的情况。...原创 2018-12-09 17:32:13 · 4507 阅读 · 1 评论 -
【计算机系统结构】Instruction path length 指令路径长度
Instruction path length在计算机性能中,Instruction path length(指令路径长度)是指在计算机程序中需要执行的一部分机器代码指令数量。对于整个程序而言,总路径长度可以被认为是衡量在特定计算机硬件上的算法性能。路径长度在一个简单的条件指令通常被认为是等于2,一个指令用于执行比较,如果特殊的条件满足另一个用于执行分支。每一个指令执行时间的长度通常不被认为是决...原创 2018-12-08 17:51:05 · 1703 阅读 · 0 评论