computer
文章平均质量分 86
shuiliusheng
这个作者很懒,什么都没留下…
展开
-
Directly use other language codes in shell script
use_other_language_in_shelldirectly use other language code in shell scriptcode link: https://github.com/Shuiliusheng/use_other_language_in_shell./xxx srcFilename dstFilename************ python tr...原创 2020-03-03 22:01:37 · 149 阅读 · 0 评论 -
2018图灵奖演讲
2018图灵奖演讲20世纪60年代早期,IBM的4种系列机型(相互独立)有着严重的机型不兼容的问题,因此出现了指令集。之后英国科学家Maurice Wilkes提出了微程序的概念和设计控制单元的方法。CISC诞生: 由于逻辑运算、RAM与ROM均以晶体管实现,半导体RAM与ROM具有类似的速度,摩尔定律以及RAM对微程序的重写能力,促使了复杂指令集(CISC)的诞生。直到20世纪80年代...原创 2018-10-09 20:24:49 · 1193 阅读 · 0 评论 -
现代处理器设计——超标量处理器基础(执行多线程)
现代处理器设计——超标量处理器基础(执行多线程)构造多处理机系统的挑战:如何为所有的线程提供一致的存储器视图,同时尽量减少平均访存延迟。load-locked/store-conditional:读出一个值,执行其他任意操作,然后试图将数据存到同一地址。如果中间插入其他任何一个线程的针对于同一地址的写操作,都会导致写条件失败。实现:每条LL指令必须记住它读取的地址,所有后续的写操作必须...原创 2018-08-30 10:56:47 · 1820 阅读 · 0 评论 -
现代处理器设计——超标量处理器基础(5-8)
现代处理器设计——超标量处理器基础(5-8)重命名中出现的影子寄存器(shadow registers)具有专有用处,例如作为计数寄存器,链接寄存器的重命名等。分派阶段停顿的产生原因:寄存器读端口饱和,保留站饱和,重命名缓冲饱和,完成缓冲饱和,多于一条指令分派到同一单元(保留站只有一个写端口),串行化限制串行化限制:某些指令要求之前的指令必须在该指令执行之前完成分派/执行,之后的指令必须...原创 2018-08-29 17:28:53 · 2366 阅读 · 0 评论 -
虚拟存储器
虚拟存储器VM的重要能力主存称为磁盘的cache为每个进程提供了一致的地址空间,简化了存储器管理保护了每个进程的地址空间不被其他进程破坏存储器管理单元(MMU,memory management unit)的一部分工作:利用存放在主存中的查询表来动态翻译虚拟地址,该表的内容由OS管理。MMU需要根据虚拟地址的一部分,在页表中找到对应的表项。访问TLB的过程也属于MMU的工作。虚拟...原创 2018-08-31 10:24:31 · 367 阅读 · 0 评论 -
异常控制流
异常控制流异步异常(中断)是由处理器外部的I/O设备中的事件产生的,同步异常(陷阱,故障,终止)是执行一条指令的直接产物。陷阱是有意的异常,是执行一条指令的结果。陷阱最重要的用途是在用户程序和内核之间提供一个像过程调用一样的接口,叫做系统调用进程的经典定义:一个执行中的程序的实例。上下文是由程序正确执行所需的状态组成,这个状态包括存放在存储器中的程序的代码和数据,它的栈,通用寄存器的内容...原创 2018-08-30 20:13:46 · 1637 阅读 · 0 评论 -
现代处理器设计——超标量处理器基础1-4
现代处理器设计——超标量处理器基础(1-4)体系结构(architecture):通常称为指令集体系结构,对指令集处理器的指令集合进行说明,并定义处理器的功能性行为。逻辑实现:体系结构的具体设计,也称为微体系结构(microarchitecture)。某种体系结构在其ISA的生命周期内可以有多种逻辑实现。逻辑实现通常在硬件中实现,对软件透明。物理实现:设计的具体物理表现形式。对于微处理器...原创 2018-08-26 16:21:05 · 6848 阅读 · 1 评论 -
Processor Microarchitecture
Processor Microarchitecture处理器的更新的两个主要原因:技术的升级、工作负载的更新处理器的不同侧面的分类:(正交分类,一个处理器具备多个属性)流水线处理器和非流水线处理器按序处理器和乱序处理器标量处理器(每周期吞吐量不超过一条指令)和超标量处理器VLIW也是超标量处理器(许多指令的延迟作为指令集体系结构的一部分,对程序员可见),VLIW处理器要求编程人...原创 2018-08-15 13:08:20 · 727 阅读 · 0 评论 -
A Primer on Memory Consistency and Cache Coherence—第四章TSO
A Primer on Memory Consistency and Cache Coherence—第四章TSOMotivation of TSOSC模型的要求:要求每个处理器完成存储的操作必须严格符合Program Order,完全保证四种约束(L->L,L->S,S->L,S->S)SC模型的限制:严格的约束限制了处理器动态调度和执行的能力,也限制着处...原创 2018-07-27 23:39:11 · 944 阅读 · 1 评论 -
A Primer on Memory Consistency and Cache Coherence
A Primer on Memory Consistency and Cache Coherence 前三章阅读笔记Memory consistency For a shared memory machine, the memory consistency model defines the architecturally visible behavior of its mem...原创 2018-07-27 23:13:42 · 944 阅读 · 0 评论 -
A Primer on Memory Consistency and Cache Coherence—第五章 Relaxed Memory Model
A Primer on Memory Consistency and Cache Coherence—第五章 Relaxed Memory ModelMotivation of Relaxed ModelSC模型或者TSO模型在某些需要正确存储顺序的场景下能够保证程序正确执行,但是在某些不需要存储顺序的情况下,限制了程序的性能优化 当系统不约束程序的存储顺序时,更多的优化技术可以被使用...原创 2018-07-28 14:36:14 · 1559 阅读 · 0 评论 -
Convolution and Max Pooling of CNN (卷积和池化的实现)
Convolution and Max Pooling of CNN (卷积和池化的实现)卷积和池化的具体解释(比较清晰直观): http://www.hackcv.com/index.php/archives/104/?hmsr=toutiao.io&utm_medium=toutiao.io&utm_source=toutiao.io图像卷积的实现图像卷积的原理图...原创 2018-04-15 14:31:38 · 753 阅读 · 0 评论 -
MNIST的手写数字识别
MNIST的手写数字识别数据集传统的手写数字的数据集MNIST(http://yann.lecun.com/exdb/mnist/)训练集为60000图片,图片像素为28*28。Images文件中存储图片,label文件中存储对应的数字测试集为10000图片,格式一致 网络结构设计 网络结构为三层神经网络,包括一个输入层,一个输出层,两个隐藏层。输入层为图片的向量形式...原创 2018-03-30 20:56:03 · 1558 阅读 · 0 评论