文献阅读(4):手写数字识别

目录

一、简介

1.题目:

2.时间:

3.来源:

4.简介:

5.论文主要贡献:

二、相关名词

三、 相关背景知识

1.阵列处理器

2.Xilinx

四、处理流程概述

1.基于可重构阵列处理器的近数据计算结构:

 2.实现手写数字识别所用的CNN结构:

3.实验效果分析与结论


一、简介

1.题目:

基于近存储计算的手写数字识别实时检测阵列结构设计

2.时间:

2022.12

3.来源:

Journal of Optoelectronics · Laser(光电子·激光)

4.简介:

图像识别中最经典的问题之一 —— 手写数字识别,使用深度学习中的卷积神经网络进行手写数字识别具有更高的准确率,但随之而来的是更加密集的计算和存储,这些都在限制CNN快速高效地实现。该论文在可重构陈列处理器的基础上,利用NMC阵列和数据并行化计算,实现了CNN计算加速,通过降低处理器和主存之间的数据通信实现了手写数字的实时检测。

5.论文主要贡献:

基于可重构阵列处理器的NMC结构,通过CNN并行计算的方法实现了手写数字识别。CNN中最耗费计算资源的卷积运算,本文的实验结果表明提出的方法降低访存延迟以及提高了卷积运算速度,执行单个卷积运算的计算速度比以往研究平均提高了75%。


二、相关名词

ASIC:application specific integrated circuit,专用集成电路

FPGA:filed programmable gate array,现场可编程门阵列

DDR:double data rate,双倍速率同步动态随机存储器

PE:process element,处理元


三、 相关背景知识

1.阵列处理器

阵列处理器(array processor),是用来对大量数据执行计算的处理器,其余还有Multiprocessors(多处理器)和 vector processors(矢量处理器),当有大量数据(如矩阵计算)陈列处理器才最有优势。

阵列处理器可以分为两类:

1.Attached Array Processors

2. SIMD(Single Instruction Stream, Multiple Data Stream) Array Processors

大多数阵列处理器在矢量计算上比主机CPU更快,而且可以与CPU异步运行,因此可以提高系统的整体性能。除此之外,阵列处理器具有自己的本地内存,可以为内存有限的系统提供额外内存。可重构阵列处理器(Reconfigurable array processor),可以在运行时通过配置流程来动态改变PE阵列的功能,然后利用数据流驱动PE。

2.Xilinx

Xilinx(赛灵思)是全球领先的可编程逻辑完整解决方案的供应商,本文中用到的ISE(Integrated Software Environment,集成软件环境)就是xilinx公司的硬件设计工具。Xilinx首创了FPGA这一创新性的技术,并于1985年首次推出商业化产品。如今全世界一半的FPGA产品都来自Xilinx.


四、处理流程概述

1.基于可重构阵列处理器的近数据计算结构:

其中主处理器负责卷积运算中的循环控制,协处理器执行卷积过程中的访存计算指令(寄存器间接寻址)。

DDR中存放卷积运算前原始图像数据、权重和偏置。

 2.实现手写数字识别所用的CNN结构:

论文中设计了一种卷积并行计算的方式:由12个协处理器同时处理两个5×5的卷积运算,其中10个协处理器执行1×5卷积运算,2个协处理器对计算的中间结果进行累加。

3.实验效果分析与结论

文章中的结果是与之前的研究成果进行对比分析的,相较于不同的文献结果,本文中提出的方法均有不同程度的性能提升或者精度提高或者资源消耗减少等等。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值