用于光学神经网络的高速光学卷积加速器

斯威本科技大学的研究人员在《Nature》上发表了一篇关于光学矢量卷积加速器(VCA)的文章,该加速器速度超过10 TOPS,能处理250000像素的图像卷积。光学神经网络受到生物视觉皮层的启发,利用光学带宽提高计算速度,成功应用于面部图像识别,准确率达到88%。VCA通过电光调制和高速光电检测实现光学卷积,具有高度可扩展性和可配置性。
摘要由CSDN通过智能技术生成

导读

    受生物视觉皮层系统启发的卷积神经网络能够提取原始数据的分层特征,以大大降低参数复杂性并提高预测的准确性。它们在机器学习任务中应用广泛,例如计算机视觉,语音识别,玩棋盘游戏和医疗诊断等。光学神经网络能够利用可用的宽光学带宽极大地提高计算速度。上周三(1月6日),斯威本科技大学的Xu等人在《Nature》上展示了一种通用的光学矢量卷积加速器(vector convolutional accelerator,VCA),其运行速度超过十个TOPS,实现了具有250000像素的图像卷积——对于面部图像识别来说足够大。
    他们使用相同的硬件搭建了具有十个输出神经元的光学卷积神经网络,从而以88%的准确度成功识别了手写数字图像。这种方法可扩展和训练到更复杂的网络,以应对诸如自动驾驶汽车和实时视频识别之类的高要求应用。

一、工作原理

TOPS光子卷积加速器的工作原理。EOM:电光马赫曾德尔调制器;SMF:电信标准单模光纤;PD:光电探测器。
    该系统的工作原理如上图所示。输入数据X被编码为串行电波形中时间符号的强度,符号率为1/ τ \tau τ(波特),其中 τ \tau τ为符号周期。卷积核由长度为R的权重向量W表示,该权重向量W是使用波整形器通过频谱整形在微梳线的光功率中编码的。随后,通过电光调制将时间波形X组播到卷积核波长通道上,生成权值W的副本。然后,光波形通过等于X的符号持续时间的延迟步长(在相邻波长之间)的色散延迟进行传输,从而有效地实现了时间和波长的交织。最后,通过高速光电检测对延迟和加权的副本进行求和,以使每个时隙在给定的卷积窗口(感受野)中在XW之间产生卷积。
    卷积窗口以与X的波特率匹配的调制速度有效地滑动。每个输出符号都是R个乘累加(MAC)操作的结果,计算速度为 2 R / τ 2R/\tau 2R/τ TOPS。由于此过程的速度与波特率和波长数量成比例,因此,来自微梳的大量平行波长能够增加速度。此外,输入数据X的长度在理论上是不受限制的,因此卷积加速器(CA)可以任意规模处理数据——实现的唯一限制是外部电子设备。
    通过为每个卷积核添加R个波长的子带来实现与多个卷积核的同时卷积。在多播和分散延迟之后,子带(卷积核)被解复用并分别检测,从而为每个卷积核生成电子波形。VCA是完全可重新配置和可扩展的:内核的数量和长度是任意的,仅受波长总数的限制。因为矩阵能够展平为向量,所以CA也能够处理图像矩阵。

二、矩阵卷积加速器

图像处理。实验设置(右栏),光学和电子控制及信号流(中间栏)以及原始输入图像的相应处理流程(左栏)。PUMP:连续波泵浦激光器;EDFA:掺铒光纤放大器;MRR:微环谐振器。DAC:数模转换器。
    在该部分中,他们展示了该系统如何高速地处理USC-SIPI数据集中的图片。该数据集中图片的尺寸大小为 500 × 500 500\times500 500×500
    该系统能够同时执行10个尺寸为 3 × 3 3\times3 3×3的卷积核的图像卷积运算。如上图中栏最上面所示,这些卷积核先被展平为1维的卷积核向量W 10 × 3 × 3 = 90 10\times3\times3=90 10×3×3=

  • 3
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值