神经网络算法未来_光子神经网络——点亮智能光子

0f80da7d4ec18d929fcd24c561cb4d4f.png

本文为中国激光第1834篇。

欢迎点击在看、转发,让更多人看到。

*记得把我点亮星标哦,操作见文末

02f7ca307fc76c8b49bd5adf7a7260c2.png

编者按

《中国激光》于2020年第5期出版“纪念激光器诞生60周年”专题。《中国激光》编委、清华大学陈宏伟教授受邀联合北京邮电大学徐坤教授课题组撰写《光子神经网络发展与挑战》,回顾了光子神经网络的发展,阐述了目前已取得的阶段性进展,并揭示了未来的发展趋势和面临的挑战。

背景介绍

fdfd8e2d755f071a204ad0fe4e2b0b16.png(图片来源于网络)

近年来,以神经网络为代表的人工智能技术快速发展。2017年,采用了神经网络的AlphaGo依次战胜了人类顶尖围棋选手李世石和柯洁,展现了人工智能强大的学习和计算能力,揭开了新一代人工智能的序幕。人工智能技术正向着高速低功耗的方向快速发展。 受限于电子器件的固有极限,传统电子神经网络难以进一步提高功率效率与计算速度。而光子神经网络,作为光电子技术与人工智能技术的交叉产物,能够充分发挥光(电)子技术在带宽、容量、速度方面的优势,成为突破传统限制的潜在手段。 当前,光子神经网络技术的研究主要涉及前馈神经网络循环神经网络(存储池计算)以及脉冲神经网络这三种典型结构。与此同时,光子神经网络也正朝着可实时训练、规模化以及特殊应用等方向继续发展。

研究现状

1. 前馈神经网络

前馈神经网络的计算信息呈现为输入层至输出层的单向流动。

2017年,来自MIT的Shen等人成功构建出世界首款基于集成光子干涉计算单元的前馈神经网络。利用由MZI网络构成的光子干涉计算单元(OIU),辅以非线性激活模块(图1),该课题组成功实现元音识别功能。据分析,相比于传统电子前馈网络,其结构更能适应高速、低功耗和低延时的运算场景。

731ab2b1e8e8d0a5f79aaf2e8cee5eaf.png

(a)

10cb07f6cb05fec8243d1a3a56b572ad.png

(b)

图1 集成光子干涉计算单元结构和元音识别混淆矩阵。(a)集成光子干涉计算单元结构;(b)元音识别混淆矩阵 2018年,Bagherian等在上述光子干涉计算单元芯片的基础上提出,通过时分复用的方式,利用该芯片分段计算图像卷积,从而构建更加复杂的卷积神经网络结构。该结构模型可用于彩色数字的识别。 2. 循环神经网络(存储池计算) 相异于前馈神经网络,循环神经网络(存储池计算)的计算信息除了前向流动外,还存在同层节点间的流动以及后向反馈流动。 一般循环神经网络由输入层、中间层和输出层组成。训练时,往往只训练输出权重使网络收敛。使用光电子器件构建循环神经网络时,存在串行与并行两种方案。 并行的优势是直观性强,计算速度快。2011年,Vandoorne等提出的基于半导体光放大器(SOA)的循环神经网络结构以及2016年Bueno等提出的基于空间光学器件的循环神经网络结构均采用该方案。 然而并行存在鲁棒性较差、规模不易扩展以及成本较高等问题,串行方案可改善这些问题。2012年,Paquot等利用光电混合系统率先构建了光电混合串行循环神经网络,实现了信号分类的功能。 3. 脉冲神经网络 脉冲神经网络(SNNs)模拟的神经元更接近生物神经元模型,因此又被称为第三代人工神经网络。脉冲神经元并非在每一次迭代传播中都被激活,而是只有当其膜电位达到阈值时才被激活。 2016年,普林斯顿大学的Prucnal小组提出了基于可激活的石墨烯光纤激光器的脉冲处理系统,其结构如图2所示。该系统主要由掺铒光纤 (增益部分)和石墨烯饱和吸收体(损耗部分)构成,1480 nm激光器携带脉冲刺激信号激发系统产生类LIF (leaky integrate-and-fire)脉冲神经元的响应。 6b419911f6477766696ab987a5a22c52.png 图2 可激活的石墨烯光纤激光器系统 该小组于2018年还提出了基于分布式反馈(DFB)激光器结构的神经拟态光子集成电路(图3),并探讨了构建可编程可级联光子神经网络的可行方案。 35ad35f84c3bdf1c808099e7c78da5ca.png 图3 集成光子神经元

发展趋势

1. 实时训练算法 由于光子本身难以存储,故在电神经网络训练中应用广泛的后向传播算法难以移植于光子神经网络的训练上。 针对这一问题,Hughes等人于2018年首次提出了针对集成光子干涉单元的实时训练算法。该算法通过记录光场分布以及移相器的相位分布能够得到向收敛方向下降的梯度值,进而计算下一轮迭代中芯片移相器的相位配置,从而使得芯片整体性能能够逐步收敛。 除此之外,北京邮电大学Zhang等人于2019年提出了基于遗传算法/粒子群算法的非梯度片上训练方案,以减少获取与计算梯度值所带来的器件性能和要求。Zhang等通过仿真分别实现了光神经网络在Iris 数据集、Wine数据集上的在线训练,训练的收敛效果如图4所示。 fce7f3884ba47e883cd4e60fec851f7c.png

(a)

9b7b30c3806e1eb23ebac7fcb72852c5.png

(b)

图4 (a)采用GA算法训练光神经网络的分类效果; (b)采用PSO算法训练光神经网络的分类效果 相比于电子器件,光电子器件实现非线性函数困难,且所实现的非线性函数存在很多非理想特性,因此非线性运算已成为光子神经网络发展的另一个障碍。 1967年,Seldon等提出了在光子神经网络中实现非线性运算的饱和吸收体模型或电子模块,但该方法难于精准控制,且需要将光信号通过光电二极管转化为电信号,从而降低了计算速度。 2019年,Williamson等提出了一种光电混合的非线性运算模块(图5)。该模块除了能够较为精准的产生非线性激活函数,通过改变移相器的相位,还能够实现不同激活函数的转换。同年,Feldmann 等提出了光控相变存储器(PCM)方案,该方案利用相变材料对不同输入光强的透光性差异,进而实现非线性激活函数的功能(图6)。 84549d28b1e09ac1f16859cfc62f71b7.png

图5 光电混合非线性模块结构以及通过调谐相位实现不同的非线性函数

5874473d737aa6bb1c4eba0127729b02.png 图6 光控PCM的归一化传输系数曲线 除此之外,二维石墨烯材料也有望用以实现光学激活函数。 2. 网络规模扩展 光子神经网络的规模化是另一个难解决的问题。一方面,大规模神经网络有利于实现更加复杂的功能,但光子器件的不稳定和难以精细调谐的特性又使得神经网络规模的扩展变得困难。 2018年Lin等提出了一种基于衍射的光子深度神经网络(DNN),能够有效解决这一问题(图7)。利用光衍射叠加,该结构能够实现相邻两层神经元之间的连接,通过改变处于不同位置的像素块厚度来调节所经过光的相位差,从而使得不同节点之间有不同的权值。最后,利用放置于特定位置的PD获得深度神经网络的输出。采用该结构的神经网络每层节点数可以扩充至几百。 f9a7feb24cb2e0c1c87a63ef7ffb32d8.png 图7 基于衍射的光子深度神经网络结构图 除此之外,清华大学陈宏伟课题组提出了一种基于时域拉伸的串行光子神经网络(TS-NN),利用光纤色散傅里叶变换实现线性矩阵运算,该方法通过并行变串行的方案实现了光电混合的全连接神经网络规模扩展(图8)。 9bcd5e9165843f2b320298db1f198d46.png 图8 基于时域拉伸的全连接光电神经网络结构 3. 应用场景扩展 一直以来,受限于现有光子神经网络的规模与复杂度,光子神经网络的应用场景十分有限。 2012年,Paquot等成功构建了基于光纤系统的光电混合循环神经网络,可实现通信信道的均衡,是光子神经网络在通信领域的场景扩展。 2019年,清华大学和北京邮电大学Yu等利用光电混合网络构建了二值光相干接收机(图9),实现了对发送端调制信号的恢复。正交相移键控(QPSK)调制的光信号从先通过广播层进入输入层,然后通过二值全光神经网络进行处理,再通过光电二极管和模数转换器变为电信号,最后利用电人工神经网络恢复原始调制信号。 c823bef4d8ff86b6862703c761fe795c.png

(a)

9370c98e0ca5423939c1100c3bdf9a4a.png

(b)

ed7646e1b1b170667dc2f90ab1d594fd.png

(c)

图9  (a)光电混合二值神经网络架构;(b)单偏振系统二值权重映射结构;(c)偏振复用系统二值权值映射结构 该结构可以缓解电域的信号处理压力,降低光接收机整体的功耗,提升光接收机的信号处理速度。此外,该结构还能极大地降低对模数转换器量化位数的要求,从而有效降低光接收机的成本。

总结

近年来,种类繁多的光子神经网络异军突起,成为突破电子神经网络瓶颈的潜在手段。得益于光电器件大带宽、低损耗的特点,光子神经网络更能适应高速低时延运算。然而,光子神经网络还需克服实时训练、非线性激活函数实现、规模化以及应用扩展等问题,才能真正在人工智能领域大放异彩。

课题组介绍

f78c6c57bf38b2363650ae15988ace5e.png

清华大学宽带光网络实验室隶属于清华大学电子工程系信息光电子研究所与北京信息科学与技术国家研究中心。课题组长期从事光电子技术与系统研究,包括微波光子学、超高速激光成像、智能光子系统、硅基光子集成等领域,课题组主要成员陈宏伟教授曾入选教育部首批青年长江学者、国家自然科学基金委优青及新世纪人才计划等。课题组的工作多次获得北京市、教育部及行业协会奖项,承担国家重点研发计划、国家自然科学基金重大重点项目等。

北京邮电大学射频光子学实验室隶属于北京邮电大学信息光子学与光通信国家重点实验室,在国家杰出青年科学基金获得者徐坤教授带领下,长期从事信息光子学方面的研究,主要包括微波光子学、光纤通信与光纤无线融合系统、人工智能与光子神经网络等。。

ae1764f20ef78ed4d361ed4b302bca51.gif

推荐阅读

98021d8bd211f90bd65cbd5c27305bb6.png fb78d5352afd4be75b22475951d6d7cd.png dbbfd4a33749c8cc3b5c2f69bf805282.png 107c0cfeb7e05e62d2e4b668e3e84327.png 1800153b73a73b3963af6c2faf81a9a1.png b0f05ac132cadaff5d046cf994f275f0.png

本文编辑:沈灵灵

声明:本文所用图片如涉及版权问题,请第一时间告知,我们将根据您提供的证明材料确认版权并立即删除。

00f323580284c1ed4dd441fd917e4836.gif

65f15d6bebbd558d66b939d8c45bffdc.png

e3e7e2ab61d9733ff3b80e650d764551.png

End

d7cc5bdc04196f8a4de487852e985c63.png

首发前沿光学成果,放送新鲜光学活动

如需转载,请直接留言。

商务合作:朱先生 13918384218

免责声明

本文注明来源为其他媒体或网站的文/图等稿件均为转载,如涉及版权等问题,请作者在20个工作日之内来电或来函联系,我们将协调给予处理(按照法规支付稿费或删除)。

最终解释权归《中国激光》杂志社所有。

  • 1
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值