脉冲神经网络_光芯片上的全光脉冲神经网络

Nature昨天刊登了德国明斯特大学的一篇最新进展,研究人员在光芯片上实现了脉冲神经网络(spike neural network)。先睹为快,这篇笔记主要介绍下这篇进展。研究人员将氮化硅波导与相变材料结合,实现了监督式和非监督式的机器学习,并演示了对15个像素图片的模式识别。

关于相变材料(phase changing material, 以下简称PCM), 小豆芽之前的一篇笔记 基于光芯片的内存内计算(memory-in computing)提到过。研究人员采用相同的材料GST(全称为Germanium Antimony Tellurium), 它可以在晶体和非晶态之间切换。GST通过溅射的方法沉积在SiN波导上方。GST的折射率随波长变化曲线如下图所示, 当PCM处于非晶态时,它的吸收率较小,而当它处于晶体态时,吸收率较大。基于这一性质,它可以作为神经网络的权重单元(weights),用来调控SiN波导中的光强,

1cb52b1931b5294c73ee20babf49c961.png

(图片来自文献1)

光脉冲神经网络的结构如下图所示,

15acc6cc466e75128e620185e2d867c3.png

(图片来自文献1)

而典型的神经元结构如下图所示,

ae4fdc5c82c4020c7e46e7a666114266.png

(图片来自https://www.cnblogs.com/by-dream/p/10497816.html)

比较上面两幅图片,可以看出光学脉冲神经网络的结构与生物神经元结构非常类似,两者之前存在一种对应关系。对于光学脉冲神经网络,不同波长的光脉冲序列输入进PCM构成的突触单元(synapse), 经过PCM的作用,脉冲强度发生变化,对应于乘法器。进而借助于微环结构,将不同波长的脉冲导入进同一波导中,该功能类似加法器。相加后的脉冲光强较小时,probe光与微环发生共振,在输出端口没有光强输出。当光强达到一定的阈值后,probe信号不再和微环发生共振,而是传播到输出端口。这一过程类似神经元脉冲信号的激发,扮演了非线性激活函数的功能。基本的光学结构单元如下:

1. 含PCM的波导

下图中的结构I, 作为突触单元,调控光脉冲信号的强度,相当于乘法器

2. WDM波分复用器

下图中的结构II, 采用微环结构,将不同波长的光脉冲导入到同一根波导中,相当于加法器

3. 含PCM的微环结构

下图中的结构VI, 作为非线性激活函数。当脉冲能量超过430pJ时,“激发”一个光脉冲。

1f4c0fd0f1611c1606862b37f7caa9cf.png

(图片来自文献1)

整个信号处理过程分为四步: 1)Weighting, 2)Mux, 3)Sum, 4) Output。典型的光路结构如下图所示,下图对应三个神经元结构。

aca0245e45547e4b32ebd19969929d2c.png

(图片来自文献1)

利用上图的单个神经元结构,研究人员验证了监督式机器学习和非监督式机器学习。对于监督式机器学习,权重的数值通过外部的supervisor设置。

e49505f3faeb1157f8998d09c04d2386.png

(图片来自文献1)

左图对应1010的识别,右图对应1100的识别。

对于非监督式机器学习,不再需要外部的supervisor来设置权重值,而是通过输出光脉冲进行反馈控制,调整权重值,如下图所示。当光脉冲信号产生时,增加对应的权重值,而没有光脉冲信号产生时,减小对应的权重值。下图展示了对0110的识别过程。

5f8f5ee73588ff0c618b5a5e647201ad.png

 (图片来自文献1)

上述的演示都是针对单个神经元的,对应2x2矩阵的操作。进一步,他们提出了更复杂的光学脉冲神经网络结构,证明该结构的可扩展性。神经网络中的每一层结构,如下图所示。每一层包括三个功能单元,即收集器collector、分发器distributor和神经突触结构neurosynapse。收集器将上一层不同波长的光脉冲信号收集到同一根波导中,分发器将光脉冲分发给N个神经元,神经突触结构则产生光脉冲信号,输入给下一层结构。

ddb6c164072e481721a1dd6ada126d53.png

(图片来自文献1)

基于上述的架构,他们进一步演示了对字母ABCD的识别。光路中包含4个神经元,每个神经元包含15个突触,对应识别含15个像素的图片。整个芯片包含140多个光器件,如下图所示。由于涉及到15个波长,收集器不是在片内实现的,而是通过外部的WDM实现。

9589c04adb7d8502ee6550c490a49517.png

(图片来自文献1)

可以看出,该结构能够较好地识别ABCD这四个字母。

小豆芽的几点comment:

1) 神经网络所需的功能单元全部都可以在光芯片内实现,而MIT研究组的方案中激活函数是通过片外电学方法实现。这是该方案的一个优势和新颖之处。

2) 采用微环结构,微环是对工艺、温度、波长非常敏感的。如果该方案想进行大批量生产,这会是一个非常大的挑战。当然,可以通过热调的方法进行补偿,但是这会带来额外的功耗。

3) 由于采用了特殊的PCM材料,目前还没有硅光foundry支持这一工艺。

4) 采用波长编码,目前演示的是含15像素的图片识别,涉及到15个波长。如果矩阵的规模进一步变大,例如10x10, 就会涉及到100个波长。这就需要可处理100个波长的波分复用器件,无论是在片内还是片外,实现起来都是非常有难度的。或许,较大的矩阵能拆分成小矩阵进行处理,可以规避这一问题。

文章中如果有任何错误和不严谨之处,还望大家不吝指出,欢迎大家留言讨论。


参考文献:

1. J. Feldmann, et.al., "All-optical spiking neurosynaptic networks with self-learning capabilities", Nature 569, 208(2019)

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
提供的源码资源涵盖了安卓应用、小程序、Python应用和Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值