首页  技术文章  博览:2021Nat Comput Sci可拓展的光学学习算子

博览:2021Nat Comput Sci可拓展的光学学习算子

发布时间:2022-04-07 17:18:23 浏览量:1426 作者:LY.Young 光学前沿

摘要

早期的光学计算机被用于做一些线性运算的计算(如傅立叶变换和相关性),并主要应用于模式识别和合成孔径雷达。然而,随着现代超大规模集成技术和高效算法的出现,基于硅电路的数字信号处理变得如此快速和并行,以至于模拟光学计算难以与之匹敌。随后出现的数字光计算将非线性光开关与取代电线的线性光互连(optical interconnections)相结合,并在1980年代得到了热烈追捧。光互连在功耗方面具有优势;然而,在全光实现中,与电子开关相比,光开关的功率低下和大尺寸抵消了这一优势。因此,全光数字计算机还没有竞争力。光学还被用于不基于布尔逻辑(Boolean logic)的非线性计算的实现,例如神经网络的光学实现。原则上,神经网络的密集连接性及其对噪声和设备缺陷的相对鲁棒性使它们成为光学计算的一个有前途的领域。

正文


博览:2021Nat Comput Sci可拓展的光学学习算子


技术背

早期的光学计算机被用于做一些线性运算的计算(如傅立叶变换和相关性),并主要应用于模式识别和合成孔径雷达。然而,随着现代超大规模集成技术和高效算法的出现,基于硅电路的数字信号处理变得如此快速和并行,以至于模拟光学计算难以与之匹敌。随后出现的数字光计算将非线性光开关与取代电线的线性光互连(optical interconnections)相结合,并在1980年代得到了热烈追捧。光互连在功耗方面具有优势;然而,在全光实现中,与电子开关相比,光开关的功率低下和大尺寸抵消了这一优势。因此,全光数字计算机还没有竞争力。光学还被用于不基于布尔逻辑(Boolean logic)的非线性计算的实现,例如神经网络的光学实现。原则上,神经网络的密集连接性及其对噪声和设备缺陷的相对鲁棒性使它们成为光学计算的一个有前途的领域。


当前不足:

近年来,人们对光学实现的神经网络的兴趣日益浓厚,部分原因是需要管理的大型数据库,对现有数字电子计算机的能力要求越来越高。设计一台可行的光学计算机(包括神经计算机)的关键难题是将系统的线性部分(光学竞争优势的来源)与非线性元件和输入-输出接口相结合,同时保持光互连的速度和功率效率。


文章创新点:

基于此,瑞士洛桑联邦理工学院的Uğur Teğin(一作兼通讯)等人提出一种将光学系统的线性和非线性部分组合限制在一根多模光纤的一个共享体积内的可扩展光学学习算子(scalable optical learning operator,SOLO)解决方案。并通过用于单变量线性回归、多变量线性回归、面部图像的年龄预测、音频语音分类和 X 射线图像任务的 COVID-19 诊断等实验,证明了基于多模光纤的模拟光学计算机具有高能效、通用性,并且获得的性能可与数字计算机相媲美。

(1)将光学的三维连通性与光纤提供的长相互作用长度和横向限制相结合,这使得在相对较低的光功率下实现光学非线性成为可能。

(2)在多模光纤中密集支持的大量空间模式既保持了光学的传统高并行度特性,又保持了紧凑的外形。

(3)应用百万像素空间光调制(spatial light modulator,SLM)和相机,多模光纤的二维输入和输出接口可以维持大的信息处理吞吐量。


原理解析:

在机器学习研究中,对输入数据做各种各样的非线性变换来学习隐藏在数据中的复杂关系。作者利用高光强(125kHz重复率,10ps脉冲的钇光纤激光器(Amplitude Laser Satsuma)。脉冲集中在1,033nm附近,宽度为10nm)的输入模式在多模光纤(5m的商用GRIN 50/125 MMF,NA为0.2,对于给定的激发,这种光纤允许每个偏振有 120 个模式)里传输产生的非线性映射关系作为机器学习的物理实现。

(1) 空间调制(SLM实现,Holoeye Pluto-NIRII )强脉冲激光携带的输入数据信息,空间调制光束经透镜傅里叶变换后聚焦在光纤的入射面。耦合到光纤每个模式的光量(amount of light)由入射光振幅和模式分布(mode profile)之间的内积给出。

(2) 在光纤中传输时,最初的复模式系数随着时空线性和非线性效应发生演变。信息的非线性变换由光纤模式之间的非线性能量交换完成。

(3) 光纤出射端的变换后的信息成像在相机上。像的每一个像素作为线性回归或单层神经分类算法的输入特征来估计SLM上输入的本体(identity)。

鉴于光纤和激光源的特性,多模光纤执行的输入-输出操作是固定的和高度非线性的。通过将光域中的固定非线性多模光纤(MMF)映射与单层数字神经网络(决策层)相结合来实现可重构处理器,该网络训练使用大量输入-输出对数据集识别相机上记录的输出。原理图如图1所示。


实验结果

图2a,b,c,d分别为鲍鱼数据集的线性回归结果、人脸数据集的线性回归结果、音频数据集数字和演讲者分类的混淆矩阵。e,年龄预测数据集的损失函数(均方误差)的演变。f,使用音频数据集进行数字分类的准确性和损失函数(分类交叉熵)的演变。g,使用音频数据集进行说话人分类的准确性和损失函数(分类交叉熵)的演变。


附录:


参考文献:Teğin, U., Yıldırım, M., Oğuz, İ. et al. Scalable optical learning operator. Nat Comput Sci 1, 542–549 (2021).

DOI:https://doi.org/10.1038/s43588-021-00112-0


关于昊量光电:

上海昊量光电设备有限公司是国内知名光电产品专业代理商,代理品牌均处于相关领域的发展前沿;产品包括各类激光器、光电调制器、光学测量设备、精密光学元件等,涉及应用领域涵盖了材料加工、光通讯、生物医疗、科学研究、国防及更细分的前沿市场如量子光学、生物显微、物联传感、精密加工、先进激光制造等;可为客户提供完整的设备安装,培训,硬件开发,软件开发,系统集成等优质服务。


您可以通过昊量光电的官方网站www.auniontech.com了解更多的产品信息,或直接来电咨询4006-888-532。


本文章经光学前沿授权转载,商业转载请联系获得授权。