首页  技术文章  博览:2018 Science使用衍射深度神经网络的全光机器学习

博览:2018 Science使用衍射深度神经网络的全光机器学习

发布时间:2022-04-06 16:30:47 浏览量:2246 作者:LY.Young 光学前沿

摘要

深度学习是发展最快的机器学习方法之一,它利用在计算机中实现的多层人工神经网络对数据的表示和抽象进行数字化学习,并执行高级任务,与人类专家的表现相当甚至优于人类专家。深度学习的最新应用进展主要包括医学图像分析、语音识别、语言翻译、图像分类等。除了这些主流应用之外,深度学习方法也被用于解决逆成像问题。

正文


博览:2018 Science使用衍射深度神经网络的全光机器学习


技术背

深度学习是发展最快的机器学习方法之一,它利用在计算机中实现的多层人工神经网络对数据的表示和抽象进行数字化学习,并执行高级任务,与人类专家的表现相当甚至优于人类专家。深度学习的最新应用进展主要包括医学图像分析、语音识别、语言翻译、图像分类等。除了这些主流应用之外,深度学习方法也被用于解决逆成像问题。


当前不足:

当前的深度学习框架主要是在计算机中训练及执行的,而受限于摩尔定律接近其物理极限,硅基计算机的性能增长已经逐渐达到不可持续的水平,急需新一代的计算模式。


文章创新点:

基于此,美国加州大学洛杉矶分校(UCLA)Aydogan Ozcan组的Xing Lin和Yair Rivenson(共同一作)提出了一种全光衍射深度学习框架。通过计算机训练出其每一层的参数,然后使用3D打印加工,组装完成后可以光速完成特定的任务。作者展示了全光衍射深度学习网络在分类任务和单位放大率成像应用中的能力。


原理解析:

(1) 衍射深度神经网络。如图1a所示,衍射深度神经网络由多个透射(或反射)层组成,每一层上的每一个点(可以理解为尺寸较大的像素,如300um尺寸,它也可以更小,从而增大单位面积上的像素数,即增加网络的复杂性)都是一个神经元(具体物理原理是,下一层的任一神经元所接收的光场是上一层每一个神经元所传递的带有不同权重的相干球面子波的线性叠加。这个权重由衍射理论决定,求解过程使用角谱法求解)。这个神经元具有复数值的透射(或反射)系数。每层的这些透射/反射系数通过在计算机上使用深度学习的方法训练得到。然后由3D打印制造出每一层,用于以光速执行特定的任务。图1b是用于分类任务的衍射深度神经网络,图1c是用于成像任务的衍射深度神经网络。图1d是衍射深度神经网络与传统神经网络之间的比较。衍射深度神经网络是乘性偏置项,即每一层每一个像素的调制系数,衍射深度神经网络的权重基于自由空间衍射传播,电子神经网络是指在计算机中虚拟实现的传统神经网络。


(2) 物理实现。衍射深度神经网络在计算机上训练完成后,需要3D打印的网络层的3D模型用泊松表面重建(Poisson surface reconstruction,此法可以获得较为平滑的表面模型,对噪声有一定容忍度,是表面重建领域的主流方法)生成。最终,神经元的相位值在物理实现上转化为这个神经元的物理厚度,3D打印材料使用VeroBlackPlus RGD875。Meshlab软件用于计算3D结构,并将其作为3D打印机(Objet30 Pro 3D, Stratasys Ltd, USA)的输入。如图2A和B是训练出的网络层及其3D打印的实物。图2C和D是实验用太赫兹装置。


(3) 网络训练。如图3A,使用TensorFlow框架训练网络结构。因为使用相干照明,输入信息可以在输入平面被振幅和/或相位编码。自由空间传播模块使用衍射计算中常用的角谱法完成。为了便于网络的3D打印和加工,每一个神经元的相位值被sigmoid函数限制在0-2π(成像任务)和0-π(分类任务)。每一层的神经元大小设为400um(分类任务)和300um(成像任务)。如果使用更高精度的3D打印机或加工方法,可以使用更小的神经元来学习更复杂的任务。在探测器/输出平面,测量网络的输出强度,用其与Ground Truth之间的均方根误差作为损失函数,来训练网络。使用Adam优化器来反向传播误差,并更新网络的每一层,从而最小化损失函数。


附录:

(1) 前向传播模型

由上一层坐标为(xi,yi,zi)的神经元到下一层坐标为(x,y,z)的神经元,子波传输的光学模型为(L的小写字母l代表第l层)

其中

每个神经元的透射系数可以表示为

每一神经元接收到的子波叠加光场为

因此,第l层第i个神经元的输出光场是其接收光场与透射系数和子波传递光学模型的乘积,可以写为

将(2)简写为

p代表下一层的第p个神经元。

第0层

最终检测到的输出平面测量值为

(2)误差反向传播

使用输出平面的测量强度值和目标的均方根误差作为损失函数

要求解的优化问题为

计算损失函数相对于所有可训练网络变量的梯度,然后用于在训练阶段的每个周期更新网络层。


参考文献:X. Lin, Y. Rivenson, N. T. Yardimci, M. Veli, Y. Luo, M. Jarrahi, A. Ozcan, All-optical machine learning using diffractive deep neural networks. Science 361, 1004–1008 (2018).

DOI:https://www.science.org/doi/abs/10.1126/science.aat8084


关于昊量光电:

上海昊量光电设备有限公司是国内知名光电产品专业代理商,代理品牌均处于相关领域的发展前沿;产品包括各类激光器、光电调制器、光学测量设备、精密光学元件等,涉及应用领域涵盖了材料加工、光通讯、生物医疗、科学研究、国防及更细分的前沿市场如量子光学、生物显微、物联传感、精密加工、先进激光制造等;可为客户提供完整的设备安装,培训,硬件开发,软件开发,系统集成等优质服务。


您可以通过昊量光电的官方网站www.auniontech.com了解更多的产品信息,或直接来电咨询4006-888-532。


本文章经光学前沿授权转载,商业转载请联系获得授权。