文章来自民众号:量子位 (ID:QbitAI),作者:鱼羊、晓查,原标题为:《40纳秒完成图像分类,速率提升几十万倍,图像传感器自带神经网络登上Nature》,题图来自:影戏《人工智能》
AI芯片还可以怎么搞?最新登上Nature的研究带来新启发。
已往,我们做图像分类都是分成好几步:先用传感器网络图像模拟信号,数模转换后再交给盘算机处置。整个历程既耗能又费时,就像眼睛把图像传给大脑。
试想一下,若是人类眼睛可以直接处置图像——不用劳烦大脑,那视觉图像信息的处置速率岂不是可以大大提升?
今天,Nature这篇新研究开拓性在于,直接让“眼睛”处置图像,而且效果反馈也相当震撼:行使新感光元件,仅仅40纳秒即可完成图像分类,比交给盘算机处置快了几十万倍。
真是不得了。
一、光电二极管网络
焦点来说,研究团队在芯片上构建了一个光电二极管网络,并选择2D半导体二硒化钨(WSe2)作为光敏质料。
单个二硒化钨光电二极管示意图
光电二极管阵列由27个具有优越平均性、可调性和线性度的检测器组成,排列为3×3的成像阵列,像素巨细约为17×17μm,每个像素由3个二硒化钨光电二极管(子像素)组成,其对光的响应度可以通过栅极电压调治。
也就是说,可以通过改变施加的电压来调治半导体对光的响应,从而调治每个二极管的灵敏度。
现实上,这就将光电传感器网络变成了神经网络,将光学传感和神经形态盘算结合起来,使其能够执行简朴的盘算义务。
改变二极管的灵敏度,就相当于改变神经网络中的权重。
二、把权重放在传感器上
与其他神经差别的是,这套系统的权重不是存在盘算机的内存和硬盘里,而是直接集成在图像传感器上。
实验中使用的有硒化钨光电二极管制成的特殊门电路。它的特殊就在于可以调制,相当于神经网络的训练。
随着外接偏置电压的差别,二极管对光线的敏感水平也差别,即是将网络的训练效果直接放在传感器端。
之前的神经网络都是将训练权重存储在外部存储器上,通过电路发送到每个检测器件上。
就像电脑的内存,断电后就会丢失存储信息。
而这一套装备,更像是硬盘,纵然掉电后也能将权重信息存储下来。
研究人员将调制的电极也就是浮栅(floating gate)埋在氮化硼绝缘层中,一最先先对氧化铝绝缘层中的栅极加上电压,接着撤去外部电压。
浮栅依旧能在接下来的2300秒内维持对光电二极管的调制,直到改变外部偏置电压为止。
研究人员用这种方式实现了两种类型的神经网络:分类器和自动编码器。
在分类器中,光电二极管阵列、芯片感知器以及在芯片外的非线性激活函数一起运行。这种类型的神经代表一种监视学习算法,该算法能够将输入图像P分为差别的输出种别y。
现实效果若何呢?他们3×3像素制作了一组“简陋”的字母,分别是n、v、z。
图像传感器经过训练后,只需丈量对应电路的电流是否为0,就能知道是哪个字母。
通过电压随时间的变化图可以看出,当传感器接受到图像40ns后,n和v两种输入发生的电压最先泛起伟大的差异,约100ns后差异到达最大。
第二种神经网络是自动编码器,可以在无监视的训练历程中学习输入图像P的有用示意。它与解码器一起使用,对解码器举行训练后,就可以在其输出中重现图像。
编码器由光电二极管阵列自己组成,解码器由外部电子器件组成。
在这个历程中,图像的传输数据得到了压缩。
三、潜力伟大,但仍需大量后续研究
40纳秒就分辨出了两张差别的图像,AI视觉好像朝着人类大脑的效率更进一步。
但需要说明的是:这一令人兴奋的新手艺,距离现实应用,另有很长的路要走。
首先,由于光电二极管阵列仅由27个检测器组成,最大只能处置3×3的图像。
其次,想要真正应用于自动驾驶和机器人手艺,视觉系统需要捕捉具有广漠视野的三维动态图像和视频。而现在,该手艺是将3D视觉信息转换成2D来处置,丢失了运动信息和深度。
其图像传感器阵列的平面形状,也限制了广角相机的能力。
此外,凭据Nature的报道,论文中形貌的装备很难在幽暗光线下成像。而且,其设计需要高电压和大功率,相比之下,生物神经网络中每项操作消耗的能量仅为10-15到10-13焦耳。
从工艺角度上讲,芯片所接纳的薄半导体现在很难大面积生产加工。
而且,只管图像传感器兼具了采集和盘算功效,减少了模数转换,但外部电路仍然存在固有延迟问题,照样会影响整个系统的等待时间。
不外,虽然另有很大的研究空间,在传感器中盘算的相关研究,推动了AI硬件的进一步生长。而这样的研究思绪,也不仅仅局限于盘算机视觉,可以扩展到听觉、触觉等其他物理输入中。
四、其他实验
人们对快速处置图像信息的要求越来越高,许多科学家都在研究在输入端处置图像的方式。
最近来自荷兰和美国学者也发明晰一种在传感器端直接处置图像的方式。
不外他们不是输出图像的分类,而是输出图像的边缘,这对于目的检测和语义支解有主要的意义。
他们在传感器前方加入了一个“超外面”:不到半毫米厚的蓝宝石薄片,镀上206 nm厚、142 nm高、间距300 nm的硅长条。
把它放置在CCD感光芯片的外面上时,超外面的作用就像一个透镜,光线只能以陡峭的角度射向它,而过滤掉入射角很小的光。
图像的特征是由差别光波的组合而成,滤除了光波携带的其他细节,仅留下了较尖锐的分量,例如人脸的边缘,而不是单色的靠山。
整个历程仅需要150纳秒的时间,而交给盘算机处置需要几毫秒,二者相差4个数量级。
五、研究团队
最后先容下研究团队,来自奥地利维也纳工业大学的Unterrainer group。
论文一作:Lukas Mennel,是电气工程与光子学专业在读博士,曾作为访问学者赴MIT交流学习,研究量子光子学。
Lukas Mennel
论文的另一位通讯作者,是维也纳工业大学副教授Thoms Mueller——托马斯·穆勒,虽然不知道这位托马斯·穆勒擅不善于踢足球,但在2D质料科学领域,穆勒教授的研究涵盖基础研究、光电装备、电子集成电路、光子集成电路等,亦是卓有成就。
Thoms Mueller
论文地址:https://www.nature.com/articles/s41586-020-2038-x
文章来自民众号:量子位 (ID:QbitAI),作者:鱼羊、晓查。
版权保护: 本文由 原创,转载请保留链接: http://www.allart.com.cn//html/2020/0306/1140.html
- 上一篇:口罩“荒”背后的疯狂生意
- 下一篇:华宇注册链接_远古未知病毒来了,我们需要忧郁