【导读】于现今计较技能快速成长的海潮中,模仿计较作为一种怪异的计较范式,正日趋彰显其独有的吸引力与潜力。与依靠离散数字旌旗灯号的传统数字计较差别,模仿计较直接应用物理定律,借助持续变化的物理量(如电压、电流等)来完成计较使命。这类计较方式于能效及速率上具备较着上风,由于它绕过了数字计较中繁琐的数模转换步调,可以或许更直接、高效地处置惩罚信息。最近几年来,跟着人工智能硬件范畴的迅速鼓起,模仿计较依附其高效能特征,遭到了广泛的存眷及深切研究。
于模仿计较的广泛领域内,模仿存内计较作为一项新兴技能,已经成为当前研究的热门。其焦点理念是将计较与数据存储深度交融,直接于存储单位内部完成计较操作,从而年夜幅削减数据于存储与计较单位之间的搬运次数,显著晋升了计较效率并降低了能耗。这类计较模式特别合适需要处置惩罚海量数据的运用场景,如神经收集推理及图象处置惩罚等,为人工智能硬件的成长斥地了新的路径。然而,只管模仿计较与模仿存内计较具有诸多长处,今朝仍遍及面对计较精度不高、不变性不足的挑战。这重要是由于现有模仿硬件方案高度依靠在器件自己的物理参数(如电阻值),而这些参数于编程历程中往往存于较年夜的随机误差,且轻易受温度等情况因素滋扰。上述特征限定了模仿计较精度的晋升,成为制约实在际运用的要害瓶颈。
近来,南京年夜学物理学院缪峰传授与梁世军传授课题组针对于这一难题,提出了一种高精度模仿计较方案,为模仿存内计较范畴带来了主要冲破。该方案将模仿计较权重的实现方式,从易受滋扰、不不变的物理参数(如器件电阻)转向高度不变的器件几何尺寸比例,从而冲破了制约模仿计较精度的重要障碍。
基在这一立异思绪,研究团队设计并验证了一款采用尺度CMOS工艺的模仿存内计较芯片。联合权重重映照技能,该芯片于并行向量-矩阵乘法运算中实现了仅0.101%的均方根偏差,创造了模仿向量-矩阵乘法运算精度的最高纪录。值患上一提的是,该芯片于-78.5°C及180°C的极度温度前提下仍能不变事情,矩阵计较的均方根偏差别离连结于0.155%及0.130%,显示出于极度情况下维持高计较精度的卓着能力。此外,该方案还有可适配多种二值存储介质,具有广泛的运用远景。
本研究的焦点思绪是将模仿计较权重的实现基础从器件参数转向器件的几何比例(图1A),使用器件几何比例于制备完成后高度不变的特征,实现高精度计较(图1B)。基在该思绪,团队经由过程电路拓扑设计,联合存储单位及开关器件,构建了可编程的计较单位(图1C)。该单位经由过程两级依靠尺寸比例的电流拷贝电路,实现输入电流与8比特权重的乘法运算:第一级的几何比例由8位存储器节制;第二级为固定比例,为差别列上的第一级输出电流付与对于应的二进制权重。两级配合作用,决议了计较单位的总体等效比例,从而实现权重可编程的模仿乘法运算。经由过程将这些计较单位以阵列情势排布,团队乐成设计出一款高精度电流域向量-矩阵乘法芯片(图1D)。
图1:高精度模仿计较方案与电路布局。(A) 观点示用意。本方案使用器件的物理尺寸决议模仿旌旗灯号的运算瓜葛。(B) 实现效果示用意。使用器件物理尺寸的不变性,本方案可实现逾越传统方案的计较精度。(C) 计较单位道理图。经由过程两级依靠尺寸比例的电流拷贝电路设计,联合存储单位及开关器件,构建了等效尺寸比例可编程的计较单位,实现输入电流与8比特权重的模仿乘法运算。(D) 计较阵列道理图。经由过程阵列化排布计较单位,设计高精度电流域向量-矩阵乘法芯片。
随后,研究团队基在180nm CMOS工艺对于该方案举行了流片验证。芯片照片与测试电路如图2A所示。团队经由过程履行多轮随机向量-矩阵乘法,周全测试了芯片的计较精度。测试所用矩阵范围为64×32(图2B),由4块芯片配合构成。同时,团队提出了一种权重重映照要领(图2C),可以或许充实使用器件尺寸比例的不变性,进一步提高芯片的计较精度。于1500次随机向量-矩阵乘法试验中,芯片的现实输出成果与理论值险些彻底吻合(图2D),显示出极高的计较精度。进一步的统计阐发注解,芯片计较相对于偏差的均方根仅为0.101%(图2E),刷新了模仿计较范畴的最高精度纪录。与其他进步前辈模仿计较方案比拟,本芯片的计较精度显著晋升(图2F)。
图2:高精度模仿向量-矩阵乘法测试。(A) 芯片及测试电路照片。(B) 模仿向量-矩阵乘法精度测试电路道理图。(C) 权值重映照要领示用意。该要领能进一步提高芯片计较精度。(D) 1500组随机向量-矩阵乘法成果。抱负输出与现实输出险些重合。(E) 归一化计较偏差的漫衍图,统计患上其均方根仅为0.101%。(F) 本芯片与其他进步前辈模仿计较方案的精度对于比。
该芯片所具有的超高模仿向量-矩阵乘法精度,使其于现实使命中体现卓着。研究团队起首测试了芯片于神经收集推理使命中的效果:使用该高精度模仿存算芯片履行图3A所示神经收集中的所有卷积层及全毗连层运算,于MNIST测试集上的辨认正确率到达97.97%(图3C),与64位浮点精度下的软件辨认成果相近(仅相差-0.49%),并显著优在传统模仿计较硬件(晋升+3.82%)。进一步,团队评估了芯片于科学计较中的体现,使用该芯片求解纳维–斯托克斯方程以模仿流体流动举动。试验成果显示,芯片计较获得的流体运动状况(图3D)与64位浮点精度下的软件成果高度一致(图3E),而传统低精度模仿计较硬件于不异使命中则没法患上出准确成果(图3F)。
图3:高精度模仿计较芯片的运用体现。(A) 神经收集布局与数据集。(B) 于MNIST测试集上辨认成果的混合矩阵,辨认率到达97.97%。(C) 正确率对于比。高精度模仿计较芯片测试成果与64位浮点精度下的软件辨认率相近(-0.49%),显著优在传统模仿计较硬件(+3.82%)。(D) 高精度模仿计较芯片求解纳维–斯托克斯方程获得的流体举动猜测成果。(E) 64位浮点精度下的软件计较成果,本芯片成果与其高度一致。(F) 低精度模仿计较硬件的成果没法正确反应流体举动。
研究团队不仅验证了该模仿存算芯片的超高计较精度,还有测试了其于极度情况下连结计较精度的鲁棒性。即便于外部情况变化的环境下,器件的几何比例仍能连结恒定,使芯片于极度前提下依然维持较高的计较精度。团队于-78.5℃及180℃的情况下履行模仿向量-矩阵乘法测试,测患上相对于偏差的均方根别离仅为0.155%及0.130%(图4A、B)。于更宽温度规模(-173.15℃至286.85℃)的测试中,芯片焦点单位的输出电流相对于在常温前提的最年夜误差仅为1.47%(图4C-F)。此外,团队还有于强磁场情况(最高10T)中对于芯片输出电流举行了丈量,成果显示,芯片焦点单位的输出电流相较在无磁场前提的变化不跨越0.21%(图4G-J)。以上成果充实证实了该高精度模仿计较方案于极度情况下的靠得住性。
图4:高精度模仿计较芯片的鲁棒性测试。(A) 低温下(-78.5℃)芯片的向量-矩阵乘法精度测试成果。测患上芯片输出的相对于偏差均方根为0.155%。(B) 高温下(180℃)芯片的向量-矩阵乘法精度测试成果。测患上芯片输出的相对于偏差均方根为0.130%。(C) 将芯片焦点单位置在更宽温区(-173.15℃至286.85℃)举行测试的示用意。(D)-(F) 宽温区下的输出电流丈量成果。相对于在常温前提,输出电流误差不跨越1.47%。(G) 将芯片焦点单位置在强磁场(最高10T)下举行精度测试的示用意。(H)-(J) 强磁场下的输出电流丈量成果。相对于在零磁场前提,输出电流误差不跨越0.21%。
相干研究结果以“Ultrahigh-precision analog computing using memory-switching geometric ratio of transistors”(基在器件尺寸比例不变性的超高精度模仿计较方案)为题,在2025年9月12日发表于学术期刊《Science Advances》上。
-南宫NG·28(中国)相信品牌力量