首页 > AIGC > 人工智能预制模型是什么意思-人工智能模型:测量“力量”只有快
2023
08-14

人工智能预制模型是什么意思-人工智能模型:测量“力量”只有快

随着集成电路技术的不断发展,芯片的规模越来越大,集成度越来越高。 同时,在设计和使用芯片时,了解和管理其功耗变得越来越重要。

为了管理芯片在设计或使用过程中的功耗,杜克大学电子与计算机工程系教授、计算进化智能实验室联席主任陈怡然团队开发了一种新的人工智能模型- 阿波罗(APOLLO)。 该模型每秒可在硬件上执行数十亿次计算,理论上可用于预测任何类型计算机处理器 (CPU) 的功耗,而只需极少的额外硬件开销。 它提高了处理器效率并有助于开发新的微处理器,其性能已在高性能微处理器上得到验证。

日前,相关成果在第54届IEEE/ACM微架构国际年会(MICRO-54)上发布,并荣获本届唯一的“最佳论文奖”。

电源管理大问题

在现代计算机处理器中,每秒可以执行数十亿次计算。 随着晶体管密度和时钟频率的急剧增加,功耗也急剧增加。

功耗越大,芯片发热的速度就越快。 如果热量不及时散发,设备的温度就会升高,从而导致设备无法正常工作甚至损坏。 同时,芯片内部的功耗和电流需求突然波动,会导致内部电磁问题,从而影响处理器的速度。 此外,高功耗产生的热量也对封装和冷却系统提出了更高的要求。 因此,电源管理成为贯穿芯片设计和使用全过程的问题。

“CPU的运行涉及到很多信号,其功耗每时每刻都在变化。” 论文第一作者、陈怡然团队成员谢志尧告诉《中国科学报》,“因此,研究人员需要对功耗有很好的了解,才能设计出更好的CPU人工智能预制模型是什么意思,从而它可以发挥其最佳功能。”

在设计芯片时,设计工程师通常依赖行业标准的功耗分析工具。 例如,计算基于各个信号网络的切换以及这些网络驱动的电容负载。 “人们想知道一块芯片的功耗,通常的方法是模拟。这种方法比较准确,但缺点是计算成本非常高。” 谢志尧解释说,“仿真方法有很多,相关的仿真软件技术也很成熟,但仿真速度慢,不能满足人们掌握芯片瞬时功耗的需求。”

实际应用中,CPU需要运行各种程序,每个程序对应的功耗是不同的; 即使运行同一个程序,不同时刻芯片的功耗也会发生瞬时变化。 CPU设计制造出来后,如果新场景的实际功耗远高于预先设计的场景,就可能出现问题。 然而,详细掌握芯片在不同工作状态下的实时功耗并不容易。

“过去20年来,功耗模型被反复研究,但准确、快速、低成本、自动化的功耗分析仍然难以实现。” 陈怡然告诉《中国科学报》,“由于很多功耗模型都是由工程师针对某款CPU进行手动调试,造成巨大的人力成本。同时,随着CPU设计的日益复杂,它也变得越来越复杂。”很难手动设计准确的功耗模型。”

因“简”而快

“这个方法的核心是一个非常简洁的功耗模型。” 谢智尧说道,“与之前的模拟计算不同,我们的模型不是进行精确的模拟,而是进行快速的估计。”

处理器工作时,芯片中涉及数百万个关键信号。 通过人工智能技术,模型自动选择与功耗最相关的极少量(约100个)CPU信号输入,然后建立快速线性模型。 用于预测或监控每个周期的功耗。

“这100个典型信号可以形成一个‘轻量级’、非常简洁的功耗模型。” 谢志尧强调,“而且,信号选择(不是随机提取)是人工智能自动完成的,这让工程师摆脱了依赖,使模型的计算速度大大提高。”

当CPU运行时,人们会控制功耗。 如果功耗太高,他们必须找到降低功耗的方法。 事实上,工程师们也积累了很多降低功耗的方法,但这一切都需要一个前提,即人们能够快速、准确地掌握芯片功耗的瞬时变化。

不幸的是表情包设计,在计算功耗时,工程师常常面临一个无法跨越的时间“窗口”。 例如,以前的功耗模型可以每毫秒计算一次,只能估计 1 毫秒的平均功耗。

除了自动完成信号选择和模型训练之外,Apollo 的训练数据也是通过算法自动生成的,这使得它成为可能,因为它的“简化”。

论文显示,Apollo 可以在几分钟内获得数千万个时钟周期的功耗,而传统的基于仿真器的工业方法需要长达两周的时间。 在准确率方面,Apollo也能达到90%~95%。 此外,Apollo的功耗分析可以精确到每个时钟周期人工智能预制模型是什么意思,以前任何方法都没有在这个速度下获得如此高分辨率的功耗分析。

“每毫秒计算一次的时间分辨率是不够的,因为在1毫秒内,功耗可能前半段很低,后半段很高。虽然我们计算了功耗值,但并不能反映实际情况。”处理器的真实工作状态。” 谢志尧补充道,“我们的模型可以控制在0.3纳秒(0.000001毫秒)以内,即每0.3纳秒可以计算出实时功耗值。”

非常接近应用

由于之前无法获知处理器的实时功耗,工程师在设计芯片时往往会为功耗设计一定的余量,以避免应用中功耗波动的影响。

现在,Apollo可以在很短的时间内反馈芯片内部的实时功耗变化。 即使芯片内部由于复杂的交互作用而出现快速的电压波动,工程师也可以及时采取措施来管理CPU功耗和温度,从而发挥CPU的最佳性能并确保其稳定运行。

“因为Apollo非常简单,它的成本和面积都非常小(约为CPU芯片面积的0.2%),因此可以做成硬件并集成到芯片中。” 谢志尧说,“这样,在使用过程中,一旦检测到处理器功耗发生异常变化,我们就可以让它采取一些自我调节措施,以降低功耗。”

如果在设计芯片时加入这样的电源管理模块,不仅可以提高性能,还可以保证其运行的稳定性。

在这项研究中,ARM提供了很多帮助。 目前该模型已在ARM多款高性能商用处理器上得到验证,呈现出相对领先的芯片性能。

“这不是一个纯粹的理论研究,而是具有非常强的工程研究特征,或者是可以应用到产品中的研究。” 陈怡然表示,“模型在商业应用之前,可能需要在更多平台上进行测试和综合评估。至于最终能否落地、何时能成为产品卡通人物,会受到很多因素的影响,还需要一段时间。”是时候证明了。”

记者 张双虎

最后编辑:
作者:nuanquewen
吉祥物设计/卡通ip设计/卡通人物设计/卡通形象设计/表情包设计