综合新闻

当前位置 :首页>新闻动态

深港微电子学院副院长余浩教授在CCF中国计算机科学技术发展报告上进行趋势分享

2021-11-17 综合新闻 浏览量:314

近日,南方科技大学深港微电子学院副院长余浩教授的《智能感知的边缘计算芯片的研究进展与发展趋势》被CCF 2020-2021中国计算机科学技术发展报告采录。这是CCF学术工作委员会遴选出的具有代表性的14篇高水平报告之一。

中国计算机学会(CCF)是全国一级学会,独立社团法人,中国科学技术协会成员,是中国计算机及相关领域最有影响的学术团体。CCF年度中国计算机科学技术发展报告为CCF非常重要的年度总结报告,包含体系结构、计算机视觉、理论计算机科学、信息系统、网络与数据通信等方向的报告,从碳中和体系结构、视觉-语言交互技术、生物信息学组合优化、新一代知识图谱信息系统、Sketch驱动的网络测量等多角度阐述了不断创新的主题,详细介绍了相应研究方向的现状、国内研究进展、国内外研究进展对比、发展趋势以及各自的创新见解等。

2021111701.png

《智能感知的边缘计算芯片的研究进展与发展趋势》从当前边缘计算芯片研究的三个基本问题:感算共融架构的一体化处理问题、深度神经网络的简化优化问题与深度神经网络加速器架构低能效问题入手进行阐述,总结近年来国内外相关研究进展,并对国内外研究现状进行分析与比较,针对目前业内可行性方向给出发展趋势的总结与展望。

1. 感算共融架构的一体化处理问题:针对感知和计算的分立设计方案存在的输出和数据转换接口代价,国内外提出多种感算共融智能架构,包括多维度可扩展的“传感-计算”系统,高能效“传感+存算一体”混合信号集成实现。并且针对共融架构,面向硬件部署的算法优化、容错架构设计、模拟电路可靠性设计和感知校准方法需要深入探讨从而解决混合信号共融架构和电路的多种非理想因素,提升低功耗智能芯片的性能和可靠性;

2.深度神经网络的简化优化问题:在许多机器学习的应用场景中,深度神经网络的部署受到延迟、能量消耗和模型大小的约束,特别是在一些计算能力相对较弱的边缘设备上。为了解决这个问题,国内外提出多种针对于神经网络压缩和加速的方法,包括神经网络剪枝,权重矩阵低秩分解,权重量化等。并且最新研究趋势是基于面向网络架构自动优化(NAS)的优化方案,通过对自定义搜索空间内的网络结构和超参数进行寻优,使得自动生成的网络模型比人工设计的模型性能更佳;

3. 深度神经网络加速器架构低能效问题:CNN中组成部分是卷积(conv)层和全连接(FC)层,在训练和推理过程中,这两个层主要需要的运算操作是乘加运算和数据存取,这些运算操作决定了硬件消耗和延迟。为了实现芯片的高通量和低能耗,国内外研究通过数据流优化,系统架构和多精度支持等方面提出可行性方案。数据流方案中通过多种数据复用方式,包括权重复用、输入复用和输出复用等,根据不同网络的特性选用不同的复用方式进行数据流的功耗优化和通量提升;在系统架构方面,特定于AI的计算系统(即AI加速器)通常由大量高度并行的计算和存储单元构成这些单元以二维方式组织,以支持神经网络相关运算,片上网络(NoC)、脉动阵列、张量运算单元以及存内计算等方案分别从网络适配、数据复用和降低数据传输延迟功耗等方向对加速器进行定制化性能优化;在多精度支持方面,为了支持逐层比特优化的神经网络,目前已经有多种采用串行累加,并行组合以及一体化运算等方案,从运算单元或阵列系统的角度进行多精度运算支持,从而实现软硬件的协同优化设计。

文章也给出了深度神经网络加速器架构未来发展方向。随着网络模型的复杂度增加,对于芯片计算能力的要求越来越高,CPU/GPU的通用性虽然更好,但是其计算效率低下。目前专用于深度神经网络处理的芯片虽然计算效率上更有优势,但是其通用性不够强,因此,在未来的人工智能芯片设计的发展上,可重构智能将会是一个重要的趋势。由于在处理深度神经网络的过程中需要大量的数据搬移,传统的冯诺依曼架构“内存墙”的问题日益突出,因此未来存算一体也将会是智能芯片设计的一大趋势。在国家“十四五”规划纲要中,在加强原创性引领性科技攻关方面,“先进存储技术”被列入“科技前沿领域公关”重点领域。传统存储器邻域,先进技术长期掌握在美国,韩国和日本等国家;而在ReRAM等新型存储器的发展上,中国于其他国家站在同一起跑线上,有机会诞生下一海力士和美光。

2021111702.png

图.  基于网络架构自动搜索的多精度存算一体感知加速器 


相关内容

  • 综合新闻
  • 科研新闻
  • 通知公告
  • 学术讲座