作为通用计算的加速神器,高端GPU正在成为大型数据中心,人工智能,超级计算等领域的迫切需求英伟达在高端GPU市场长期占据主导地位,市场份额一度超过90%目前国内企业要突破英伟达等国外公司的垄断还有很长的路要走,但国内基于架构创新的DSA芯片产品日益丰富,可能会带来一些曙光
高端GPU和传统GPU的应用路径截然不同
90年代,PlayStation等游戏机的发布和彩色显示器的出现,催生了3D游戏的萌芽当时的3D制作主要依靠电脑的CPU,计算任务需要串行排队,难以满足提升游戏质量的需求Nvidia的GeForce256为市场带来了GPU的概念此后,光线追踪等图形和图像处理任务由专用芯片承担,不仅提高了3D图像质量,还提高了计算机的整体效率
伴随着超级计算等高并发计算需求的不断增加,GPU用于计算任务的可能性引起了业界的关注英伟达首席科学家大卫·柯克认为,GPU的浮点运算和并行计算能力不应局限于图像渲染在他的倡导下,英伟达推出了GPGPU,目标是将GPU从专用计算芯片提升到通用计算处理器,并于2006年发布了并行编程模型CUDA
由于GPGPU专注于高性能计算能力,所以往往被业界和市场称为高端GPU,开发出一条与传统GPU截然不同的应用路径随缘科技产品市场部总监陈超向《中国电子报》记者指出,传统GPU侧重于图像学,关注帧数,渲染保真度,对真实场景的映射程度等指标,主要用于运行游戏,专业图像处理,加密货币处理等场景高端GPU是用于计算加速的芯片产品,专注于基础科学等超级计算领域和训练,推理等大规模人工智能计算场景
高端GPU不涉及消费级GPU,纯粹用于计算加速早期高端GPU用于超算等高性能计算场景,真正蓬勃发展,大规模产生了一些商业行为人工智能的快速发展产生强大的计算能力需求后,GPU被广泛应用于人工智能场景,尤其是人工智能训练陈超向记者指出
不同的目标有不同的指标,高端GPU有不同于传统GPU的关注点昆仑芯科技CEO业务助理宋告诉《中国电子报》记者,衡量高端GPU的主要维度是通用性,易用性和高性能通用硬件架构应该足够灵活,以适应人工智能的迭代算法和场景易用性是指开发门槛更低,开发者更容易上手,结合实际场景进行定制化开发高性能是指芯片产品的基本性能和性价比必须达到国际先进水平,才能进行市场开拓
计算能力往往是市场对GPU性能的第一印象但高端GPU的性能不等于纸张,尤其不能用单一性能的纸张数据来衡量
在实际使用过程中,GPU的通用性,易用性和实用性远比纸上标注的计算能力单一性能更重要论文指标再高,也要注意内存和带宽是否够用,芯片之间的互联是否很好解决以单一的性能来衡量一个GPU是否高端,这是一个常见的错误
最后,开发人员通过软件界面感知和使用硬件的性能动力科技GPU项目总监何颖告诉《中国电子报》记者,高端GPU设计的计算能力需要特别优化的驱动和加速库只有软硬件的配合,高端GPU的计算能力才能真正应用到实际场景中
高性能计算将是主要的竞技场
长期以来,英伟达一直主导着高端GPU市场,市场份额超过90%,尤其是在人工智能计算领域市场优势的建立归功于NVIDIA GPU产品能力的平衡和生态的改善
Nvidia在通用性,易用性和高性能三个方面是平衡的此外,英伟达在每一代架构上都进行了创新,这为软件承担大型模型训练和推理场景中的人工智能计算提供了硬件基础
人工智能对生态的要求非常高,涉及框架,应用,模型适配等英伟达基于CUDA生态,率先打通上下游对于下游的算法开发者和服务提供商来说,其GPU在保持易用性的同时,在性能上具有优势陈超说
作为全球第二大独立GPU供应商,AMD虽然在高端GPU整体份额上与英伟达有差距,但在超级计算领域大有作为。
AMD在超级计算机领域的出色表现,是基于有针对性的软硬件设计基于CDNA2架构的GPU加速器,ROCm软件平台和开源应用资源中心AMD Infinity Hub的结合,为研究人员构成了更加友好的硬件性能和编程环境
超级计算涉及许多科学研究和探索性质的计算任务AMD的开源软件模式为科学家探索新的计算方法提供了更多的可能性和便利陈超说
但是高性能计算和AI计算不能等同于GPU陈超指出,高性能和人工智能计算本质上有四个基本要求一是高精度,尤其是高性能计算,对FP64双精度浮点的需求很高,二是高性能,以满足巨大数据量的信息处理要求,第三,并发计算,大大缩短了信息处理的全过程延迟,第四,软件易于使用,可以支持更广泛的应用场景,易于编程和开发
虽然直接使用GPU进行高性能或AI计算更方便,但上层应用降本增效的核心需求对下层计算能力提出了更高的要求国外AI创业公司推出的AI芯片往往基于一种新的架构,全面提升并侧重优化并行计算能力国内领先的AI芯片公司也出于同样的考虑,推出了一系列基于DSA架构的人工智能计算芯片陈超说
在国内市场,基于架构创新的DSA芯片产品日益丰富比如华为自研的面向AI计算的架构特色达芬奇,昆仑芯科推出的第一代架构XPU—K和第二代架构XPU—R,随缘科技的自研架构GCU—卡拉等,都已经进入规模落地阶段
架构和软件是攻克高端GPU的核心要素。
无论是高端GPU,还是以优化并行计算效率为核心的各类DSA芯片,都具有技术,人才,资金密集的特点,研发难度不可小觑。
采访中,三位受访者都表示,架构设计是攻克高端GPU的核心要素。
建筑设计的具体难点是什么首先是各种能力的平衡宋说,建筑设计的通用性,易用性和高性能构成了不可能的三位一体如果优先考虑通用性,把所有场景都考虑进去,那么在某个场景下就很难进行足够的定制来提供更高的性能如果找到一条兼顾通用性和高性能的路径,那将是架构创新的大跨度,将是生态再造,可用性将受到很大影响
在建筑设计的过程中,一方面注意在这个‘不可能的三位一体’中尽可能平衡哪些匠心,另一方面,要充分了解市场和客户的需求了解这些情况后,我们才能设计出合理,平衡,以需求为导向的架构宋对记者说
其次,指令集设计指令集是硬件的灵魂指令集的效率是多还是少,对芯片架构和微架构有很大的影响陈超说
此外,架构设计对芯片公司了解产业链,积累技术提出了更高的要求。
在硬件架构层面,高端GPU的构成极其复杂,涉及到先进工艺层面的VLSI设计头部公司积累了大量的专利,为后来者构筑了极高的技术壁垒何颖说
高端GPU的另一个门槛是软件生态可以说软件决定了GPU生态的能力极限,也是硬件能力充分释放和灵活调度的必要条件
高端GPU需要厂商提供高度优化的驱动,以及各种加速库和相关文档,以支持用户复杂的使用场景此外,最终用户需要供应商提供强大的工具来帮助进行问题诊断和性能调整何英说
在硬件设计和软件栈构建的基础上,还要考虑芯片的工程实现陈超表示,高端计算芯片对计算能力性能要求极高,往往采用最先进的工艺和封装技术运行时钟的频率也很高,需要考虑功耗对环境和运行可靠性的影响同时也要考虑芯片的生产良率
良品率直接影响高端GPU的成本,最终会体现在消费端,影响计算能力成本的高低因此,在高端GPU的产业化和商业化过程中,良品率是一个非常重要的因素陈超说
除了产业链本身,人才作为R&D的新生力量,也是高端GPU R&D水平的决定性因素国内专业对口人才相对匮乏,需要2~3年甚至更长的培养时间持续投入和资金支持我们非常重视国内外人才的积累,以确保R&D的基础和创新迭代的能力同时也有利于新一代的培养,进一步夯实人才基础何颖说
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。