时间:2024-07-19 来源:网络搜集 关于我们 0
11月6日,英特尔在北京举办的FPGA技术日活动中,发布了全球最大容量的全新FPGA:Stratix 10 GX 10M FPGA;同时宣布其革命性的开发工具-OneAPI,即将发布测试版,让开发人员可同时驾驭CPU、FPGA、GPU、AI 四种不同芯片。
史上最大FPGA:433亿晶体管,1020万逻辑门
Stratix® 10 GX 10M FPGA是英特尔Stratix®10系列最新产品,产品正式发布之前,已有多家客户收到样片,目前该款FPGA已正式量产!
英特尔 Stratix 10 GX 10MFPGA 拥有1020 万个逻辑单元,集成了433亿个晶体管,其密度约为Stratix 10 GX 1SG280 FPGA 的 3.7 倍,后者为原英特尔 Stratix10 系列中元件密度最高的设备。
之所以可以做到如此之大,是因为其利用英特尔独有的EMIB 封装技术,融合了两个高密度英特尔 Stratix 10 GX FPGA 核心逻辑晶片(每个晶片容量为 510 万个逻辑单元)以及相应的 I/O 单元(PCIe4.0、UPI互连单元等)。
英特尔的 EMIB 技术只是多项 IC 工艺技术、制造和封装创新中的一项,正是这些创新的存在,让英特尔得以设计、制造并交付目前世界上密度最高(代表计算能力)的FPGA。
根据芯片内封装的不同性能的功能小芯片,Stratix 10系列FPGA包括了SX、TX、MX、DX和GX不同型号。
GX FPGA没有集成Arm Core,PCIe4支持软IP,最大收发器速率28.3Gbps,可以看到相比更高性能的DX,GX定位于通用应用,主要被用于 ASICETTTT原型设计和仿真。
ASIC原型设计和仿真市场对当前最大容量的FPGA需求格外急切。有数家供应商提供商用现成(COTS) ASIC原型设计和仿真系统,对于这些供应商而言,能够将当前最大的FPGA 用于ASIC 仿真和原型设计系统中,就意味着获得了巨大的竞争优势。此外,包括英特尔在内的很多大型半导体公司都开发了自定义原型设计和仿真系统,并在流片前使用该系统来验证自身最大规模、最复杂、风险最高的ASSP 和SoC 设计。ASIC仿真和原型设计系统可以帮助设计团队大幅降低设计风险。因此,包括英特尔 Stratix10 FPGA 和更早的Stratix® III、StratixIV 和Stratix V 设备在内的英特尔 FPGA,十多年来一直被用做很多仿真和原型设计系统的基础设备。
ASIC 仿真和原型设计系统支持很多与IC 和系统开发相关的工作,包括: 使用真实硬件的算法开发芯片制造前的早期 SoC 软件开发RTOS 验证针对硬件和软件的极端条件测试连续设计迭代的回归测试仿真和原型设计系统旨在帮助半导体厂商在芯片制造前发现和避免代价高昂的软硬件设计缺陷,从而节省数百万美元。芯片在制造完成后修复硬件设计缺陷的成本要高得多,通常需要昂贵的重新设计费用。当设备制造出来并交付给终端客户,解决这些问题的成本甚至会更高。正因为风险如此之高,且有可能节省的费用如此之多,这些原型设计和仿真系统为IC 设计团队带来了实实在在的价值。仿真和原型设计系统的使用已经越来越普及,因为在经济风险如此之高的情况下,没有哪个设计团队负责人敢于忽视这项谨慎的验证性投资。使用最大型的FPGA,就能够在尽可能少的FPGA 设备中纳入大型ASIC、ASSP和SoC 设计。英特尔 Stratix10 GX 10M FPGA是用于此类应用的一系列大型FPGA 系列中的最新设备。该款全新的英特尔 Stratix10 FPGA 支持仿真和原型设计系统的开发,适用于耗用亿级ASIC 门的数字IC 设计。包含1020 万个逻辑单元的英特尔 Stratix10 GX 10M FPGA,现已支持英特尔®Quartus® Prime 软件套件。该套件采用新款专用IP,明确支持ASIC 仿真和原型设计。
英特尔 Stratix10 GX 10M FPGA 是第一款使用EMIB 技术并在逻辑和电气上将两个FPGA 构造晶片结合到一起的英特尔 FPGA,实现高达 1020 万个逻辑单元密度。在该设备上,数万个连接通过多颗EMIB 将两个FPGA 构造晶片进行连接,从而在两个单片FPGA 构造晶片之间形成高带宽连接。以前,英特尔使用了 EMIB 技术将 I/O 和内存单元连接到 FPGA 构造晶片,从而实现了英特尔 Stratix10 FPGA 家族的规模和种类不断扩张。例如,英特尔 Stratix10 MX 设备集成了8 GB 或16 GB的EMIB 相连的3D 堆叠HBM2 SRAM 单元。最近发布的英特尔 Stratix10 DX FPGA 则集成了EMIB 相连的P tile,具备PCIe 4.0 兼容能力。(参见:英特尔首款支持硬核PCIe Gen4 及超路径互连(UPI)FPGA量产出货!)
英特尔 Stratix10 DX FPGA 中使用的P tile是兼容PCIe 4.0 的PCI-SIG 系统集成设备清单中的首款组件级设备。最近发布的英特尔®Agilex™ FPGA 中也同样紧密集成了同款P tile,因而也能兼容PCIe 4.0 设备。英特尔 Stratix10 DX 和英特尔 AgilexFPGA 中使用的P tile是这一应用的又一绝佳范例,它展示了诸如EMIB的先进制造和生产技术,以及如何让英特尔将一系列新产品快速推向市场,并投入全面生产。或许更重要的是,用来制造英特尔 Stratix10 GX 10M FPGA 的半导体和封装技术,并不仅仅是为了制造世界上最大型的FPGA,这只是一个附加值,尽管相当重要,但并不是最重点。
oneAPI 即将发布测试版本,软件工程师也可以轻松驾驭FPGA
在昨天的活动日上,英特尔逻辑事业部副总裁宣布oneAPI将于11月下旬发布测试版。
早在去年12月,英特尔就推出了“oneAPI”,顾名思义,“oneAPI”的目的就是提供统一的编程模型,简化在不同硬件架构上的AI程序开发工作,让开发者用一套源代码创建适用于不同硬件的AI应用程序。
英特尔的产品覆盖的广泛计算架构包括标量(Scalar)、矢量(Vector)、矩阵(Matrix)和空间(Spatial),分别主要应用于CPU、GPU、AI加速器和FPGA产品。英特尔指出,在接下来五到十年中最重要的现代工作负载,就是这种标量、矢量、矩阵和空间架构的组合,英特尔称之为SVMS架构。英特尔的oneAPI,便是从软件层面来简化和统一跨SVMS架构的创新。
通过oneAPI,工程师将可以采用oneAPI所支持的并行C++语言,对这四种芯片进行编程,特别是对FPGA来说,现在软件工程师也可以轻松完成设计了。
会后英特尔FPGA和电源产品营销总裁Patrick Dorsey向EETOP记者解释道:oneAPI开发FPGA主要是采用并行C++语言来实现算法库的调用,这样会大大加快FPGA的开发时间,但是性能相比直接用RTL语言开发的要弱一些,大约相当于70~80%。
关于oneAPI的更多补充
英特尔oneAPI概览
以数据为中心的多元化计算工作负载推动着对多元化计算架构的需求,包括 CPU、GPU、FPGA 和 AI 加速器。多元化计算架构覆盖标量(Scalar)、矢量(Vector)、矩阵(Matrix)和空间(Spatial)。这种在英特尔缩写为SVMS的架构,需要一个高效的软件编程工具来充分释放其性能。oneAPI跨SVMS架构统一并简化了编程模型,为开发者带来更高的生产效率和毫不妥协的性能。oneAPI基于英特尔的领先软件产品和丰富的SVMS架构专长打造,作为一套实用的解决方案,其底层接口已被广泛的软件生态系统采用。oneAPI以行业标准和开放规范为基础,鼓励生态系统协作和共同创新。英特尔oneAPI项目细节
oneAPI支持直接编程和API编程,并将提供统一的语言和库,可以在包括CPU、GPU、FPGA和AI加速器等不同硬件上,提供完整的本地代码性能。直接编程:oneAPI包括一个全新的直接编程语言Data Parallel C++ (DPC++),这是一个可替代单架构专用语言的开放式、跨行业的编程语言。通过使用开发者熟悉的编程模型,DPC++能够提供并行编程的效率和性能。基于API的编程:oneAPI强大的库跨越多个可受益于加速的工作负载领域。库函数针对每个目标架构都进行了定制编码。分析与调试工具:在领先的分析工具的基础上,英特尔将提供加强版的分析与调试工具,以支持DPC++和广泛的SVMS架构。直接编程语言Data Parallel C++
多元化架构需要全新的编程语言,现有的C++、MATLAB等可移植编程语言和CUDA、OpenCL等数据并行编程语言,都无法满足需求。英特尔正在与行业携手开发一种全新的语言,支持实现横跨SVMS架构的数据并行编程。DPC++语言能够跨SVMS架构为英特尔和行业提供毫不妥协的高性能和生产效率。DPC++是一种基于标准的开放式跨行业语言,可替代单一架构专有语言。高性能库推动人工智能和数据分析的发展
oneAPI集成了业内顶级的计算库,包括最快速、使用最广泛的数学函数库MKL、使用经典机器学习算法的英特尔数据分析加速库DAAL,以及面向深度神经网络的英特尔数学核心函数库MKL-DNN等,充分了解底层硬件如CPU和加速器的所有细节,并为硬件提供最佳性能。oneAPI面向数据科学家和应用开发者提供跨SVMS架构的统一软件抽象,让所有开发者可随时获取高性能。OpenVINO展示了oneAPI愿景的现实。作为为客户解决问题的优化推理引擎,OpenVINO补充了深度学习框架,支持应用程序开发者以统一接口跨SVMS架构进行开发。英特尔软件产品及工具已广泛应用于实际的深度学习客户部署。