时间:2024-07-24 来源:网络搜集 关于我们 0
(报告出品方/分析师:德邦证券 陈海进 陈蓉芳)
1.1. 如何理解FPGA的硬件结构?
FPGA(Field Programmable Gate Array)又称现场可编程门阵列,是在硅片上预先设计实现的具有可编程特性的集成电路,用户在使用过程中可以通过软件重新配置芯片内部的资源实现不同功能。
通俗意义上讲,FPGA芯片类似于集成电路中的积木,用户可根据各自的需求和想法,将其拼搭成不同的功能、特性的电路结构,以满足不同场景的应用需求。鉴于上述特性,FPGA芯片又被称作“万能”芯片。
据安路科技招股书,FPGA芯片由可编程的逻辑单元(Logic Cell,LC)、输入输出单元(Input Output Block,IO)和开关连线阵列(Switch Box,SB)三个部分构成:
(1)逻辑单元:通过数据查找表(Look-up Table,LUT)中存放的二进制数据来实现不同的电路功能。LUT的本质是一种静态随机存取存储器(Static Random Access Memory,SRAM),其大小是由输入端的信号数量决定的,常用的查找表电路是四输入查找表(4-input LUT,LUT4)、五输入查找表(5-input LUT,LUT5)和六输入查找表(6-input LUT,LUT6)。
查找表输入端越多,可以实现的逻辑电路越复杂,因此逻辑容量越大,但是查找表的面积和输入端数量成指数关系,输入端数量增加一个,查找表使用的SRAM存储电路面积增加约一倍。不同的逻辑单元结构可以使用不同大小的查找表,或者是不同查找表类型的组合。
此外,逻辑单元内部还包含选择器、进位链和触发器等其他组件。为了提高芯片架构效率,若干逻辑单元可以进一步组成逻辑块(Logic Block),逻辑块内部提供快速局部资源,从而形成层次化芯片架构。
(2)输入输出单元:是芯片与外界电路的接口部分,用于实现不同条件下对输入/输出信号的驱动与匹配要求。
(3)开关阵列:能够通过内部MOS管的开关控制信号连线的走向。
FPGA从Xilinx公司1985年推出世界首款FPGA芯片“XC2064”经历过数十年发展,在硬件架构上大致经历了四个阶段:从PROM阶段(简单的数字逻辑)到PAL/GAL阶段(“与”&“或”阵列)再到CPLD/FPGA阶段(超大规模电路),到如今FPGA与ASIC技术融合、向系统级发展的SoC FPGA/eFPGA阶段。硬件水平整体趋向更大规模、更高灵活性、更优性能。
1.2. FPGA特点:灵活性高,适用于并行计算
FPGA芯片属于逻辑芯片大类。逻辑芯片按功能可分为四大类芯片:通用处理器芯片(包含中央处理芯片CPU、图形处理芯片GPU,数字信号处理芯片DSP等)、存储器芯片(Memory)、专用集成电路芯片(ASIC)和现场可编程逻辑阵列芯片(FPGA)。
据复旦微招股书,FPGA兼具灵活性和并行性两大特点。
(1)灵活性:FPGA芯片拥有更高的灵活性和更丰富的选择性,通过对FPGA编程,用户可随时改变芯片内部的连接结构,实现任何逻辑功能。尤其是在技术标准尚未成熟或发展更迭速度快的行业领域,FPGA能有效帮助企业降低投资风险及沉没成本,是一种兼具功能性和经济效益的选择。
(2)并行性:CPU、GPU在执行任务时,执行单元需按顺序通过取指、译码、执行、访存以及写回等一系列流程完成数据处理,且多方共享内存导致部分任务需经访问仲裁,从而产生任务延时。
而FPGA每个逻辑单元与周围逻辑单元的连接构造在重编程(烧写)时就已经确定,寄存器和片上内存属于各自的控制逻辑,无需通过指令译码、共享内存来通信,各硬件逻辑可同时并行工作,大幅提升数据处理效率。
尤其是在执行重复率较高的大数据量处理任务时,FPGA相比CPU等优势明显。
据润和软件,相较于其他逻辑芯片而言,FPGA在灵活性、性能、功耗、成本之间具有较好的平衡:
(1)相较于GPU,FPGA在功耗和灵活性等方面具备优势。一方面,由于GPU采用大量的处理单元并且大量访问片外存储SDRAM,其计算峰值更高,同时功耗也较高,FPGA的平均功耗(10W)远低于GPU的平均功耗(200W),可有效改善散热问题;另一方面,GPU在设计完成后无法改动硬件资源,而FPGA根据特定应用对硬件进行编程,更具灵活性。机器学习使用多条指令平行处理单一数据,FPGA的定制化能力更能满足精确度较低、分散、非常规深度神经网络计算需求。
(2)相较于ASIC芯片,FPGA在项目初期具备短周期、高性价比的优势。ASIC需从标准单元进行设计,当芯片的功能及性能需求发生变化时或者工艺进步时,ASIC需重新投片,由此带来较高的沉没成本以及较长的开发周期;而FPGA具有编程、除错、再编程和重复操作等优点,可实现芯片功能重新配置,因此早期FPGA常作为定制化ASIC领域的半定制电路出现,被业内认为是构建原型和开发设计的较快推进的路径之一。
1.3. 前沿技术:关注HBM高带宽存储与NoC片上网络互连
1.3.1. HBM:兼顾高容量和大带宽,是弥合内存层次结构中关键缺口的存储类型
FPGA逻辑结构中的内存大致分为三个层次(以Intel Agilex-M FPGA为例),包括超本地化片上内存、以HBM2e堆栈形式提供的本地封装内存,以及DDR5和LPDDR5等外部内存架构和接口。
1)片上内存(MLAB模块和M20K模块):最本地化的内存;
2)封装内存(HBM):弥合内存层次结构中关键缺口的内存,其容量远大于片上内存(两个数量级以上),同时带宽又远大于片外内存(两个数量级以上);
3)片外内存(DDR5、LPDDR5等):对于超出HBM2e容量的应用,或对独立内存的灵活性有要求时,需要DDR5和LPDDR5以及其他主流的内存架构。
HBM2e与FPGA裸片集成在同一封装中可以在小尺寸外形规格中实现更高带宽、更低功耗、更低时延。
(1)内存容量方面:每个HBM2e堆栈可包含4层或8层,每层提供2GB内存,因此单个Intel Agilex-M系列FPGA可包含16GB或32 GB的高带宽内存;
(2)带宽方面:HBM2e可实现每堆栈高达410Gbps的内存带宽,较DDR5组件的带宽提升高达18倍,较GDDR6组件提升7倍。两个HBM2e堆栈加起来可提供高达820Gbps的峰值内存带宽;
(3)功耗和时延方面:由于HBM2e集成在封装中,因此也不需要使用外部I/O引脚,从而节省了电路板空间,并消除了它们会带来的功耗和互连时延。
1.3.2. 互连:片上资源互连复杂性催生NoC架构应用
片上网络(NoC,Network on Chip)是指在单芯片上集成大量的计算资源以及连接这些资源的片上通信网络,用于在可编程逻辑(PL)、处理器系统(PS)和其它硬核块中的IP端点之间共享数据。
与之对应的概念——片上系统(SoC)则是包含一整套多样化和互连单元的单芯片,旨在解决一定范围的任务。传统上,SoC 包括几个计算内核、内存控制器、I/O 子系统以及它们之间的连接与切换方式(总线、交叉开关、NoC元件)。
片上网络NoC包括计算和通信两个子系统。计算子系统(由PE,Processing Element构成的子系统)完成广义的“计算”任务,PE既可以是现有意义上的CPU、SoC,也可以是各种专用功能的IP核或存储器阵列、可重构硬件等。
通信子系统(由Switch组成的子系统)负责连接PE,实现计算资源之间的高速通信。通信节点及其间的互连线所构成的网络即为片上通信网络。
类比城市高速公路网络,NoC架构简化互连路径,提高FPGA传输速率。
Achronix基于台积电(TSMC)的7nm FinFET工艺的Speedster7t FPGA器件包含了2D NoC架构,为FPGA外部高速接口和内部可编程逻辑的数据传输提供了超高带宽(~27Tbps)。
NoC使用一系列高速的行和列网络通路(水平和垂直方式)在整个FPGA内部分发数据,每一行或每一列都有两个256位的、单向的、行业标准的AXI通道,可以在每个方向上以512Gbps(256bit x 2GHz)的传输速率运行。
NoC为FPGA设计提供了几项重要优势,包括:(1)提高设计的性能;(2)减少逻辑资源闲置,在高资源占用设计中降低布局布线拥塞的风险;(3)减小功耗;(4)简化逻辑设计,由NoC去替代传统的逻辑去做高速接口和总线管理;(5)实现真正的模块化设计。
Intel(Altera)利用NoC架构实现内存和可编程逻辑结构之间的现高带宽数据传输。
如下图所示,每个片上HBM2e堆栈通过UIB与其NoC通信。片外内存(DDR4、DDR5 等)则通过IO96子系统与NoC通信。NoC通过一个由交换机(路由器)、互连链路(导线)、发起程序(I)和目标(T)组成的网络,将数据从数据源传输到目的地。
每个NoC都提供一个横向网络,通过AXI4发起程序将可编程逻辑结构中的逻辑连接到集成NoC的目标内存。
此外,每个NoC也都提供一个纵向网络,通过优化的路由将横向网络路径读取的内存数据分发到FPGA的可编程逻辑结构深处(可编程逻辑结构和/或M20K模块)。
AMD(Xilinx)在AI引擎和可编程逻辑之间部署NoC架构,可大幅降低功耗。
AMD Versal产品最突出的优势之一,是能够在自适应引擎中将AI引擎阵列与可编程逻辑(PL)结合使用,由AI引擎阵列接口连接AI引擎阵列和可编程逻辑。
这样的资源结合为在最佳资源、AI引擎、自适应引擎或标量引擎中实现功能提供了极大的灵活性。该方案与传统可编程逻辑DSP和ML实现方案相比,可将芯片面积计算密度提高达8倍,从而在额定值情况下,可将功耗降低40%。
2.1. 驱动力:数据中心蓬勃兴起,FPGA行业成长再添新动力
FPGA芯片具有灵活性高、应用开发成本低、上市时间短等优势使其应用场景覆盖了包括工业控制、网络通信、消费电子、数据中心、汽车电子、人工智能等广泛的下游市场。
各大应用领域占比整体保持稳定,数据中心更具增长动力。根据Xilinx财报,2019-2021年下游应用占比格局几乎未发生大规模变动,其中数据中心营收占比分别为7%、9%、10%,相较于其他领域而言具备更快的增长速度。
2022年,国际龙头厂商AMD和Intel的FPGA业务在数据中心领域大放异彩,成为其业绩增长的有力助推。AMD对FPGA龙头Xilinx的收购大大推动其嵌入式部门和数据中心的业绩增长,两部门产品营收从2021年的39亿美元增长至2022年的106亿美元;Intel FPGA业务助推DCAI部门(Data Center and AI Group,数据中心和人工智能事业部)实现14%的营收增长。
FPGA在数据中心领域未来有望占据更多市场份额。英特尔中国研究院院长宋继强曾表示,2020年CPU+FPGA异构计算将占据云数据中心市场的1/3。
据Semico研究公司预测,全球数据中心加速器(包括CPU、GPU、FPGA和ASIC)市场规模将从2018年的28.4亿美元增长到2023年的211.9亿美元,年复合增长率高达49%。其中FPGA加速器在2018年只有10亿美元,到2023年将超过50亿美元,其增长驱动力主要来自企业级数据负载加速应用。
#1:数据中心为什么要部署FPGA?
FPGA芯片在数据中心领域主要用于硬件加速,在云服务器厂商中已有广泛部署。数据中心使用FPGA芯片代替传统的CPU方案后,处理其自定义算法时可实现显著的加速效果。
因此近年来,微软Azure、亚马逊AWS、阿里云的服务器上都开始部署FPGA加速器用于运算加速。在云计算大面积应用的背景下,未来数据中心对芯片性能的要求将进一步提高,更多数据中心将采纳FPGA芯片方案,这将提高FPGA芯片在数据中心芯片中的价值占比。
——(1)芯片级别的能耗限制与暗硅效应问题
芯片制造工艺所遇到的瓶颈问题,始终影响着芯片设计的技术路线选择。
在半导体发展早期,Dennard缩放定律(1974年提出,其内容为:晶体管功耗会随着尺寸变小而同比变小,使相同硅片面积下总功耗保持不变)指引工业界不断实现工艺迭代,在每个新的工艺节点上使用更多的晶体管、更快速率和更低功耗的晶体管,证明开发每个新工艺节点所需的巨大成本具备商业合理性。
而Dennard缩放定律的停滞(当摩尔定律使晶体管尺寸下降到纳米级时,量子隧穿等现象导致晶体管漏电,使晶体管的静态功耗不减反增,功率密度上升,散热问题加剧)导致工业界竞相向多核架构发展,多核架构实现了并行和多任务工作负载的性能扩展,仍然能够保证在商业合理范围内提升处理器性能。
但随着多核缩放的优势开始消退,在摩尔定律逼近极限之前,多核的技术路径已面临新的瓶颈——由于芯片散热技术和供电技术的限制,以及成本限制,可承受的微处理器功耗在近10年的发展历程中并没有太大变化,这导致在10nm或更先进工艺线下,以摩尔定律增加的晶体管在动态运行期间必须通过关闭来实现功耗控制,即暗硅(Dark Silicon)问题。
如上图(暗硅效应示意图)所示:跨越两代制程(从65nm到32nm,S = 2),我们可以将核心数增加2倍,或者将频率增加2倍,但随之即会产生一些“暗硅”。因此,在计算核心数和频率之间的平衡取舍问题是芯片设计的一大学问。
暗硅现象逐渐带来了一种从传统低功耗设计到功耗预算设计的范式转变。目前,多核系统设计模式的优化目标已转变为:在热约束条件下,估计芯片的功耗上限值(称为功耗预算,芯片设计人员通常采用的功耗预算是热设计功耗,即TDP),并将其分配至各个核心或功能单元,从而使系统的整体性能达到最优。
异构计算是当前高性能计算的解决方案之一。在暗硅趋势与成本压力下,CPU+GPU和CPU+FPGA异构计算是在通用性、生产成本和功耗下较为折中的方案。随着先进工艺生产成本降低, 并且大量标准化处理器IP成熟的情况下, 不排除高性能计算未来也会发展出在单个SoC芯片中大量集成不同类型加速器件的其他异构方式。
——(2)数据中心级别的能源成本与散热压力问题
超算数据中心性能飞速提升,能源耗用问题亟待解决。在今年举行的ISSCC 2023大会上,AMD CEO Lisa Su指出,目前主流服务器的性能表现每2.4年实现翻番,GPU单精度浮点(Single Precision FLOPs)每2.2年性能实现翻番。
以此趋势增长至2035年,最高性能超算系统可能会从现在的Exascale量级(10的18次方)增长1000倍,达到Zettascale量级(10的21次方)。一座 ZettaScale数据中心的能耗可能会达到500MW,几乎等同于一座核电站的放电能力(1GW)的一半,远超过一座Exascale数据中心21MW的能耗量。
GPU能够实现更高的并行计算峰值性能,但FPGA在功耗方面的优势对于解决数据中心能源问题至关重要。以Xilinx与英伟达的旗舰产品作对比,基于Versal AI Core的VCK5000 Versal开发卡比英伟达旗舰GPU,能耗比和性价比均提升1倍,能够实现90%的计算效率和低于100W的功耗(板卡层面),因此是为云端应用和边缘应用实现CNN、RNN和NLP加速的理想开发平台。Versal系列针对AI应用设计的全新ACAP架构以及其性能表现上的优势,是AMD与之战略合作的重要基础。
#2:数字芯片行业巨头的异构战略:CPU+GPU or CPU+FPGA?
英伟达作为GPU龙头,率先推出CPU+GPU异构Superchip。英伟达率先于2022年GTC大会提出将Grace CPU和Hopper GPU组成的Superchip,并于时隔一年后的GTC 2023手持展示芯片实物,该Superchip采用900GB/s的高速一致性接口对Grace CPU和Hopper GPU进行互连,非常适合处理大型数据集。随后,英伟达于2023年5月COMPUTEX大会上宣布生成式AI引擎NVIDIA DGX GH200已投入量产。
NVIDIA DGX GH200是将256个NVIDIA Grace Hopper超级芯片完全连接到单个GPU中的新型AI超级计算机,支持万亿参数AI大模型训练。
AMD在CPU+GPU异构领域和英伟达正面较量。
2023年6月,AMD推出了早在年初CES 2023大会上披露的数据中心APU(加速处理器)Instinct MI300系列,其中“GPU+CPU”架构(APU)的MI300A现已开始提供样品,另外MI300X和Instinct Platform则将在23Q3提供样品,Q4正式推出。据23年5月AMD 23Q1电话会议披露,MI300将在23Q4开始产生销售收入。MI300是市场上首款“CPU+GPU+内存”的一体化产品,在异构计算新格局之下,AMD在这一快速增长的市场上向英伟达的垄断地位发起挑战。
此外,AMD也在CPU+FPGA异构领域积极布局。2022年完成了对FPGA行业龙头Xilinx的收购后,在云计算、边缘计算和智能设备市场完成了重要战略部署。除了重磅推出的Instinct MI300系列产品、以及传统优势产品Ryzen系列处理器外,AMD依托Xilinx FPGA的优势,吸纳了Xilinx原有的数据中心产品——Zynq UltraScale+ MPSoC芯片、自适应数据中心平台Versal AI和相关SoC产品,并推出了基于AMD XDNA – Versal AI Core架构的数据中心加速器卡Alveo V70,积极打造CPU+FPGA组合优势。
Intel在数据中心产品方面重点发力CPU+FPGA战略。自2015年完成对Altera的收购后,Intel为其成立专门的PSG部门(Programmable Solution Group,可编程解决方案事业部),2022年通过业务重组将FPGA业务并入DCAI部门(Data Center and AI Group,数据中心和人工智能事业部),形成芯片组合来竞争数据中心与AI市场。
23Q1的投资者大会上,Intel发布了2023-2025年DCAI架构图,展示了包括CPU、GPU、FPGA等芯片的发展规划。其中,Intel计划于2023年推出15款FPGA新品,包括Stratix,eASIC和Agilex系列,刷新了Intel FPGA的年度推新纪录,有望为CPU+FPGA异构打开新格局。
此外,Intel也在数据中心着手布局GPU产品线,曾计划推出CPU+GPU异构产品。Intel下一代数据中心GPU Falcon Shores原计划为一款采用混合架构的XPU(CPU+GPU),目前已将其改为纯GPU解决方案,计划于2025年发布。
2.2. 其他应用领域:工业/通信FPGA基本盘稳健增长,汽车电子值得关注
数据中心应用以外,我们认为工业、通信及汽车电子是FPGA行业较为重要的应用领域。
(1)工业、通信作为FPGA行业主体应用领域,是支撑行业相对稳定增长的关键,Frost&Sullivan预期2022-2025年CAGR增速分别达到15.6%、17.4%。
(2)汽车行业整体处于技术多样化和蓬勃发展时期,FPGA的灵活性特征使其能够良好适配车厂对解决方案的整合需求。虽然目前汽车电子在FPGA市场份额不大,但未来技术发展迭代的方向仍然值得关注。
2.2.1.工业领域:工业智能化、无人化趋势催生更多FPGA应用
FPGA芯片在工业领域应用非常广泛,大量应用在视频处理、图像处理、数控机床等领域实现信号控制和运算加速功能。
受益于工业智能化、无人化的发展趋势,FPGA芯片高效能、实时性、高灵活性的特点使其在工业领域得到了广泛应用。
(1)数控机床的伺服系统:传统的ASIC只能控制单一马达,FPGA芯片可以做到多通道的马达控制。在目前驱动马达所消耗的电力占据了全球能源消耗的很大部分的情况下,能够精准实现多通道控制的FPGA芯片或将得到更多应用。
(2)LED显示屏:当前主流的LED显示屏控制系统多以FPGA芯片或FPGA芯片结合其他芯片做为主控芯片。FPGA芯片的现场可编程特性1)可满足大型LED显示屏系统显示数据格式转换的需求,以满足各种形状和规格显示屏的定制,2)也可满足其需要进行亮度、对比度、灰度级等参数灵活调节的需求,使LED显示屏得到更加细腻的显示画面。
2.2.2.通信领域:灵活适配各类通信协议的应用与快速迭代
FPGA芯片目前被大量应用在无线通信和有线通信设备中,实现接口扩展、逻辑控制、数据处理、单芯片系统等各种功能。
相较于其他类型芯片,FPGA芯片一方面依靠其运算速度可以有效满足通信领域高速的通信协议处理需求,另一方面又可依靠其灵活性以适应通信协议持续迭代的特点。此外,FPGA芯片对于复杂信号、多维信号的处理能力较强,可较好适应日益复杂的网络环境。
2.2.3.汽车电子:解决方案由分布式走向集成式,FPGA提供灵活性
目前汽车行业的技术和架构都正在经历一个快速演变的过程,整车厂越来越意识到来自不同Tier 1厂商的ECU之间彼此缺乏关联,需要投入大量时间和资金加以整合。
但网联汽车和自动驾驶的快速发展正在改变这一现状,传统的分布式方案将被集成式方案取代,包括ECU、传感器在内的硬件会得到高度整合;汽车OEM会更关注客户在接口软件层面上的创新,以及为终端客户提供差异化产品的能力。
FPGA凭借可编程性的特征,在汽车电子领域逐渐崭露头角。
(1)智能座舱领域:以特斯拉为代表的造车新势力正通过将仪表板、信息娱乐系统和屏幕显示进行高度集成,使得一块屏幕上需要展示的内容日趋丰富,加之不同品牌车型间的显示器尺寸并不统一,从而对图像的分区切割显示和多元化融合提出了较高要求。很多车厂目前都在利用FPGA的可编程、并行处理能力强、功耗低、散热少的特点,加速引入相关FPGA平台。
(2)车载视觉系统和人工智能技术:现在也被大量应用于驾驶员状态监测系统(DMS)、车舱内监控系统(IMS)中,包括:监测驾驶员的疲劳、注意力涣散或损伤;监控乘客,确保儿童/宠物不会被无意中锁在车内,或是包、手机和钱包等物品不会无意中遗忘在车内。因此,图像增强会是极具前景的应用之一。
例如,对目前在汽车中大量使用的LCD屏幕,FPGA可以作定制的背光优化,以提升视觉效果和节约能耗。同时,为了支持车载4K显示,FPGA对高速数据处理、接口也进行了广泛的支持,包括1.5G-2.5Gbps MIPI、HDMI、DisplayPort等。
(3)高级驾驶辅助系统:最新数据显示,一辆L3级别的自动驾驶车辆将至少配置16个以上的各型传感器,由于主处理器需要连接不同的传感器接口进行数据处理,而且汽车接口也尚未实现真正标准化,所以利用FPGA的可编程特性对不同传感器进行聚合/桥接,或是实现I/O接口扩展,也是新趋势之一。同时,考虑到汽车平台的开发可能需要5-10年的时间,方案是否具备可拓展性也左右着用户的选型决心。
2.3. 市场空间测算:“ChatGPT”点燃AI热潮,打开FPGA想象空间
FPGA未来市场空间仍然广阔。根据Frost&Sullivan数据,全球FPGA市场规模从2016年的约43.4亿美元增长至2020年约60.8亿美元,年均复合增长率约为8.8%。
预计到2025年,全球FPGA市场将超过120亿美元。在中国市场,预计2025年FPGA芯片销售额将达到332.2亿元,对应2021至2025年年均复合增长率将达到17.1%;预计2025年中国市场FPGA芯片出货量将达到3.3亿颗,2021至2025年年均复合增长率将达到15.0%。
数据中心驱动力显现,2022年FPGA已迎来爆发时刻。
由于安路科技招股书援引Frost&Sullivan的统计数据仅截至2019年,2022年FPGA行业受益于数据中心行业发展的驱动,市场规模迎来爆发式增长,同比增速接近30%,远高于Frost&Sullivan曾经的预测数据15.7%,因此我们对FPGA市场规模进行重新测算。
我们对全球主流FPGA芯片公司的收入数据进行不完全统计,主要包括AMD(Xilinx)、Intel(Altera)、Lattice、Microchip(Microsemi)、紫光同创、复旦微电、安路科技。由于FPGA市场集中度高,2019年全球FPGA按出货量口径市场份额CR4达到94.4%,因此我们以全球主流FPGA公司营收数据作为市场规模的大致估算。
(1)从国际厂商业绩来看,Intel(Altera)22Q4收入同比大增42%,22年全年同比增长29%;Microchip(Microsemi)于FY2023年实现FPGA业务同比31%的增长水平。
(2)国内公司表现更为亮眼,紫光同创2022年实现营收超15亿元,同比增长近90%;安路科技2022年实现营收10.42亿元,同比增长54%。
23Q1季度FPGA行业也维持高速增长。AMD公司嵌入式(Embedded)部门23Q1实现16亿美元营收,同比增长9.67亿美元;Intel可编程解决方案(PSG)部门23Q1营收同比增长36%,连续实现创纪录的收入规模。
短期来看,市场中仍然存在周期性的波动。根据AMD业绩说明会指引,受到一些积压库存的影响,预计23Q2嵌入式部门增速将有所放缓。
长期来看,根据FPGA龙头厂商Intel(Altera)于2023年年中给出的市场预测,2023年市场增长预计将超过16%,未来5年的增长势头向好,预计将继续保持10%以上的复合年均增长率。由AI行情引发的大模型热潮仍将持续推动AI服务器对于算力部署的需求,FPGA有望依托于高灵活性、低功耗等特征持续受益于AI服务器市场的增长。
3.1. FPGA硬件已进入7nm复杂异构,高端领域国内外厂商实力悬殊
全球范围内FPGA产业的兴起与发展可分为两个阶段。
(1)第一阶段是20世纪80年代开始的创业潮与行业垄断化。Lattice、Altera、Xilinx和Actel在1983~1985年陆续成立,并迅速成长为FPGA行业四大龙头;2010年后Xilinx和Altera已经占据80%以上的市场份额,剩余份额则大部分被Lattice和Actel瓜分。
(2)第二阶段是从2010年开始、以大型并购案为特点的行业洗牌。随着半导体行业对FPGA的重视加大,Microchip、Intel和AMD等半导体龙头纷纷下场收购与整合FPGA业务,尤其是Xilinx和Altera分别与母公司AMD和Intel形成CPU+FPGA的集合优势,战略部署数据中心应用。中国FPGA产业起步和发展较晚。
复旦微电子自2004年开始进行FPGA研发,布局相对较早,安路科技和紫光同创也于2011和2013年相继成立。
我们根据AMD(Xilinx)的官网信息对其FPGA及自适应SoC产品进行梳理。根据参考安路科技招股书问询函回复中的描述,我们大致将FPGA芯片按逻辑单元数量划分产品定位:将逻辑单元数在100K及以下的产品定位为低端产品,将100K-600K的产品定位为中端产品,将600K及以上的产品定位为高端产品。
通过梳理可以看出,国际龙头厂商产品矩阵完整性高,覆盖面广。经过数十年的发展,已形成全面覆盖从数十K至数千K个逻辑单元量级、从低端到高端的全系列产品线,已可对工业控制、网络通信、消费电子、数据中心、汽车电子、人工智能等主要下游领域形成全面覆盖。
AMD(Xilinx)FPGA相关产品矩阵主要包括:四大FPGA产品系列(VIRTEX、KINTEX、ARTIX、SPARTAN),以及集成度更高的两大自适应SoC(Adaptive SoC)系列(ZYNQ、VERSAL)。
(1)从芯片制程来看,主要有UltraScale+(16nm)、UltraScale(20nm)、7系列(28nm)和6系列(45nm)四大类,VERSAL则是整体升级为7nm制程。
(2)从芯片架构来看,FPGA单芯片向更先进工艺、更高速电路结构、复杂异构SoC系统发展,AMD(Xilinx)的VERSAL系列产品中集成了PCIe、Ethernet通信协议以及AI引擎、NoC架构等。
(3)从产品价格来看,随着产品定位从低端走向高端,FPGA容量等指标不断提升,通信架构逐渐升级,对应开发板的价格也从数百美元逐步增加到一万多美元。
(4)从应用领域来看,数据中心等高端应用所适用的FPGA芯片大多为高端FPGA产品线,仅有少部分中高端FPGA也能够满足数据中心网络加速需求。
观点#1:在高端FPGA硬件水平上,国产厂商与国际龙头尚存在较大差距
首先在制造工艺方面,AMD(Xilinx)Versal系列已经进入7nm制程工艺,Intel(Altera)与之对标的Agilex系列也已采用Intel 7制程工艺。
国产厂商目前尚处于28nm的技术节点,且在28nm产品的推出节点上落后于两大国际龙头厂商近十年。作为FPGA芯片性能的基础性指标,芯片制程仍然是国产替代突围的关键。
其次是硬件架构方面,国际龙头已经开始在高端产品中使用先进的NoC片上通信网络架构以及兼顾内存容量与带宽的HBM存储架构,AMD(Xilinx)更是开创ACAP的新型异构模式,因此架构创新与升级也是国产厂商未来发展需要攻克的难关。
在应用领域方面,行业龙头企业AMD(Xilinx)、Intel(Altera)的产品已可对工业控制、网络通信、消费电子、数据中心、汽车电子、人工智能等主要下游领域形成全面覆盖,国产厂商现阶段的产品线尚有不足。
与硬件水平的问题殊途同归,国产FPGA首先需要突破先进的硬件技术,才能够在高端应用领域占有一席之地,而目前国产FPGA尚处于中低端市场,自主可控道阻且长。
3.2. AMD、Intel双寡头主导市场,中端市场国产化机遇显现
全球市场竞争格局稳定,国际龙头占据绝对市场份额。根据Frost&Sullivan数据,2019年全球前四大FPGA厂商合计占据94.4%的市场份额,其中,AMD(Xilinx)、Intel(Altera)分别占据51.7%、33.7%的绝对份额,具有难以撼动的市场地位。
中国市场竞争格局主要呈现两大特点:
(1)国产FPGA厂商开始崛起。近年来,随着国产替代趋势渐渐进入FPGA市场,国产FPGA厂商已占有一席之地。据我们测算,主要国产FPGA设计公司合计营业收入自2018年的2亿元增长至2022年的33亿元,2022年全球市占率已超过5%(按本文2.3测算口径),国产化进程大步推进。
(2)国际龙头厂商在中国市场的占有率略低于全球市场(出货量口径)。2019年,AMD(Xilinx)、Intel(Altera)在中国市场的份额为36.6%/25.3%(出货量口径),低于其在全球市场51.7%/33.7%的份额。
从需求侧看:中国FPGA市场目前以容量<500K、制程在28-90nm的产品为主,中低端市场空间更为广阔。
根据Frost&Sullivan数据,(1)按逻辑单元拆分,目前100K以下逻辑单元的FPGA芯片仍是市场需求量最大的部分,其次为100K-500K逻辑单元部分。500K以下逻辑单元的FPGA芯片合计占有69.9%的市场份额(2019年中国市场,销售额口径)。
(2)按制程拆分,目前28nm-90nm制程区间内的FPGA芯片由于其较高的性价比与较高的良品率依然占据了市场中63.3%的份额(2019年中国市场,销售额口径)。
此外,由于先进制程产品具有更低功耗与面积和更高的性能,28nm以下制程的FPGA芯片预计将快速发展。
从供给侧看:国际龙头对中端FPGA投入放缓,中端市场迎来机遇。2022年9月,AMD宣布Xilinx 7系列产品的生命周期将至少延长至2035年,这意味着在中端FPGA领域,AMD的战略是维持旧有市场,而非增加投入。这为原本在低端市场发展的FPGA厂商带来机遇。
Lattice随即于2022年12月推出全新低功耗中端AvantTM平台,roadmap剑指中端市场。
AvantTM平台的开发是基于NexusTM这一小型FPGA平台取得的创新成果,迄今为止Lattice共发布了5款基于NexusTM的器件,除了NexusTM器件外,公司计划在未来几年持续推出基于AvantTM的FPGA产品。
Lattice AvantTM平台为中端FPGA打造低功耗、先进互连和优化的计算能力,技术指标相较于AMD(Xilinx)、Intel(Altera)同类竞品而言有所提升。
市场上主流的中端FPGA产品主要有Intel(Altera)的Arria V GZ(450K逻辑单元)和AMD(Xilinx)的Kintex-7(478K逻辑单元)。
与之相比,Lattice AvantTM系列产品具有以下特性:
(1)市场领先的低功耗:功耗比同类竞品器件低2.5倍,帮助系统和应用工程师提高功耗和散热设计的效率、降低运营成本、增强可靠性;
(2)同类器件中领先的高性能:与同类竞品器件相比,性能最高提升2倍,可提供更高的带宽并减少SERDES链路,降低系统成本及尺寸;
(3)行业领先的小尺寸:与同类竞品器件相比,封装尺寸减小多达6倍,可实现高效的小尺寸系统设计。
中端市场机遇之下,国产FPGA公司也选择趁势而为。安路科技同样于22年12月发布高性能PH1A系列FPGA和低功耗ELF3系列FPGA等新品。其中PH1A系列FPGA,即定位于高性价比可编程逻辑市场。
通过与Lattice同期中端产品相比,安路科技PH1A系列尚存在差距。我们选择安路科技PH1A系列与Lattice Avant-E系列中容量最大的两款产品进行比较,发现Lattice产品在制程、LUTs、DSP等指标上均具备优势,其开发板价格定位也相对更高。
安路科技目前相较于Lattice定位更偏向于中低端市场,国产替代仍有可发掘空间。
观点#2:国产厂商渗透率不断提升,中低端市场带来国产替代强大驱动力
从市场层面看:FPGA供需两侧为国产替代营造有利格局,国产化已初显成效。
国内FPGA市场对中低端产品需求旺盛,国产FPGA可触达市场空间依然广阔。FPGA龙头厂商被CPU龙头收购,未来战略向母公司数据中心相关业务倾斜,国产FPGA获得进入中端市场的机遇和空间。
从公司层面看:
(1)国产FPGA已形成28nm产品系列,进军更先进制程。复旦微于2018年率先推出28nm亿门级FPGA,安路科技与紫光同创于2020年先后来到28nm节点。各公司在更先进制程均已进行多年研发与积累,剑指国产FPGA尚未触及的高端市场。
(2)新兴领域积极布局,寻求更大市场空间。安路科技积极开拓汽车电子、数据中心、运算加速等新兴市场,复旦微新一代配置有APU、GPU、VPU、eFPGA、AI引擎的异构智能PSoC产品——FPAI也成功发布,紫光同创第二代面向人工智能、机器视觉等领域的SoPC已经启动研发。FPGA行业广阔的市场空间仍将持续驱动国产FPGA厂商加速成长。
国产FPGA公司营收体量相差不大,竞争优势各不相同。
安路科技的主要优势在于小型FPGA产品的市场基础扎实,在工业控制、LED等行业出货量较大。复旦微FPGA产品主要应用于高可靠等特定领域,毛利率水平普遍较高。紫光同创背靠紫光集团,与长江存储、紫光展锐、新华三等同属一系,在5G通信行业上下游产业链进行了布局,拥有较强的融资能力和市场运作能力。
通过将产品线与营收体量对比来看,先进制程对FPGA厂商营收带动明显。
复旦微进入市场较早,2018年其FPGA营收显著高于安路科技、紫光同创。随着2020年安路科技与紫光同创相继推出28nm新制程产品,营收体量快速成长,2019-2022年营收CAGR分别达到104%、145%,略快于复旦微71%的CAGR增速。
3.3. EDA工具构筑核心壁垒,软件生态与FPGA硬件相辅相成
FPGA软件是FPGA产品开发的关键,专用EDA工具与FPGA芯片使用性能深度绑定。
FPGA芯片在制造完成后,其功能并未固定,用户可以根据自己的实际需要,将自己设计的电路通过FPGA芯片公司提供的专用EDA软件对FPGA芯片进行功能配置,从而将空白的FPGA芯片转化为具有特定功能的集成电路芯片。
专用EDA软件质量的参差,不仅会决定最终FPGA芯片能否实现工程师期望的功能,还将最终决定芯片运行的速度、功耗。因此,FPGA芯片公司不仅仅是集成电路设计企业,还必须是集成电路EDA软件企业。
FPGA软件设计环节复杂,逻辑综合工具和设计实现部分研发难度高。
用户端在使用FPGA时,需将RTL代码通过逻辑综合工具、映射工具、布局布线工具、配置数据流生成工具、编程下载工具等生成下载到芯片里,结合时序和功耗分析工具以及在线调试工具,完成用户应用在FPGA中的实现的整个过程。
在整个FPGA软件工具设计流程中,除了仿真工具借助第三方工具实现,其他环节基本都需要FPGA厂商自己的软件工具覆盖,特别是以逻辑综合工具和设计实现部分为代表的环节,存在着较大研发难度。其中,布局、布线两个环节作为核心技术难关尤为难以攻克。
海外FPGA厂商已建立成熟的EDA软件生态环境。
AMD(Xilinx)研发的Vitis、Vivado以及Vitis AI设计工具可以帮助 AI 科学家、应用与算法工程师、嵌入式软件开发人员以及传统硬件开发人员等所有类型的开发人员使用AMD自适应计算解决方案。
Intel(Altera)Quartus Prime软件包含从设计输入和合成到优化、验证和模拟的所有步骤,另有Questa等多款其他软件,覆盖FPGA、CPLD和SoC FPGA的完整开发工具。Lattice也具有Diamond、Radiant、Propel等设计工具,提供专为Lattice器件而优化的设计流程。
国产FPGA厂商亦不落下风,研发投入占比较大。
紫光同创Pango Design Suite软件开发工具是一款拥有国产自主知识产权的大规模FPGA开发软件,可以支持千万门级FPGA器件的设计开发。
复旦微也已具备全流程自主知识产权FPGA配套EDA工具ProciseTM。安路科技TangDynasty、FutureDynasty是其自主开发的FPGA、FPSoC集成开发环境,其中FutureDynasty可以实现RISC-V工程的编译与调试,根据其招股书披露数据,2018-2021H1,FPGA及FPSoC软件研发相关投入分别占总研发投入的25%/30%/26%/19%,软件工具的研发亦成为FPGA公司研发投入的重要组成部分。
数据中心对FPGA行业驱动力不及预期风险,其他传统下游应用领域需求不足风险;国产替代进展不及预期风险;竞争加剧风险。
——————————————————
报告属于原作者,仅供学习!如有侵权,请私信删除,谢谢!
报告来自【远瞻智库】