网站导航

合作伙伴

当前位置:主页 > 合作伙伴 >
南粤风采36选7服务器系列报告一(计算篇):C
时间:2020-12-12 12:23

  【安信电子行业深度】数据中心产业链梳理:CPU平台升级,DRAM周期反转,PCB量价齐升

  围绕服务器计算、存储和传输三大功能,我们继续发布系列深度,本篇为系列一计算篇,重点阐述CPU(XPU)升级及其影响。

  (1)流量需求长期稳定向上,无线通信和数据通信发展的核心驱动都是流量增长,具体表现为3G/4G/5G网络部署以及后周期数据中心的持续投资;

  (2)从行业周期的角度,相比于无线通信技术十年一代的升级周期,服务器平台技术持续升级周期仅为2~3年,说明数据算力提升的需求比网络带宽增加的需求更大;

  (3)从市场空间的角度,服务器市场规模超过930亿美元/年,基站设备约为215亿美元/年(服务器基于IDC数据,基站基于三大运营商CAPEX及中国占全球70%左右市场);

  (4)供给端:服务器硬件升级的核心是数据处理(XPU)、存储(DRAM和SSD)和传输(光通信-连接器和光模块),国产化能力长期偏弱,供应链集中在欧美日韩台地区,但在贸易战和全球供应链危机背景下,已经呈现加速发展的趋势,我们认为中国大陆电子产业链下一个十年重点看国产替代,服务器产业链值得重视。

  ■我们推出系列报告详细拆解服务器产业链:系列一至五将分别介绍计算、存储、传输、其他相关固件、以及代工行业投资机会。本篇为系列一计算篇,重点阐述CPU(XPU)升级及其影响:

  (1)CPU围绕微结构和制程工艺持续升级,带动芯片设计、制造和封测全产业链景气度回升;

  (2)下一代CPU将兼容最新内存标准和PCIe总线标准,“CPU+芯片组+总线”平台升级影响在于:主板PCB高速性能跃进(层数和材料变化);CPU功耗增加,主板散热性能和电源功率同比提升。

  (1)华为鲲鹏生态系统及系列服务器市场推广进度(云计算IaaS市场全球第六国内第三);

  (2)CPU/GPU/AI加速芯片上游制造和封测产业链,建议关注中芯国际、长电科技和通富微电(封测)和兴森科技(封装基板)、胜宏科技(显卡线路板),推荐深南电路;

  (3)主板高速PCB及上游覆铜板CCL材料,重点推荐生益科技和华正新材(CCL)、深南电路和沪电股份(PCB);

  (5)服务器主板模块电源,关注中国长城(持有飞腾30%股权)、新雷能和中恒电气。

  ■风险提示:Intel下一代服务器CPU平台升级不及预期;Intel 10nm制程工艺不及预期;华为鲲鹏生态建设和推广不及预期

  服务器主板上数据传输流依次为CPU、内存、硬盘和网卡,针对图形加速特殊场景增加GPU。具体过程表现为:数据经由网卡封装与解封、链路管理、数据编码与译码后,储存于外存(硬盘为主)之中;当程序需要执行时,将数据从外存经由一级存储器,传至CPU。其中一级存储器分为容量相对较大的主存储器(内存DRAM)和容量较小但速度接近CPU的高速缓存。

  CPU发挥“大脑”的功能,负责数据的处理和运算,CPU与GPU、内存、硬盘和网卡间并不能直接通信,需要通过内存控制芯片、PCIe控制芯片和I/O处理芯片等实现,这类通信协调芯片构成主板上的“芯片组”,芯片组通过各类不同总线(PCIe总线、USB总线和SPI总线等)与CPU相连。如果说CPU是“大脑”、总线就是“神经结构”,芯片组就是“神经中枢”,决定了主板总线频率和带宽,以及扩展插槽和扩展接口的种类和数量。

  围绕微架构和制造工艺,CPU本身持续升级换代;同时由于CPU结构和功能设计影响芯片组的集成度和总线类型,“CPU+芯片组+总线”构成“CPU平台升级”;平台升级带动服务器主板和其他配件同步换代。服务器CPU厂商在新一代CPU正式发布之前,一般提前2年左右将平台雏形、投放和测试性能以及样片给客户,做同步测试(兼容性和生态)和研发,确保芯片与使用该芯片的服务器同步上市。因而,除CPU和芯片组之外,还需要关注平台升级对其他服务器硬件的影响:

  主板方面,包括PCIe总线、内存、GPU和SSD。CPU内部集成PCIe控制器和内存控制器,PCIe总线点对点连接CPU与各类高速设备,包括GPU、SSD和网卡等,伴随PCIe升级至5.0,新一代CPU平台产品将兼容PCIe5.0标准,带动各类高速设备同步升级;而内存将从DDR4型号升级至DDR5,相关厂商或将逐步进入量产阶段。

  服务器CPU架构包括X86、ARM和MIPS等,x86为当前服务器CPU主流架构,几乎占据目前服务器全部市场份额,代表性厂商为Intel和AMD。国内方面,海光、兆芯和申威等也参与X86架构CPU的国产化替代,目前主要定位政务市场。短期来看,Intel在服务器市场历史深厚,全球CPU市占率在95%左右。未来2~3年内,Intel仍有望保持行业龙头的地位,因而围绕其CPU平台的升级仍是影响服务器硬件产业链周期性变化的关键因素。

  Intel以Xeon为品牌名称持续推出系列产品,产品型号命名复杂且动态变化:

  (2)每一代平台产品具有多个子代,视CPU架构、工艺、PCIe控制器和内存控制器的不同而有差异:例如,自2017年7月规模商用的Purley平台包括SkyLake和CascadeLake两代,均采用14nm工艺最高28核心,但是支持的内存通道数从6通道升级至8通道,PCIe3.0接口数增加。

  (3)不同平台的各个子代拥有多种型号名称:2017年Purley平台将产品型号命名方式由此前连续使用四代的E7/E5变为“至强可扩展处理器(Intel Xeon Scalable Processor,SP)”,系列型号按铂金(Platinum)、金(Gold)、银(Silver)、铜(Bronze)定义。

  2006年,Intel借意钟摆摆动周期提出“钟摆战略(Tick-Tock)”,Tick年(大年)改制程工艺,Tock年(小年)改架构,按照两年的周期交替推进产品升级,该模式下Intel成功推进了22nm~14nm系列芯片的迭代。

  2016年,Intel终止“Tick-Tock”转而采用“制程-架构-优化”(PAO)战略,P(Process)年改工艺,A(Architecture)年改架构,O(Optimization)年优化,按照三年的周期交替推进产品升级。背后原因主要在于芯片制造工艺升级的进度放缓。

  新一代产品升级会带动CPU性能提升一倍,价格增长20%~30%。CPU由运算器、控制器和寄存器组成,在服务器中性能最重要,成本也最高,视不同参数而异,均价在1500元/片,占服务器硬件成本的20%以上。一个CPU可以封装多个处理器内核,称为“多核并行”,多核CPU既可以提高运算性能,又可以延长服务器生命周期。最新一代Intel Xeon Cooperlake 10nm工艺为56核心,使用周期为3年以上。下一代核心数和单核心性能有望同步跃升,带动价格上行。虽然考虑到兼容性问题,新产品上市后老产品仍会存在一定时间,且迎来降价,但新产品爬坡进度较快,甚至有望在一年内达到50%以上,而老产品逐步退场。事实上,从Intel数据中心(DCG)业务收入来看,新产品上市会带动相关业务持续2~3个季度的高增长。

  受益于CPU升级换代,服务器需求量有望迎来增长。主要是新平台上市前,下游厂商会部分延缓采购需求,而等到新平台上市后,将前期压抑的需求释放出来。在数据指标上,受产品出货顺序的影响,CPU是服务器上游元器件,因而最先反映服务器市场需求情况,Intel DCG业务增速成为行业景气度先验指标,大概提前4~5个季度。2019年上半年连续两个季度负增长后Q3开始出现回升,连续Q3和Q4两个季度增长,预示下游服务器需求企稳回升。

  服务器需求量增长带动CPU出货量提升,且增速高于服务器出货增速。单台服务器按性能需求可以使用多个CPU,一个CPU称为单路,两个CPU称为双路。目前广泛使用的均为双路服务器,而四路、六路及以上服务器也有特定的应用场景。一般而言,八路及以下服务器为普通机,16路及以上服务器为小型机,大型机则一般以定制化独立封闭系统为主。总体看,目前服务器市场以双路服务器为主,根据ZDC数据显示,2018年双路服务器受到47%的关注,四路服务器受到29%的关注。随着云计算大数据的普及,四路服务器展现出较广阔的市场空间,具体应用领域有ERP系统、商业智能分析和虚拟化应用等。

  量价齐升,Intel数据中心(DCG)业务回暖迹象明显,从以往来看,新产品上市会带动DCG业务持续2~3个季度的高增长,2020年及2021年Intel Whitley和Eagle Stream陆续上市,DCG业务有望迎来新一轮高增长。Intel产品主要覆盖PC、数据中心、物联网、存储器和编程五大板块,2019财年依次实现收入371亿美元、235亿美元、47亿美元、44亿美元和20亿美元,收入占比依次为51.5%、32.6%、6.5%、6.1%和2.8%。

  Intel业务覆盖设计、制造和封测全产业链,是典型IDM厂商,尤其在HPC领域主要依靠自主产能。因而当前背景下由Intel主导的服务器CPU平台升级,受益于此的芯片产业链厂商限于Intel自身。在中国大陆,Intel拥有大连和成都工厂,其中成都工厂是Intel最大和技术最顶尖的封测基地(大连工厂目前聚焦存储业务)。

  制造端,服务器HPC(高性能计算)芯片制造工艺已经从2017年普遍使用的14nm工艺向10nm和7nm演进。芯片制造包括IDM(Integrated Device Manufacture)和Foundary代工厂两种模式,IDM厂商如Intel和三星等,Foundary厂商如台积电和格芯等,但是主要参与者在工艺进度上存在差距。从目前主流制造厂进度看,Intel服务器CPU还停留在14nm工艺,核心看点是2020年秋季发布的Ice Lake(Whitley平台)10nm工艺以及2021年初Sapphire Rapids(Eagle Stream平台)7nm工艺。相较之下,竞争对手AMD已经在2019年Q4的Rome系列使用7nm工艺,代工厂为台积电。格芯于2012年从ADM拆分而来,目前在工艺制程上相对落后。

  封测端,HPC(高性能计算)芯片封装主要依靠立体堆叠技术,目前普遍应用的是扇出型晶圆级封装(FOWLP)与2.5D封装,未来将向3D封装演进。3D封装通过高端TSV(硅穿孔)技术,将处理器(CPU/GPU/FPGA/NPU)和存储器(HBM,高频宽存储器)垂直叠合,从而减小传输路径,提高整体运算速度。相较于FOWLP和2.5D封装技术,目前3D封装开发成本高、制程难度上复杂、成品良率较低。根据Yole的数据,2018年HPC占据2.5D/3D封装市场的20%,到2023年有望提升至40%。

  封测行业包括IDM和OSTA(Out Sourced Assembly and Testing,委外封测代工)两种模式,参与者包括IDM厂商(如Intel、三星、美光和海力士等)、OSTA厂商(如日月光、安靠、长电、力成、华天和通富等,以及Foundary代工厂如台积电和格芯等)。2008年,IDM和OSTA占比分别为56%和44%,2018年则为46%和54%。因而封测行业呈现由IDM向OSAT逐步转型的趋势。

  根据Yole数据,在先进封装晶圆市场份额方面,2017年英特尔12.4%、矽品11.6%、长电科技7.8%位列第三。而在HPC先进封装领域,IDM厂商和Foundary代工厂走在前列。Intel于2019年初提出Foveros的3D封装,2019下半年陆续有进展。台积电于2019年4月完成首颗3D IC封装,2020年逐步导入,预计将于2021年量产。格芯于2019年8月采用12nm FinFET工艺成功流片基于ARM架构的HPC 3D封装芯片。

  X86市场Intel是当前绝对龙头,AMD为最大潜在竞争对手,7nm制程工艺已经超过Intel当前10nm水平。根据Mercury Research,2019年Q4 AMD在服务器、PC和移动CPU市场份额分别达5%、18%和16%,CPU整体市场份额约为15%。AMD 高管表示,现阶段目标是在服务器、PC和笔记本市场分别占据26%、25%和17%份额。

  ADM主营业务划分计算和图形、企业嵌入式和半定制化两大大板块,2019年计算和图形业务收入47.09亿美元,营收占比约70%;企业嵌入式和半定制化业务收入20.22亿美元,营收占比约30%。其中计算和图形板块收入贡献主要来自CPU。

  Zen CPU架构路线图包括企业级EPYC霄龙、消费级Ryzen锐龙两条线。服务器EPYC方面,根据易特创芯,AMD已发布两代产品,分别是14nm Zen“那不勒斯”(Naples)、7nm Zen 2“罗马”(Rome),即EPYC服务器芯片跳过Zen+架构直接进入Zen 2架构。接下来7nm Zen 3(Milan),5nm Zen 4“热那亚”(Genoa)正在规划中,AMD透露“米兰”有望于2020年Q3推出,预计“热那亚”推出时间最晚在2022年上半年,内存DRAM方面兼容DDR5。

  AMD EPYC的发布和使用,使Intel垄断地位遭到挑战。从目前进展来看,Intel 10nm工艺进展缓慢(7nm预计在2022年以后发布,但目前下游还没有拿到测试样片),AMD 7nm工艺处理器有望在2020年商用。目前AMD与下游联想等展开合作,服务器产品在微软、腾讯和阿里开始小批量渗透。根据Mercury,2018年Q2以来Intel市占率从99.5%开始持续被AMD蚕食。

  AMD于2008年实施轻资产战略,此后通过一系列业务分拆逐步从IDM芯片商转型为Fabless设计商:(1)2009年将晶圆制造部门独立出来,成立格芯(GlobalFoundary),2012年出售给阿布扎比的阿联酋姆巴达拉技术公司;(2)2015年将中国苏州和马来西亚槟城封测厂出售给通富微电,并通过合资公司(JV)的形式运营,通富微电和AMD分别持股85%和15%的模式,通富微电支付3.71亿美元作为交易对价。

  (1)代工方面,台积电于2018年率先实现7nm工艺量产,同时5nm工艺领先同行业半年以上,预计将于2020年下半年实现大规模量产,因而台积电是AMD服务器CPU代工的主力供应商;

  (2)封测方面,通富微电收购AMD苏州和槟城工厂后,承接了AMD 80%的封测业务(根据公告),通富超威苏州成为第一个为AMD 7nm全系列产品提供封测的工厂(根据通富微电2019年年报);

  (3)封装基板方面,封装基板占封测成本的40%以上(根据深南电路公告),目前供应链集中在日韩台地区,日本尤其占据高端CPU封装基板市场,2017年全球前十大IC载板厂商合计市占率高达 83.3%(根据 Prismark),行业集中度高。国内从2008年开始相继布局,目前产品集中在微机电系统、存储和射频模块等领域,主要应用于移动手机,深南电路和兴森科技进展相对较快,2019年上半年IC基板业务分别实现营业收入5.01亿元和1.35亿元。

  基于以上分析,处理器代工和封装基板国产替代空间大,长期成长可期,建议重点关注国产替代供应商中芯国际、深南电路和兴森科技等;短期从业绩弹性的角度,AMD产业链建议重点关注上游封测供应商通富微电。

  通富微电于2016年联合大基金收购AMD中国苏州和马来西亚槟城高端封测厂,公司和AMD分别持股85%和15%成立了两家合资企业。苏州和槟城工厂作为高端平台,以FCBGA产品为主,主要开展CPU、GPU及游戏机芯片封测业务,目前已开始量产AMD 7nm产品。2018年全球排名由2017年的第七上升至第六。公司目前前两大股东为华达集团和国家集成电路产业投资基金(以下简称“大基金”),股权占比分别为26.66%和21.72%。

  截至目前,公司拥有崇川、苏通、合肥、苏州、厦门、马来西亚槟城六家工厂:崇川是大本营,产品较为综合;苏通工厂产品主要应用于手机;合肥工厂重点是超高密度框架封装产品,同时承接周边存储器及LCD驱动器业务;厦门工厂重点做BUMPING和WLCSP,以及LCD驱动器、Gold BUMP产品。

  客户方面,公司覆盖50%以上全球前20强半导体企业,主要客户有AMD、MTK、ST、TI、NXP、英飞凌、Broadcom、东芝、富士电机、瑞昱、展讯、汇顶、卓胜微、艾为、韦尔等。其中,AMD为第一大客户,根据2019年年报,公司前五大客户合计收入占比为67.03%,其中AMD占比为49.32%,第二大至第五大客户收入占比依次为6.64%、4.96%、3.84%和2.28%。

  2019年公司业绩呈现前低后高的特征,上下半年分别实现营业收入35.87亿元和46.8亿元,分别同比增长3.13%和24.97%。主要原因是上半年半导体行业整体低迷,而下半年受益于大客户AMD 7nm高端处理器上市,公司相关产品顺利实现量产,2019年Q3和Q4分别实现营业收入24.67亿元和22.12亿元,同比增长23.26%和26.92%。

  长期来看,一方面,AMD在X86架构下产品进度势如破竹;另一方面,ARM架构有望发挥在移动端市场的份额优势,借力端/云协同,抢占服务器市场更多份额,目前站队ARM架构的代表厂商包括华为海思、飞腾、高通、Cavium和Amazon等。此外,国产化主旋律下,以华为、飞腾、海光和兆芯等为代表的本土CPU厂商有望抢占国内利基市场,包括政务、金融、电力等国产化需求强劲的部门。

  2015年4月9日,美国商务部拒绝Intel向国家超级计算广州中心出售芯片用于“天河二号”系统升级的申请,同时国家超算长沙中心、广州中心、天津中心和国防科大被列入出口管制名单,极大地刺激了国产处理器芯片的产业化进程。2019年5月,华为再次遭遇美国商务部芯片禁运,国产化替代更为紧迫。

  经我们测算,国产CPU拥有42亿美元以上的本土市场空间,且未来受益于数据需求量提升,空间有望持续扩大。不同线程、工艺和主频的服务器CPU价格不同,按照1500美元/片的平均单价以及3000万片/年的出货量测算,市场规模在450亿美元/年左右。结构上,根据IDC,2019年中国市场服务器出货量约占全球的30%,市场空间约为135亿美元/年,其中来自云巨头、互联网厂商、政府、金融和制造业的需求占比依次为39%、26%、19%、12%和2%,需求规模依次为50亿美元、34亿美元、26亿美元、16亿美元和3亿美元。从需求特征来看,云巨头越来越加速服务器甚至是上层处理器和AI芯片的自研,互联网厂商基于性价比考虑主要拥抱Intel和AMD等国际巨头CPU供应商,而国内政府、金融和电力企业等处于安全考虑国产化需求持续提升,这部分市场空间超过42亿美元。

  CPU国产化途径主要有三种:一是获得IP核授权,二是获得指令集架构授权,三是自主研发指令集。其中,IP核授权以一个内核为基础加上自己的外设,技术门槛相对较低,功能上可以实现差异化,但自主可控程度较低;指令集架构授权则可以对架构进行扩展或缩减,自主可控程度高,但技术难度也比较大,同时面临生态系统构建的难题。目前商用的指令集架构主要包括x86、ARM、MIPS和ALPHA等:

  x86架构掌握在Intel和AMD手中,不对外开放,天津海光和兆芯通过IP核授权的方式自研CPU;

  ARM架构为ARM公司所有,对外开放架构授权和IP核授权,国内华为鲲鹏和飞腾均获得64位V8指令集授权;

  MIPS架构在2018年获得Wave Computing的正式完全开源,国产厂商 龙芯在2008年一次性买断MIPS指令集永久授权;

  ALPHA架构为美国DEC所有,目前已经停止更新,国产申威获得该架构授权,主要用于超算和军用市场。

  从技术优势、市场应用和生态系统构建等角度看,ARM架构目前最具与x86抗衡的实力。

  相较于x86,ARM在“多核并行”提高CPU算力方面更具技术优势。CPU算力提升路径有两种,一是提高单个核心的运算效率,通常以CPU主频大小来衡量,主频越高,运算速度越快,这种方法主要以质取胜;二是增加运算核心的数量,在同一个硅片(Die)上集成多个独立的物理核心,通过协同工作实现性能倍增,这种方法以量取胜。虽然CPU主频与算力正相关,但也与功耗正相关,当主频提高到一定水平,会面临功耗的约束。x86更注重单核性能,坚持性能+速度的发展方向与模式,功耗几十瓦到几百瓦不等;ARM则偏重多核并行,功耗上较x86表现更好。

  开发难度低、设计自由度高、自主化程度强是ARM架构相较于x86的另一大优势。ARM架构由ARM公司以IP设计和对外授权的方式运营,合作伙伴获得IP授权许可证,并支付IP许可费用和每块芯片版税。在IP授权形式下,芯片设计商可以直接拿到授权图纸,研发周期大大缩短,同时可以结合自身需求开发出定制化的CPU。而x86授权相对封闭,目前下游芯片设计商仅可以通过处理器核授权而非架构授权的方式开发产品,设计自由度和自主可控度都比较低。

  ARM公司于2016年被日本软银高额溢价收购,并从伦交所退市。ARM公司最初由苹果、诺基亚、Acorn、VLSI、Technology等合资创立,2016年9月7日,日本软银正式以240亿英镑完成对ARM的收购,ARM也正式从伦敦证券交易所退市。从估值看,2015年ARM销售收入和净利润分别为14亿美元和5亿美元,按收购对价PS和PE分别为17倍和48倍,而同期美股Intel PS和PE估值分别为3倍和17倍,AMD PS估值为2倍(2015年亏损6.6亿美元)。

  此外,ARM在移动端市场拥有绝对优势,受益于端云协同,市场有望不断向服务器和网络基础设施市场延伸。移动终端和IoT市场超过90%的CPU基于ARM架构研发,包括高通、苹果、华为海思和三星等。根据IDC,移动终端占全球终端出货量比重已经由2010年的44.7%上升到2018年的77.6%,预计到2023年将超过80%。此外,移动应用也主要基于ARM指令集开发、测试和运行。

  服务器:受益于云游戏、移动办公等的兴起,移动应用将逐步向云上迁移。端云协同下,云端计算架构采用与移动端相同的计算平台,可以实现应用开发、部署和运行的无缝协同,大幅降低开发者难度。目前ARM在服务器市场占有率不到5%,未来有望打破x86垄断地位。事实上,在分布式数据库、大数据、Web前端等高并发应用场景,ARM架构“多核并行”的优势明显,众多芯片设计商和云巨头均已布局基于ARM架构的服务器系列产品。

  网络基础设施:目前基于ARM的处理器在网络基础设施市场(基站)约占28%份额(根据IDC)。2020年4月16日ARM加入O-RAN联盟(由全球主要运营商于2018年在MWC期间成立,致力于接口开放化、硬件白盒化和软件开源化),进一步深化5G基础设施市场布局。传统网建使用诺基亚、爱立信和华为等提供的专有硬件(OEM),运营商为应对5G网络建设正努力用白盒平台取代黑盒硬件,西班牙电信和沃达丰已在欧洲和非洲大部分地区部署Open RAN技术。ARM Neoverse芯片架构专门针对此开发,2020年Marvell最新一代Octeon处理器搭载ARM芯片,Ampere推出业内第一款80核ARM架构64位处理器Altra,用于云和边缘计算数据中心(曾推出的 Octeon TX2 被诺基亚和三星宣布用于下一代基站硬件)。

  芯片设计商方面,国际上高通和Cavium等曾推出基于ARM架构的服务器CPU;国内方面,飞腾和华为是ARM架构的主要拥护者:

  飞腾基于ARMv8指令集,于2016年发布飞腾2000,最高支持64核心,主频1.5GHz~2.0GHz,制程为28nm,功耗100W,在性能上与Intel E5服务器芯片持平。

  华为于2019年推出第二代鲲鹏920,同样基于ARMv8指令集,最高支持64核心,主频2.6GHz,采用7nm工艺,功耗较业界基准降低30%。

  云巨头方面,Amazon和Microsoft均布局使用基于ARM架构的服务器CPU。此外,Amazon和华为均基于ARM架构自主研发系列处理器芯片,即基于ARMv8架构,自研处理器核、微架构和芯片设计。目前均已实现商用。

  Amazon于2015年以3.5亿美元收购以色列芯片公司Annapurna Labs,该公司主要研发服务器微处理器。2019年12月,Amazon推出基于ARM架构的自研Graviton 2处理器,成本较上一代芯片降低45%(根据电子说)。

  华为:很早便基于ARM架构打造从芯片到服务器的系列产品,已获得Armv8架构永久授权。2019年发布ARM服务器芯片Kunpeng 920(鲲鹏920),以及基于该处理器的三款TaiShan(泰山)服务器。鲲鹏920采用7nm工艺,可支持64个内核,主频达2.6GHz,集成8通道DDR4和100G RoCE以太网卡;支持PCIe4.0,可提供640Gbps总带宽。

  1.3.2.1.飞腾:基于ARM架构形成完整家族产品,主要定位超算和党政军市场

  天津飞腾产品有CPU、ASIC和SoC等,CPU主要包括入门级服务器的FT-1500A/16、高端服务器的FT-2000+/64、桌面终端的FT-1500A/4、应用于嵌入式工控的FT-2000A/2等。公司最初由国防科大高性能处理器研究团队建立,于2014年成立于天津滨海。

  飞腾CPU演进与我国超算成长史同步:以Sparc架构(开源)为基础设计了FT-1000和FT-1500两款CPU,分别在天河一号和天河二号超算中心获得使用;2012年选择ARM阵营,获得授权后开发出FTC660、FTC661两款CPU核,以及FT-1500A/4、FT-1500A/16、FT-2000、FT-2000plus 5款CPU。“天河三号”E级原型机采用全自主创新的飞腾CPU。目前,飞腾系列CPU已经形成完整家族,可满足党政军多个领域的实际需求。

  2019年8月26日,中国长城以3.5亿元向华大半导体(实控人为中国电子)和中国振华(实控人为中国电子)分别收购其持有的天津飞腾13.54%和21.46%股权,收购完成后,中国长城持有天津飞腾35%股权,为第一大股东。

  ²国防科大自1978年承担我国巨型机研发。1984年由其主导研发的第一代巨型机“银河”面世;2007年,国防科大与天津滨海新区签署合作协议,联合开展千万亿次超算研制,共同建设国家超算天津中心,命名为“天河”,2009年天河一号研制成功,计算速度曾位居世界第一;2013年6月17日,天河二号面世,计算速度再次登上全球榜首;2020年,运算速度将达到百亿亿次的天河三号有望研制成功,首次实现所有元器件国产化,同时也是继神威太湖之光之后第二台全面搭载国产自主处理器的超算平台。

  2017年和2018年,天津飞腾分别实现营业收入3265万元和6369万元,分别实现净利润82.79万元和170.50万元。同期,中国长城分别实现营业收入96.07亿元和100.09亿元,分别实现净利润6.69亿元和10.56亿元。目前,飞腾营收体量还比较小,且主要定位超算和政务市场,但是定位ARM路线有望受益于行业生态体系的培育实现发展壮大,未来需持续关注民用化进程。

  1.3.2.2.华为:“一云两翼双引擎”布局鲲鹏计算产业,2020年加速发展

  2019年9月,华为首次发布基于“鲲鹏+昇腾”双引擎计算战略,打造“一云(华为云)、两翼(智能计算业务、智能数据与存储业务)、双引擎(鲲鹏芯片、 昇腾芯片)”计算产业布局,包括PC、服务器、存储、操作系统、中间件、虚拟化、数据库、云服务和行业应用等。

  云服务方面,华为云成立于2011年;2017年3月成立Cloud BU开展公有云业务;2019年,华为Cloud&AI(整合了计算、存储和云服务)正式从BU上升为BG,与运营商、消费者和企业三大BG并列。华为云虽然相较于竞争对手进入市场较晚,但凭借全栈(硬件+软件/前端+后端)技术能力发展迅猛:

  在中国市场,入选Gartner中国云计算IaaS第一梯队。2019年Q1~Q3在IaaS+PaaS市场连续3个季度增长超过300%,IaaS+PaaS和IaaS市场份额均超7%(根据2019年年报),排名均上升至第四;2019年Q4在IaaS和PaaS市场均位列第三(根据Frost&Sullivan)。在IaaS市场,阿里云、腾讯云、华为云、天翼云和金山云位列前五,市占率合计达78.1%;在PaaS市场,阿里云、腾讯云、华为云、天翼云和AWS位列前五,市占率合计达81.6%。

  在全球市场,华为云全球IaaS市场排名上升至第六,增速高达222.2%,全球增速最快(根据Gartner)。2019年华为云新加坡、智利、巴西、墨西哥、秘鲁大区陆续开服,与伙伴在全球23个地理区域运营45个可用区。

  具体业务方面,下游行业应用的培育是业务开展的关键,而行业应用拓展存在的难度主要包括:(1)行业广、应用多、堆栈深、区域属性强,软件组件依赖关系复杂(只要一个环节不支持整个应用不可用);(2)用基于传统计算架构的行业标准来评估新计算架构,制约行业应用往新计算架构迁移。比如HPC行业应用普遍采用衡量双精度浮点计算能力的HPL(High-Performance Linpack)标准来评估系统性能,但这并不符合内存密集型等应用的业务实际需求;(3)应用软件迁移到新计算平台带来的额外成本与带来的市场收入不成比例。

  鲲鹏计算产业布局主要三个阶段(根据华为《鲲鹏计算产业发展白皮书》):第一阶段为试点阶段,树立标杆行业典型场景,具体包括政务、电信、金融和互联网;第二阶段为推广阶段,将行业范围扩展至18+;第三阶段为深化阶段,达到全行业全场景。截至目前,鲲鹏计算产业在政府、金融、电信和互联网等主要场景已经规模商用,可满足20%业务场景迁移至鲲鹏计算平台。

  在芯片布局方面,华为拥有ARMv8永久架构授权,并完全掌握64处理器核芯片设计技术,在此基础上发布了基于ARM架构的鲲鹏系列处理器,同时开发了包括“算、存、传、管、智”在内的全面芯片体系。

  2019年1月华为发布的服务器处理器 Kunpeng 920(鲲鹏920)性能表现优异:鲲鹏920包括32/48/64核版本,采用7nm制程工艺,主频可达2.6GHz,集成8通道DDR4和100G RoCE以太网卡,还支持PCIe4.0接口,可提供640Gbps总带宽。典型主频下,SPECint Benchmark 评分超过930,超出业界25%;能效比优于业界标杆30%。相比竞品内存宽带提升46%,总I/O带宽提升66%,网络带宽提升4倍;

  除了处理器芯片(XPU),华为大力拓展硬件OEM和软件(操作系统、数据库和虚拟化等)合作商,从关键器件(电源芯片/CPLD)、核心部件(SSD卡、网卡、RAID卡、显卡和内存等)、基础软件到上层行业应用:

  服务器整机普遍存在厂商利润率低、硬件设计(包含BIOS、BMC芯片)能力参差不齐、以及配套部件(内存、硬盘、网卡、显卡等)可获得性、兼容性差等问题。泰山服务器旨在树立标杆,使能整个鲲鹏计算产业链,带动相关厂家发展基于鲲鹏处理器主板的自有品牌服务器。当条件成熟华为可逐步停止泰山服务器销售,转为服务器主板和部件供应商,最终在服务器整机领域形成多厂家的格局。2020年3月27日华为开发者大会上,华为Cloud&AI BG总裁侯金龙表示,华为已在北京、广州等地成立15个鲲鹏创新中心,11家品牌商推出基于鲲鹏主板的服务器和PC产品。

  (2)联合整机、BIOS、厂商和OS厂家共建开放的IO总线和管理接口标准:

  OS厂商适配多种CPU架构导致版本多,OS与应用适配工作量大;基础软件厂商(数据库、中间件、大数据、云平台)对鲲鹏计算平台的适配仍处于起步阶段 ,缺少核心系统应用。建立IO总线和管理接口标准并对外开放,一方面相关企业可以开发各种部件,另一方面使能IBV(独立BIOS供应商)发展BIOS生态,使整机厂商具备总线定制能力,进而实现品牌差异化。截至目前,鲲鹏计算产业已经有相对完整的基础软件生态,获得了Linux操作系统、虚拟化软件、数据库、中间件等的全面支持。

  (3)基于自身的硬件兼容性实验室,对操作系统、内存、硬盘、网卡等进行统一的兼容性认证测试,并定期发布兼容性清单,从而保证OS、部件与整机的兼容性。

  从业务成长性看,华为主要经营运营商、消费者、企业三大业务,2019年三大业务分别实现收入2967亿元、4673亿元和897亿元,收入占比依次为34.55%、54.41%和10.45%,收入增速分别为3.8%、34%和8.6%。除以上三大业务外,2019年其他业务收入为51.3亿元,同比增长30.6%,收入占比0.6%(华为尚未对Cloud&AI业务单独披露)。当前,运营商业务发展已经步入成熟期,华为在全球通信主设备市场位列第一;消费者业务加速成长,华为手机销量仅次于三星位列全球第二;企业业务增长稳定;Cloud&AI业务基数小,发展潜力巨大。

  服务器端:2019年华为实现硬件收入36.47亿美元(根据IDC),同比下降6.5%,市场份额为4.2%,全球排名位列第七。

  云服务端:2019年华为云增长超过3倍(根据徐直军)。2019年全球云计算IaaS市场规模达445亿美元,同比增长37.3%,前四大龙头亚马逊AWS、微软、阿里和谷歌份额分别为45%、17.9%、9.1%和5.3%,华为位列第六(根据Gartner)。因此对标云计算巨头,华为依靠鲲鹏生态系统建设,发展空间巨大。

  受益于华为鲲鹏计算产业链的培育,行业上下游有望分享红利。根据《鲲鹏计算产业发展白皮书》,到2023年全球计算产业投资空间1.14万亿美元,中国占比约10%达1043亿美元,其中服务器及部件市场空间预计2378亿元,假设鲲鹏架构市场份额50%,则2023年鲲鹏服务器硬件市场空间1189亿元。

  华为鲲鹏系列服务器的发展思路是,现阶段通过泰山服务器树立标杆使能整个产业链,带动相关厂家发展基于鲲鹏处理器主板的自有品牌服务器,形成多厂家格局;当条件成熟,华为或将逐步停止泰山服务器销售,产能由核心合作伙伴承接。

  服务器整机市场有品牌厂商和ODM厂商两类:(1)品牌商完全自主研发、设计、采购、组装和销售,具备硬件架构设计能力及配套软件开发能力,通过招标和渠道的方式分别向下游客户销售;目前主要的品牌厂商包括HPE/H3C、戴尔、浪潮、IBM、华为和联想等。(2)ODM厂商则为品牌厂商提供部分机型的代工生产,主要负责后端制造,在产品研发环节配合主要客户完成,同时在销售环节面向大客户以阶段性招标和锁价的形式实现,往往是台系厂商,包括:纬创、纬颖、富士康、广达和英业达等。

  目前,全球服务器自主品牌参与者主要包括戴尔、HPE、浪潮、华为、新华三、联想、IBM、曙光和宝德等。2019年全球服务器市场前三依次是戴尔、HPE、浪潮(按销售额,根据IDC),市场份额分别为17.8%、14.8%和7%;中国服务器市场前三名依次是浪潮、华为和新华三,市场份额分别为28.7%、16.4%和13.1%,排在后面的依次是戴尔、联想、曙光和宝德,合计占比32.1%,ODM厂商占比2.9%。

  截至2020年3月底,已有11家品牌商推出基于鲲鹏主板的服务器(根据华为Cloud&AI BG总裁侯金龙),当前主要定位组装,未来可逐步提高设计能力,在泰山服务器退出销售后承接其产能:2019年9月,山西百信发布基于华为鲲鹏的“恒山”服务器;2019年12月,河南黄河科技集团成立“黄河”品牌,黄河鲲鹏服务器生产线正式投产并实现首批产品交付,规划2020年形成35万台的生产能力;2019年12月,湖南拓维信息成立湘江鲲鹏,并获得华为鲲鹏主板自主品牌服务器研发制造授权,公司预计在2020年4月完成产线月完成产品下线月份如期投产,今年的生产目标是6万台服务器和PC(根据公告);2020年1月,浙江东华软件宣布首批基于鲲鹏处理器的服务器“鹏霄”已经完成软硬件兼容适配,宁波鲲鹏生态产业园开园,鹏霄服务器首发首用;2020年3月,神州数码首个鲲鹏系列产品生产基地在厦门正式动工,一期整体规划面积三万平方米,生产基地为一万平方米。一期产线投产后,服务器年产能预计达10万台(根据公告);2020年3月,宝德发布基于鲲鹏处理器的服务器新品PR212K。

  受益于鲲鹏产业链的建立和完善,硬件端中长期看好鲲鹏系列处理器上游供应商,包括IC代工和封测。根据我们的假设和测算,2020年鲲鹏产业链服务器端代工和封测市场空间分别有望达到53亿元和18亿元。

  鲲鹏系列芯片代工主要由台积电承接,台积电是少数具备成熟7nm制造工艺的厂商之一;封测端,日月光矽品是全球第一大封测供应商,已进入华为鲲鹏供应链,将在今年三季度开始供货(根据与非网),国内厂商长电科技和通富微电技术储备成熟。目前通富微电主要为AMD供应商,承担80%左右的订单(根据2019年年报公告);长电科技与华为存在合作(根据2018年年报公告)。从合作深度和业绩弹性的角度,鲲鹏产业链建议重点关注长电科技。

  长电科技于2015年联合产业基金、芯电半导体以7.8亿美元收购新加坡封测龙头星科金朋(SCL)全部股份,2013年营收和毛利润分别为15.99亿美元和2.18亿美元。SCL产品主要应用领域为移动通讯,智能手机市场景气度业绩的关键影响因素。2018年SCL实现营业收入11.69亿美元,净亏损2.71亿美元。主要原因是2018年下半年智能手机进入新旧动能转化期,个别工厂大客户订单下滑,产能利用率不足以及计提资产减值准备。

  公司市占率和产品实力位居全球前列:2018年以13%的份额位列全球第三大封测厂商,仅次于日月光矽品29.3%和安靠15.4%(根据芯思想);先进封装晶圆方面,2017年以7.8%的份额位列全球第三大厂商封测厂,仅次于英特尔12.4%和矽品11.6%。产品实力方面,公司在新加坡(星科金朋)、韩国、中国江阴(本部和星科金朋)、滁州和宿迁设有生产基地,本部、星科金朋江阴厂和长电先进均建立起从芯片凸块到FC倒装的能力。目前客户覆盖85%的全球前二十大半导体公司。

  2019年上半年中国GPU服务器市场规模为8.3亿美金(根据IDC),同比增长53.7%,同期中国市场x86服务器市场规模为73.9亿美元,短期来看,即GPU服务器占x86服务器市场的11.23%,该比例从2017年的2.01%逐年提升。IDC预测,到2023年中国GPU服务器市场规模将达到44.5亿美金,5年CAGR为27.8%。而中国x86服务器市场约占全球的三分之一左右,假设按照此比例推算,2018年全球GPU服务器市场约为43.5亿美元,到2023年约达到148.3亿美元。

  GPU(Graphics Processing Unit,图形处理器)最初是用在PC和移动端上运行绘图运算工作的微处理器,与CPU集成以集成显卡(核显)的形态发挥功能。NVIDIA于2007年率先推出独立GPU(独显),使其作为“协处理器”在PC和服务器端负责加速计算,承接CPU计算密集部分的工作负载,同时由CPU继续运行其余程序代码。作为独显的GPU由GPU核心芯片、显存和接口电路构成,因而受益于新产品升级,GPU产业链除关注芯片代工和封测外,还应重视显卡PCB需求的同步提升。

  独立GPU与CPU之间通过PCIe总线连接,因而PCIe总线标准直接影响到通信带宽;而针对GPU之间的互连,Nvidia推出NVLink技术替代传统PCIe总线的方式,带动GPU性能5倍提升(根据Nvidia官网)。

  目前由于AI性能挖掘仍有空间,已经部署的服务器中GPU算力尚有冗余,预计PCIe由3.0升级至4.0和5.0短期内对GPU影响不大。但主流参与者仍在工艺路径持续推进产品升级。Nvidia占据独显市场近80%的份额(根据AIB Research),目前其主流产品还停留在12nm工艺,7nm正在规划中。根据Nvidia CEO黄仁勋表示,下一代7nm产品有望迅速推向市场,以配合制造商安排量产规划。

  而在独立GPU(独显)市场,Nvida是行业的奠基者和龙头,占据近70%份额。AIB 数据显示,2019年Q4,Nvidia和AMD在独立GPU市场份额分别为81%和19%。从新产品进展来看,AMD新系列采用7nm更先进工艺,Intel也表示将在2020年推出独立GPU,采用10nm工艺,主要用于游戏端,用于数据中心的高性能7nm工艺GPU有望在2021年发布。

  Nvidia有游戏、专业虚拟化、数据中心和汽车四大业务,2019财年四大业务营收分别为55亿美元、30亿美元、12亿美元和7亿美元,合计应收109亿美元,收入占比依次为51%、27%、11%和6%。其中,数据中心(DC)业务自2016年以来持续高成长,2016~2018年收入增速分别为155%、133%和52%,2017年超过专业虚拟化成为公司第二大收入来源。针对HPC和AI场景,Nvidia推出的产品主要是Tesla系列,包括V100、P100、K40/K80、M40/M60等多个型号,K系列更适合高精度计算,M系列更适合深度学习。

  2018Q4~2019Q3,Nvidia营收一直处于下降通道,连续四个季度营收增速为负(-24.25%、-30.78%、17.42%、-5.25%),主要原因是游戏负增长,同时DC业务受服务器出货量下滑的影响增速大幅放缓。然而2019Q4拐点已现,营收增速回暖,单季度同比增长高达40.82%。2019年3月,Nvidia宣布以49亿美元收购Mellanox,预计2020年4月底该项交易最终完成,成为Nvidia历史上最大的一笔收购。Mellanox是服务器和存储端到端连接解决方案的供应商,产品涉及HPC、云计算、数据中心、企业计算及存储市场,包括Smart NIC,网络交换机芯片和高速数据互联等;中国市场的主要客户包括阿里巴巴和百度等。该收购完成后,Nvidia在数据中心的业务布局更加完整,同时与Mellanox具有较好的客户协同优势。

  我们看好Nvidia作为独显龙头对于GPU产业链的整体拉动。从产业链来看,独显以扩展设备的形态存在,构件包括GPU核心、显存和接口电路,因此上游供应链除芯片代工和封测外,还有用于芯片集成的PCB。GPU核心端,Nvidia主流产品还停留在12nm工艺,7nm正在规划中,代工和封测以台积电和三星为主。显卡PCB方面,国内胜宏科技高密度多层VGA(显卡)市场份额位列全球第一(根据公司公告)。从长期市场空间增长和国产化替代进程两个视角,我们看好大陆PCB厂商的成长性,建议重点关注胜宏科技。

  胜宏科技PCB以多层板为主,2020年Q1收入结构为,通信类35%-40%、显卡15%、汽车10%、消费30%、LED 1%-2%(根据公司公告)。公司成立之初(2006年)就开始生产高精度多层显卡产品,目前显卡板(PC和主机)全球份额第一,直接客户包括基恩、影驰、蓝宝石、讯景等(根据公司公告)。截至2020年Q1,公司网通类服务器营收占比1%-1.5%,主要通过ODM厂商(富士康、华硕、技嘉等)布局到戴尔、惠普、阿里、腾讯、亚马逊等下游客户。公司推进与终端品牌的合作,计划向更高端产品切入,公司规划2020年服务器和数据中心业务收入15亿元,占整体规划收入比重超15%(根据公司公告)。此外,公司也在做内存条卡板,目前正处于客户导入和接触阶段。

  长期来看,AI芯片在智能摄像头、无人驾驶等领域应用广泛。数据、算力和算法是AI三大要素,“CPU+加速芯片”成为典型的AI部署方案,CPU提供算力,加速芯片提升算力并助推算法的产生。常见的AI加速芯片包括GPU、FPGA(Field Programmable Gate Array)和ASIC(Application Specific Integrated Circuit)三种类型。

  CPU适合逻辑控制和串行计算等通用计算,计算能力没有GPU强,主要由专为顺序串行处理而优化的几个核心组成;

  GPU用于大量重复计算,由数以千计的更小、更高效的核心组成大规模并行计算架构,配备GPU的服务器可取代数百台通用CPU服务器来处理HPC和AI业务(根据Nvida)。

  FPGA是一种半定制芯片,灵活性强集成度高,但运算量小,量产成本 高,适用于算法更新频繁或市场规模小的专用领域;

  ASIC专用性强,市场需求量大的专用领域,但开发周期较长且难度极高。谷歌自主设计了一款基于ASIC的TPU(Tensor Processing Unit)专门用于机器学习工作负载。

  训练和推断是云端AI两大运行过程,训练产生算法,推断实现算法应用。训练阶段需要大量数据运算,GPU预计占64%左右市场份额(根据赛迪顾问),FPGA和ASIC分别为22%和14%。推理阶段无需大量数据运算,GPU将占据42%左右市场,FPGA和ASIC分别为34%和24%。AI芯片运营场景包括云端(服务器)、边缘端和终端三类,不同应用场景对AI芯片的需求不同。就云端芯片而言,2023年市场需求将达200亿美元(根据Nvidia)。根据赛迪顾问,到2021年我国市场规模约为221亿元,较2019年增长35%,其中GPU、FPGA和ASIC市场规模分别为114亿元、59亿元和48亿元,GPU为主,FPGA和ASIC平分秋色。

  景嘉微是国产GPU先行者,此外,还有长沙韶光(A股航景科技全资子公司)、中船重工709所和716所。

  景嘉微持续聚焦GPU国产化,立足军工市场,并逐步向民用拓展。公司于2006年成立,2016年上市,2018年国家大基金通过定增入股9.14%成为公司第二大股东。公司自2010年开始研发具有自主知识产权的图形处理芯片,主要定位国内新研军用飞机市场,并占据绝大部分份额;2015 年第一代GPU JM5400(65nm)通过认证并量产;2018年第二代GPU JM7200(28nm)研发上市,主要用于高性能的嵌入式系统,也可以PC和笔记本等民用市场,2018年11月与CPU厂商飞腾及操作系统厂商银河麒麟完全技术适配(根据公告);目前正布局第三代GPU JM9 系列,可用于AI和物联网领域。

  从整体实力来看,景嘉微是GPU国产化先锋,与国际龙头产品实力仍有较大差距,但正在不断缩小。根据产品性能对标,2014年底发布的JM5400与AMD同类型产品相距约12年;2018年9月发布的JM7200与Nvidia同类型产品相距约7年;预计将于2020年发布的JM9231与Nvidia同类型产品相距约4年。

  航景科技于2017年以现金全资收购长沙韶光和威科电子,从而形成高端核心芯片和通信两大产业板块。高端核心芯片包括GPU、FPGA、总线的基带射频一体化芯片;通信板块主要指的是适用于5G/6G/星空互联网的多芯片集成电路和模块。电子芯片板块2017~2019年分别实现净利润4400万元、1.17亿元和1.81亿元。2020年公司Q1电子板块净利润增幅50%~80%,公司成功实现转型。

  长 沙韶光主打GPU、FPGA和总线接口芯片,GPU既可用于军工装备,也可应用于计算机系统和办公设备,并且已满足自主可控办公系统及服务器需求。FPGA主要应用于航天航空领域,暂未进入民用市场。总线接口芯片主要应用于陆军装备。2018年长沙韶光实现营业收入2.7亿元,同比增长303%,实现净利润9177万元,同比增长271%。预计2019年和2020年Q1继续高增长。

  威科电子主要承担5G/6G/星空互联网产业的生产任务。威科射频可生产毫米波及太赫兹频段的高频材料,对标美国罗杰斯,目前相关产品已成功研发,并经过下游客户测试,可以实现进口替代。泓林微主要负责射频器件的研发、仿真。主要用于射频信号的发射跟接收。同时公司还参股了武汉导航院,主要研发基于北斗3的基带射频一体化芯片。

  2.4.2.国产FPGA实力强劲,重点关注紫光国微、上海复微(拟科创上市)

  AI服务器解决方案,虽然国产化GPU乏力,但以云巨头为代表的芯片设计商在FPGA和ASIC领域表现强劲。同时传统芯片设计商(除云巨头外)在FPGA和ASIC领域均涌现出一批佼佼者。根据赛迪顾问,到2021年我国云端AI芯片市场规模约为221亿元,其中GPU、FPGA和ASIC分别为114亿元、59亿元和48亿元。假设云巨头自研占比为40%(基于云巨头服务器需求占比),则FPGA和ASIC的剩余市场需求分别为35亿元和29亿元。

  华为:2019年发布了基于ASIC的AI处理器昇腾系列310(MEC场景)和910(云端),910单芯片计算密度高达256 TOPS(衡量处理器运算能力的指标,每秒钟可进行一万亿次操作),比Nvidia V100标称算力高出约一倍,达到规格算力所需功耗仅310W。32MB SRAM/unit,集成PCIe 4.0接口,采用台积电7nm+EUV工艺。

  阿里:2019年推出基于ASIC的处理器含光800,峰值性能达到了78563 IPS(同样是衡量处理器运算能力的指标)。

  百度:2020年开发了基于可编写ASIC的昆仑芯片,峰值性能达260 TOPS,功耗150W,目前已经在百度内部规模应用,同时加速与国产CPU飞腾的适配(飞腾CPU是国产芯的代表,采用ARM V8指令集,可应用于数据中心和云计算场景)。2个计算单元,512GB/S内存带宽,16MB SRAM/unit,集成PCIe 4.0接口,采用三星14nm制造工艺和2.5D封装。

  传统芯片设计商(除云巨头外)方面,FPGA主要有紫光同创(紫光国微联营企业,持股比例36.5%)、上海复旦微电子、安路科技、成都华微电子和长沙韶光等;ASIC主要有景嘉微等。目前,上市公司中紫光国微整体产品进展迅速,目前主要用于5G通信领域;上海复旦微电子拟科创板上市,产品主要用于航空航天领域。此外,AI芯片专业设计商还包括寒武纪、深鉴科技和地平线月寒武纪拟登陆科创板,2018年5月赛灵思宣布收购深鉴科技(2020年4月收购完成)。

  3.1.“CPU+芯片组+总线”平台:CPU厂商主导升级,按照2~4年周期推进

  南桥芯片(South Bridge,SB)/PCH: 处理输入输出(Input/Output,I/O)数据,负责PCIe总线、USB、ATA、SATA、音频控制器、键盘控制器、高级电源管理和实时时钟控制器等间的通信。位于主板上离CPU较远的下方,原因是连接的I/O总线较多,远离CPU有利于布线。南桥芯片最初发展方向是集成主板上更多的通信功能,如网卡和RAID等,但AMD锐龙低端芯片组许多产品取消了南桥,只支持CPU所支持的拓展,AMD最新Zen2架构平台上,南桥仅使用PCI-E X4通道和CPU连接,将通道拆分后支持几个PCIe接口、USB2.0和SATA接口。未来CPU有望集成更多功能,降低对南桥的依赖。此外,由于技术相对稳定,不同芯片组中的南桥芯片可以是相同的。

  北桥芯片(North Bridge,NB): 负责CPU与内存、加速图形显卡(Accelerated Graphics Port,AGP)以及PCIe总线的通信协调,位于主板上离CPU最近的位置,从而缩短传输距离提高通信性能。北桥芯片最初仅作为内存控制器出现在主板上,此后又扩展了各种控制器,如加速图形显卡。但由于延迟大和故障率高等问题,逐渐被取消。In tel于2012年推出单芯片架构,只保留南桥芯片(改名为PCH,Platform Controller Hub),将北桥芯片集成到CPU中,以PCIe控制器和内存控制器的形式分散存在于晶圆的不同位置。

  随着CPU集成度不断强大,主板芯片组的功能有被弱化的趋势,CPU 厂商对芯片组的话语权也在持续提高。服务器芯片组生产商曾经生产包括Intel、AMD、Nvidia和VIA(台湾威盛)等,目前Intel和AMD占据主要市场份额,尤以Intel为甚,部分国产CPU参与者由于设计能力欠缺采用Intel或AMD的芯片组。

  总线是主板传输数据的“道路”,负责CPU与芯片组(PCH)、PCH与功能芯片的连接,包括QPI、PCIe、DMI、SATA、SAS、SPI总线等。其中,CPU与CPU、CPU与PCIe设备分别通过QPI总线和PCIe总线连接,PCH与USB、SATA硬盘、SAS硬盘和网卡等分别通过USB总线、SATA总线、SAS总线、PCIe总线等连接,BMC(Baseboard Management Controller,基板管理控制器)与其他设备通过SPI总线连接。

  PCIe总线,负责连接扩展I/O设备,具有高速低时延的性能,满足服务器高速运算、快捷访问数据、访问外设和访问网络的需求。由于是对前两代(ISA和PCI/PCI-X)的升级,PCIe总线又被称为第三代I/O总线GIO),相比于前两代,数据传输速率更高、传输距离更远、功耗更低、抗干扰能力更强,可以连接各类高速扩展设备,典型如加速图形显示处理器GPU(Graphics Processing Unit),此外还有AI加速卡、PCIe网卡和视频监控卡等。

  传输速率和带宽大小是PCIe总线的核心性能,围绕这两大性能,PCIe总线有特定的升级标准,该标准自2001年确定1.0至今,经历了2.0、3.0和4.0时代,在4.0确立之前,大概按照每三年一代的周期实现性能指标升级。PCIe标准由特殊兴趣组织PCI-SIG组织负责发布,该组织最初由Intel牵头设立,目前拥有近800名会员。2017年,PCI-SIG发布PCIe 4.0标准,2019年5月发布PCIe 5.0。预计PCIe 6.0也将于2021年发布。

  标准从落地到商用仍有一定周期。虽然PCIe4.0标准早在2017年发布,但是根据Intel产品路线以后发布的Whitley平台第二代Ice Lake中出现,而适配PCIe5.0的CPU规划在2021年发布的Eagle Stream平台出现。因此预计PCIe6.0商用还有至少三年以上。

  PCIe高速设备包括GPU、AI加速卡、视频监控卡、PCIe接口SSD和PCIe网卡等,伴随PCIe升级至5.0,通过PCIe总线连接CPU的以上高速设备有望同步升级。

  PCIe总线属于串行点对点双通道传输,在x86系统中体系架构主要由root complex、switch和endpoint三类PCIe设备构成。BDF(Bus、Device、Function)构成每个PCIe设备节点的身份证号,一般PCIe协议支持256个Bus(总线个Device,每个Device支持8个Function。PCIe总线标准升级带宽翻倍的同时,外接的PCIe设备带宽可以实现更大提升。根据PCI-SIG官方显示,使用PCIe总线与CPU通信的服务器I/O扩展设备,带宽每三年翻一倍。

  “CPU+芯片组+总线年周期向前推进,由于CPU内部主要集成内存控制器和PCIe控制器,内存和PCIe总线是平台升级的两大关键,需要同时配合CPU的升级进度实现性能提升。2017年7月Intel发布的Purley平台(包括Skylake和Cascade Lake两代),相较于上一代Grantley平台:(1)通道增加50%,支持6通道DDR4;(2)PCIe接口增加20%,支持48个PCIe3.0接口。此外,采用全新的6*6的Mesh互连架构,I/O位于顶部,内存通道在两侧居中的位置;CPU由上一代最大24核提升至28核;CPU之间的互连从9.6GT/s的QPI,升级为10.4GT/s的UPI。

  由于PCIe标准决定服务器传输速率,对服务器主板PCB层数和基材要求较高。服务器主板PCB为高速多层板(大多为8层以上板),是由多层导电图形和低介电损耗(Df)的高速CCL材料压制而成的。CCL是一种由玻纤布浸以树脂,覆以铜箔热压而成的专用于PCB制造的特殊层压板,主要承担导电、绝缘和支撑三大功能。就高速PCB而言,一方面,PCB层数越多,设计的灵活性越大,可以起到电路阻抗的作用,从而实现芯片组间高速电路信号的高速传输。另一方面,原材料CCL的Df越低,信号传输的损耗越小。伴随服务器平台的升级,数据传输速率的进一步提升,PCB层数需要不断增加,CCL材料Df值也需同步降低。

  在目前普遍使用PCIe3.0接口的情况下,信号传输速率为8Gbps,服务器主板PCB在8~12层时就可以满足要求,相对应的CCL材料Df值在0.014~0.02之间。未来,对于PCIe4.0接口16Gbps的传输速率,PCB层数需要相应提高到12~16层,CCL材料Df值在0.008~0.014之间,以 FR4为主,处于中损耗等级;而对于36Gbps传输速率的PCIe5.0接口,PCB层数需要达到16层以上,CCL材料Df值需要低于0.008。

  考虑到服务器主板PCB升级,以及服务器出货量回暖,经我们测算,2019~2021年服务器主板高速PCB市场规模分别为106亿元、142亿元和186亿元,高速CCL市场规模分别为67亿元、92亿元和124亿元。具体测算假设为:

  (1)根据IDC,2018年全球服务器出货量为1135万台,同比增长15.68%,2019年前三季度出货量为838万台,同比下降5%,从全球互联网厂商资本开支以及Intel DCG业务收入来看,服务器市场自2019年Q4开始回暖向上,Intel DCG Q3和Q4收入分别同比增长4%和19%(此前连续多个季度下滑),因此保守假设2019年~2021年全球服务器出货量分别同比增长0.04%、10%和15%,即1140万台、1254万台和1442万台;

  (2)PCIe5.0标准落地,但距离芯片商产品兼容尚需时日,目前Intel Purely和Whitley平台分别兼容PCIe3.0和4.0,兼容5.0的Eagle平台正在开发中,因此假设2019年服务器产品以低等级的3.0为主,到2020年Whitley平台渗透率可提升至50%,到2021年Eagle平台实现落地商用;

  (3)服务器主板PCB使用规格受服务器类型的影响,从全球服务器发货量来看,双路服务器占据主导位置,因此我们采用保守估计的方法,按照双路服务器45cm*45cm的规格计算主板PCB使用需求;此外,服务器内除主板外、I/O板、硬盘和背板等也是高速PCB的关键应用场景。

  根据Prismark,2018年服务器/存储设备PCB市场规模为50亿美元,占PCB总规模的8%,预计2018~2022年CAGR为4%,仅次于汽车和无线基础设施。从产品类型来看,服务器/存储设备PCB以6层以上高多层为主,其中6层板、8~16层板和18层以上板分别占比23.70%、23.25%和9.9%,其次是芯片封装基板,占比13.1%,FPC和HDI分别占比9.7%和6.3%。即服务器/存储设备中6层以上刚性PCB合计市场规模约为28.5亿美元。结合我们的测算,预计未来每年有50%左右的高多层PCB存在升级需求。

  受信号传输性能和使用的基材差异的影响,PCB大致分为普通板、高速板和高频板三种。高速板的典型特征是层数要求高,一般在8层以上,需要使用Df更低的CCL材料。高速板的生产难度相比普通板更大。一方面,特定厚度的高速基材CCL,提高了PCB生产商对材料的应用要求;另一方面,PCB层数越多,对对位精度、阻抗控制等提出更高的要求,相应生产设备的配置要求也更高,工艺流程更加复杂,生产时间也更长。

  PCB行业内一般采用成本加成的定价模式,即根据直接材料和生产成本,结合供需、层数及工艺难度、订单规模以及客户交货期要求,与客户协商定价。而高速板需要使用Df更小的CCL材料,CCL材料成本相较普通板更高;同时,工艺难度与加工时间的提高也使高速板厂商的成本更高,根据成本加成定价原则,高速板公司的产品售价更高,毛利率水平也相对较高。

  全球PCB厂商众多(根据NTI估计,超过2000家),但掌握多层高速PCB工艺技术的厂商有限,因此供应商的议价水平较高。根据Prismark统计,2016年中国大陆在 4层板、6层板及8至16层板市场的产值占比分别为19.1%、13.5%和10.4%,我国大部分PCB厂商仍以8层以下PCB为主,因而国内高多层高速PCB供需态势紧张,其价格和毛利率均高于普通PCB产品。国内多层高速PCB的参与者主要包括沪电股份、深南电路、东山精密(Multek)和生益电子等。

  CCL是PCB的上游关键原材料,其Dk(介电常数)和Df(介电损耗因子)值直接决定PCB性能。高速CCL 具有更低的Df值,信号传输损耗更小。

  CCL由增强材料(玻纤布等)浸泡树脂加工,并以一面或双面覆盖铜箔经热压而制成。一般而言,降低Df主要通过树脂、基板及基板树脂含量来实现。普通CCL主要使用FR-4等级的环氧树脂(Epoxy),高速CCL则需要在主体环氧树脂的基础上改性或加入PP0/PPE等树脂材料。各种树脂按照Df由大到小,依次包括环氧树脂、特殊树脂/改性特殊树脂、PTFE/碳氢化物树脂/PPE树脂。普通环氧树脂Df值在0.01以上,而PTFE和碳氢化合物树脂(两种典型的高频材料)Df值在0.002以下,高速材料所用树脂的Df介于高频材料和FR-4之间。

  CCL行业起源于上世纪40年代,在80年发展历程中,各大厂商累计了技术优势、资金优势和客户资源等优势,逐渐建立起行业准入门槛,行业集中度不断提升,根据Prismark,建滔化工、生益科技、南亚塑料、松下电工、台光电子和联茂电子为全球前六大厂商,2017年合计市场份额超过50%。

  高速CCL加工难度较大。一般CCL生产流程包括调胶(玻纤布与树脂)、上胶含浸、半固化片切片、上料铜箔热压和裁切等。其中树脂改性、层压和界面处理工艺是核心工艺环节。相较于环氧树脂,PTFE和碳氢化合物树脂的加工难度会更高,对工艺、配方的要求也更高。

  配方门槛:覆铜板树脂填充物包含多个品类可以因不同的场景改善性能。例如PTFE 成型温度过高、加工困难以及粘接能力差, 因此需采用共混改性、填料改性等方法淡化PTFE材料的缺点,如罗杰斯RO3000系列覆铜板中添加了陶瓷填料。每个厂商的配方都是在多年的生产实践中形成的,难以在短时间内完成。

  工艺门槛:不同树脂体系的加工难度不同,例如PTFE比环氧树脂更软、钻孔难度更大,需要培育专门的核心员工。

  目前,高速CCL市场主要参与者包括松下(Panasonic)、依索拉(Isola)、联茂(ITEQ)、台耀(TUC)、台光(EMC)、南亚塑胶(NY)、生益科技(SY)和华正新材等。根据Prismark的数据,2018年前四家占据了近65%左右的份额。松下的市场份额最高,2017~2018年稳定在25%~30%之间,高速CCL口碑好。其次是依索拉、联茂和台耀,平均市占率在10%~15%之间。当前,国内厂商也已经实现技术突破,不断抢占更高市场份额。根据公司公告,生益科技高速产品已于2018年通过服务器客户认证并实现销售,华正新材也已经实现技术突破,2019年发布定增预案,计划投资6亿元用于建设年产650万平米的高频高速CCL青山湖制造基地二期项目。

  机箱主要由箱体、硬盘背板、电源、电源背板、散热风扇、硬盘支架、线类和接头、以及开关和指示灯等组成。由于CPU平台换代升级导致功耗增加,服务器机箱散热和电源模块方案同步发生变化。一方面改善供电方案,提高电力使用效率,在降低成本的同时还能简化运维;另一方面,采用更好的温控和散热系统,目前液冷已经成为数据中心制冷新风尚。

  数据中心温控系统主要包括空调机组、气流组织和服务器散热:(1)空调机组从风冷型、水冷型向冷冻水型、双冷源型过渡,气流组织也从传统的机房级向更精准的机柜级演进;(2)服务器功率大幅提升,液冷(冷板、浸没、喷淋三种部署方式)逐渐取代传统风冷成为新模式。

  液冷模式通过液体直接导向热源带走热量,不像风冷间接通过空气循环降温,效率更高、更节能且噪音更小。液冷主要有冷板、浸没、喷淋三种部署方式,冷板式部署介质无需直接接触发热器件,对原有IT基础设施的要求和改造最小;浸没式液冷让发热器件直接与液体接触,散热效率最高,同时技术难度也最大;喷淋式还处于发展初期、技术突破阶段。目前液冷的市场化程度正逐步加强,逐渐由超算中心向各行业数据中心渗透。目前阿里和腾讯等均加大对液冷散热的应用,预计2020年有超过10万台的市场需求,渗透率在5%左右,按照单机价值量5000元计算,2020年市场规模近10亿元。而传统风冷方案每年市场空间约80亿元。因而液冷散热新方案带来的市场增量可期,利好具有相关技术方案的厂商。

  英维克是国内领先的精密温控节能设备提供商,由“华电—艾默生”背景高管团队创立,主要为云计算数据中心、通信网络、物联网基础架构等提供解决方案。公司以户外机柜温控节能设备、机房温控节能设备、新能源车用空调三大产品线为基础,目前已经占据数据中心、户外机柜领域的技术创新高地,成长为细分行业龙头。2019年公司IDC机房温控、4G/5G机柜温控、ETC配套机柜温控、轨交列车空调业务等均取得较快增长(根据公告)。

  英维克凭借模块化数据中心产品技术优势,已为阿里、腾讯、万国数据、数据港、秦淮数据,以及三大运营商的大型IDC提供高效节能的模块化制冷系统及产品。公司机房温控设备营业收入从2016年2.25亿元成长到2018年5.28亿元,年化复合增长率高达53.19%,市占率持续攀升,有望逐步向电器巨头艾默生靠拢,成长为细分领域龙头。

  4.2. 电源:系统电源重视HVDC方案渗透,模块电源功率提升重点关注国产化

  数据中心电源需求包括两块,一部分是机房系统供电,另一部分是单台服务器模块电源供电。数据中心规模化建设或将带动系统供电需求,服务器需求增加、CPU功耗提升或将带动模块电源量价齐升。从下游应用领域看,由于系统电源和模块电源除数据中心和服务器场景外,还广泛应用于通信、航空航天、工业和交通等,因而整体市场规模受单一需求变化影响有限。从规模弹性、竞争格局和国产化替代的角度,我们更看好服务器对系统电源新方案、以及模块电源的带动作用。

  UPS工作原理是市电输入UPS系统,经过整流器将交流电(AC)转换为直流电(DC),一部分直流电源为蓄电池充电,其余部分通过逆变器转换为交流电(AC)为服务器机柜供电。当市电不正常时,由蓄电池经 逆变器向服务器机柜供电。这种系统大大提高供电的稳定性,成熟度高且广泛使用。

  HVDC高压直流是一种输入市电交流电,输出直流电的电源(UPS输入和输出均为交流电的电源)。相较于UPS,HVDC在备份、工作原理、扩容以及蓄电池挂靠等方面存在显著的技术优势,因而具有运行效率高 、占地面积少、投资成本和运营成本低的特点,正逐步获得通信基站运营商和数据中心云服务厂商的青睐。

  数据中心电源与通信电源需求一致性较高,因而市场发展历程和参与者有相通性。全球通信电源市场大致经历过三个发展阶段,目前已经形成集中化的行业格局:

  第一阶段为1970~1990年,欧美厂商掌握核心技术并占据主要市场份额,通信设备商(如爱立信、北电网络和朗讯等)大都拥有自己的高级电源系统业务。

  第二阶段为1990~2010年,中国大陆和台湾厂商逐步掌握相关技术并参与到市场竞争中, 2007年国内通信电源厂商达到300多家,规模大、市场份额高的也有10余家(根据中恒电气招股书),欧美厂商相继退出 ,2000年左右艾默生网络能源进行大规模行业并购,其中包括爱立信和北电网络等设备商的高级电源系统业务。

  第三阶段为2010年至今,行业从分散走向集中。中高端UPS市场基本被伊顿、艾默生、ABB垄断,三家合计市占率超75%。科华恒盛专注于大功率 UPS市场,2017年销售额位居国内第一(赛迪顾问)。此外中恒电气、动力源、科士达、易事特等也均有参与。

  华为拥有自己的网络能源产品线,产品涵盖数据中心能源、通信能源、智能光伏和智能电动四个领域。借助通信设备的全球化布局,华为UPS电源全球市占率领先。

  UPS下游应用领域众多,包括通信和数据中心、工业、铁路、航空航天等,整体市场规模保持稳定,2017年全球市场规模约70亿美元,国内市场规模约60亿元。UPS朝着效率更高、维护安装更方便的方向发展,目前已从工频UPS发展到高频UPS,再到高频模块化UPS。

  HVDC由于技术成熟相对UPS更晚,当前仍处于成长期。数据中心和通信基站是HVDC的两大关键应用场景,合计份额达 85%以上,随着数据中心建设数量的增加,其规模不断超过通信基站。受到供给两端的压制,HVDC成长长期缓慢:(1)需求端,在市场导入期,HVDC集中在400~900A之间,400A以下和900A以上的产品较少,难以满足数据中心多元化场景需求;同时HVDC产品缺乏统一国家标准,抑制了侧重安全性的政企客户的需求。(2)供给端,电源厂商缺乏将HVDC产业化的动力。一方面,UPS技术自1990年就发展成熟,有极大的先发优势,且抓住了3G4G网络流量红利,占据通信和数据中心电源市场主要份额。相较之下,HVDC需求尚未打开,且研发投入大,生产成本高。

  随着HVDC技术的成熟和多元化,2013年以来,市场需求逐步提高。中国电信2013年完成了34套小容量(240V/400A及以下)和111套大容量(240V/400A以上)HVDC集。

联系方式

邮件:2392692@qq.com
传真:400-0248483
地址:400-0248483
地址:北京通州区良乡工业开发区建设路22号