关于我们

质量为本、客户为根、勇于拼搏、务实创新

< 返回新闻公共列表

数据中心服务器技术的发展趋势及应用

发布时间:2021-05-14 09:22:51

  目前,为了促进IT支持系统的集中建设和运营,进一步发挥集中功能,IT云正在成为运营商IT支持系统建设的基础设施。但是,在IT云资源池部署过程中,服务器技术在以下三个方面面临各种新挑战:

  在性能方面,人工智能(AI)应用程序的快速扩展要求IT云上有高性能的GPU服务器。AI拥有优化通信业网络范围、区分大量投诉、异常检测/诊断、业务意识、用户定位等方案规模应用。随着AI应用需求的大量出现,需要部署数据中心的服务器具有更好的计算能力、吞吐量和延迟性能,以传统通用x86服务器为核心的计算平台相形见绌。因此,GPU服务器登上了通信企业IT建设的历史舞台。

  从效率成本的角度来看,IT云部署通用服务器的缺点是,会产生定制的全机柜服务器应用程序要求。在IT云构建过程中,业务需求迅速增长,IT云资源池扩展压力增大,云资源池中的服务器数量迅速增长,在线效率亟待提高。另一方面,传统的通用服务器部署模式存在周期长、部署密度低的缺点,给数据中心空间、电力、建设成本和高效维护管理带来了巨大挑战。整个机柜服务器成为IT云构建的另一个替代方案。

  在节能方面,AI等高密度应用场景发展迅速,驱动水冷服务器成为热点。随着AI高密度业务应用程序的发展,未来数据中心服务器功率将从3kW~5kW增长到20kW或100kW以上,传统的风冷服务器冷却系统解决方案已不能满足冷却要求。水冷服务器在AI应用场景下成为有效的解决方案。

  GPU服务器技术发展趋势及在通信行业的应用

  GPU服务器技术发展趋势

  GPU服务器是与CPU一起工作的单指令多数据处理体系结构。在CPU和GPU之间的互连体系结构中,GPU服务器可以分为传统的基于PCIe体系结构的GPU服务器和基于NVLink体系结构的GPU服务器。GPU服务器具有通用性强、生态系统完善的明显优势,牢牢占据了AI基础设施市场的主导地位,国内外主要企业正在推出不同规格的GPU服务器。外国主流制造商包括英伟达、英特尔、戴尔等,国内主流企业包括华为、浪潮、新华3、联想、曙光等。在GPU服务器性能方面,国内外供应商基本处于同一水平。GPU服务器在运营商IT云建设中的应用

  目前,通信行业开始在IT云资源池中推动GPU服务器的应用,州政府目前在网络上构建了部分GPU服务器。同时,考虑到GPU成本高,在集团公司层面构建集成AI平台,集中GPU服务器部署,形成AI资源优化配置。从技术选择的角度来看,目前运营商IT云资源池采用了很多与供应商相关的产品,如英伟达、英特尔等。

  GPU服务器在IT云应用中取得了良好的效果。目前,部署在网络上的GPU服务器中,与教育和推理相关的深度学习应用程序占70%以上,支持业务包括网络覆盖智能优化、用户智能定位、智能营销、智能审计等。这些智能应用程序减少了手动投资成本,提高了生产率。对于智能审计,对现有无纸业务文档的手动审计平均约48秒/单,AI审计平均约5秒/单,审计效率提高90%。另一方面,无纸业务文件手动审计费用约为1.5韩元/单,利用GPU进行AI审计的费用约为0.048韩元/单,审计费用最多可节省96.8%。

  整体机柜服务器发展趋势及在通信行业的应用

  整体机柜服务器技术发展趋势

  整个机柜服务器是根据由机柜、网络、电源、服务器节点、集中冷却、集中管理6个子系统组成的模块化设计理念构建的服务器解决方案,是数据中心服务器设计技术的根本性变化。整个机柜服务器通过电源、冷却设备池节省空间,提高部署密度,通常可以使部署密度翻倍。集中式电源和冷却设计使整个机柜服务器只需配置10%的现有机柜服务器电源即可满足电源要求,能效可提高10%以上,单个服务器的能耗可减少5%。

  全机柜服务器在运营商IT云建设中的应用

  国内运营商在IT云建设中推进整个机柜服务器部署,经过实际应用验证,在以下方面具有很大优势:

  第一,工厂组装、配送时间明显缩短。现有服务器效率低下,使用整个机柜服务器,将原来在数据中心现场进行的服务器包装、货架、布线等移动到工厂,将部署粒度从1台提高到数十台,极大地提高了提供效率。一次交付1500台服务器,可将交付工作量减少170~210人,按每天10人计算,可节省约17~21天的现场交付时间。

  其次,由于资源池化,零部件数量减少,故障率大幅下降。整个机柜服务器将电源、冷却等部件资源汇集在一起,大大减少了部件数量,大大降低了故障率。图1比较了32节点全机柜服务器与传统1U、2U服务器型号的电源部件数量和一年的每月故障率。32节点全机柜服务器包含10个电源部件,32台1U通用服务器的64个电源部件,因此机柜电源部件总数减少了84.4%。由于电源部件数量的减少,32节点整个机柜服务器的每月故障率也比32台1U通用服务器大幅减少。 

1620788071767.png

  整个机柜服务器与现有型号服务器的每月故障率比较

  第三,运营和维护效率提高了60%以上。整个机柜服务器在工厂进行预制的机柜布线,网线在工厂进行预处理,电缆长度完全一致,整理线简洁,电缆连接方式统一规格,加上操作和维护标签,使操作和维护工作更加容易和简洁。减少操作和维护错误,将操作和维护效率提高60%以上,并大大减少故障后的故障恢复时间。

  液体冷却服务器技术发展趋势及在通信行业的应用

  液体冷却服务器技术发展趋势

  水冷服务器技术也称为服务器芯片水冷技术,使用特殊或特殊处理的液体、直接或近距离间接热交换冷却芯片或IT整个设备(冷板冷却、浸泡式冷却、喷雾冷却等)。水冷服务器可以精确控制冷却分配,以实现CPU热岛的准确定点冷却,从而将高密度部署带到前所未有的高级别(例如,20kW到100kW高密度数据中心)。这是数据中心节能技术的发展方向之一,也是表1所示的三对水冷技术。

  表1 3液体冷却技术比较

  1620788071744.png

  液体冷却服务器在运营商IT建设中的应用

  水冷服务器技术目前在我国仍处于应用初期,产业链还不完整,设备采购成本高,采购渠道少,电子零部件兼容性低,水冷服务器专用冷却水成本高,是水冷服务器尚未大规模普及的重要原因。从水冷服务器在运营商数据中心领域的具体应用案例来看,运营商在IT云资源池规划和建设过程中,对水冷服务器的发展现状、技术成熟度等进行分析论证。

  目前,水冷服务器的规模应用尚处于初期阶段,需要3~5年的引进时间,因此尚未在IT云资源库建设中进行大规模落地部署,但部分地区(如中国移动南方基地数据中心)已经实施了水冷服务器示范应用,中国联合研究院也在进行边缘数据中心服务器喷雾水冷系统的开发。今后,随着IT云建设规模、建设密度的持续上升和水冷产业生态系统的成熟,水冷服务器将为IT云建设提供更多的应用空间。

  总的来说,运营商IT云资源池建设提高了对服务器计算性能、延迟、吞吐量、冷却、定制、分布式部署等的要求。今后,GPU服务器、定制全机柜服务器、水冷服务器等新兴服务器技术将迅速重复,为运营商数据中心服务器技术的发展和进步提供新的思路和路径。



/template/Home/Qiggg/PC/Static