服务于全球各领域电子制造客户
公司新闻 行业动态 产品知识
【导读】4月8日,曙光数创正式发布全世界首个MW级相变浸没液冷整机柜和基础举措措施总体解决方案(C8000 V3.0),标记着液冷技能从“可选项”变为AI计较的“必选项”。该产物单机柜功率密度高达900kW,PUE低至1.04如下,经由过程自研冷媒、金刚石铜导热质料和高压直流供电等五年夜技能冲破,实现了散热效率与能效的超过式晋升。曙光数创高级副总裁张鹏与资深技能专家黄元峰于采访中深切剖析了液冷成为将来AI计较首选方案的深层逻辑,并分享了C8000 V3.0于现实项目中的立异运用与将来“算热联产”的生态愿景。
TrendForce估计,液冷技能于AI数据中央的渗入率将从2024年的14%年夜幅晋升至2026年的40%,并于将来数年连续增加。
液冷成为将来AI计较首选方案
英伟达猜测,AI基础举措措施市场范围于2027年可能到达万亿美元级别。从其AI计较平台演进来看,单机柜功率密度连续爬升。
“高密部署是下一代AI计较的主要趋向,海内外新建数据中央的功率密度正快速上升。”黄元峰注释道,今朝国际主流GPU功耗已经达1.8kW,CPU跨越650W。受制程影响,国产芯片功耗更高,估计到2027年,国产主流GPU功耗可能冲破3000W,CPU冲破1000W。
黄元峰夸大,于如许的趋向下,液冷成为将来AI计较的首选方案,是将来AIDC成长中最具运用潜力的标的目的,远景广漠。
曙光数创资深技能专家黄元峰
曙光数创是一家研发驱动型企业,其技能产物于海内以致全世界都处在领先职位地方。如今发布的C8000 V3.0是曙光历经十年堆集的结果,并不是一挥而就。早于2017年,曙光数创就推出了第一代相变浸没式产物,单机柜功率为210kW,。第二代产物在2023年推出,单机柜功率到达575kW。第三代产物C8000 V3.0单机柜功率已经到达900kW,这已经是对于标英伟达2028年“费曼架构”的程度。
C8000 V3.0有何亮点
C8000 V3.0总体布局拥有五个特色:
第一,电力供应方面,体系采用自立研发的HVDC 2.0架构,撑持市电、电池等多种输入,可输出直流800V、±400V、336V、240V和交流380V等多种电压,矫捷配比。稳压精度达±0.5%,相应速率2.5毫秒每一安,功率密度较传统方案晋升20%。办事器内部采用高压直流直接进柜供电,并配备智能监控与模块化运维,确保不变靠得住。
第二,相变浸没冷媒技能方面,重要包括自研冷媒新质料与质料兼容性。冷媒在2017年与中科院历程所互助研发,2018年实现入口替换,今朝成本已经降至入口产物的30%如下。质料兼容性方面,公司投入超亿元,成立了海内首个相变浸没质料兼容性数据库,检测跨越2000种质料,并形成质料利用的黑名单与白名单。
第三,相变换热焦点技能方面,沸腾环节采用金刚石铜质料,导热系数较纯铜晋升100%,热膨胀系数降低60%以上。颠末4000次凹凸温轮回打击,机能零衰减。散热鳍片采用一体化成型技能,加工精度达毛细血管级别,换热面积为热源面积的百倍以上。微流道中的微纳复合布局加强了相变效率,总体实测芯片机能晋升10%,温度降低5度以上。冷凝环节采用钎焊换热器,换热面积增长40%,换热能力晋升85%。点阵交错式通道共同微纳米外貌技能,确保汽体快速冷凝。
第四,自控技能方面,体系可于5秒内完成15%至100%的无颠簸流量调治,。配备妨碍诊断体系,采用双闭环节制及模子猜测前馈计谋,提高诊断的不变与正确性。同时具有全局调优能力,实现供能、负载与配电的总体能效优化。
第五,电机转接与布局密封方面,实现汽、液、电、网四维热插拔,走漏率小在10⁻⁷量级,内部干净度到达ISO 7级以上。
“咱们认为,单机柜功率跨越200kW时,采用两相浸没式液冷上风较着,全生命周期当作本更优且持久可收敛。”黄元峰暗示,重要表现于四个方面:高功率下单元冷却成本递减、介质成本降至入口产物的30%如下、PUE≤1.04年夜幅节省电费,以和范围化集成带来的空间与配件成本优化。是以,相变浸没式液冷既高效又好用。
以中科曙光scaleX640超节点为例,这是全世界首例已经落地的兆瓦级AI解决方案,特色可归纳综合为:高效散热、成本可控、省电节能、机能不变、算力密度全世界领先。
走进现实项目
那末,C8000 V3.0于现实机房中怎样让液冷技能阐扬出其最年夜价值。张鹏先容,AIDC相对于在传统的数据中央,彻底是差别的物种。面向将来的AIDC机房设计,必需采用立异的设计理念,不克不及再以传统目光对待新事物。详细来讲,其于项目中设计重要涵盖四个方面:
第一是冷却,AIDC有三类冷却需求:高密度焦点机房、通用计较区以和配套办事区域。C8000 V3.0可实现单机柜900kW以上的极致散热能力。
第二是供电,它是C8000 V3.0最主要的立异之一。团队设计了占地仅17平方米的中压直转体系,内置变压器及直流柜,可直接挂接电池。该装配撑持“交直流互用”,3150kVA可输出交流或者直流,以和240V、400V、800V等多种电压。焦点机房下方开挖了160个孔洞,使高压线缆以最短间隔接入计较机,替换了传统管井方案,节省成本约4000万元。这一结构将供配电体系只管即便接近呆板,缩短低压线缆,削减用铜量。
第三是智能治理体系,曙光智创引入了“康健度”观点,实现妨碍预诊断。经由过程AI综合阐发温度、流量、压力等参数,体系可提早判定换热器、冷媒、水泵等装备的康健状况,而不是比及妨碍发生才报警。同时,将整年运行数据输入AI模子举行进修,体系可主动给出更节能的运行参数。于现实运营中,AI调优可以使冷却体系能耗再降低10%。
第四是余热使用方面,曙光数创也有本身的理解。张鹏指出,因为液冷排出的水温约为40~50℃,品位处于不高不低的状况,芯片答应的事情温度于80~90℃之间,受热阻限定,外部水温很难再提高。即便利用热泵升温,能耗反而患上不偿掉。是以,最实际的做法是直接为这40~50℃的热水寻觅适合的运用场景。今朝曙光数创已经辨认出十多个潜于场景,例如中水处置惩罚厂顶用在分化有机物的菌落需要这类温度的热量,皮革厂烘干工序一样合用,此外还有包括农业年夜棚等。
曙光数创高级副总裁张鹏
但余热使用的推广不克不及仅靠企业单打独斗,需要当局指导及政策撑持,好比对于实行余热使用的项目赐与电费优惠等激励。张鹏将其归纳综合为“算热联产”理念,今朝数据中央占中国用电量约3%,远期有可能上升至30%,余热使用将变患上愈发主要。
从芯片外围到芯片封装
“液冷只有走完末了一微米,算力的能量才能真正被开释。”张鹏暗示,回首多年的技能堆集,芯片的热密度连续增年夜,今朝的事情仍重要缭绕芯片外围睁开。将来,一个主要的趋向是向芯片内部成长。热量从底层电路通报到外貌的短短几百微米,其热阻可占整个链路的三成。此前重要降低的是外围热阻,而将来的“末了一微米”将是行业冲破的要害。
瞻望将来5~10年,一个值患上冲破的标的目的是芯片“封装”内部的热阻问题。黄元峰对于此注释,今朝液冷技能多于芯片外部做文章,但跟着芯片功耗增年夜,封装自己带来的温差成为瓶颈,只有降低内部热阻,外部冷却的效率才能最年夜化。
经由过程霸占高功率密度散热、供电架构改造和余热使用等要害难题,该方案于机能、成本与能效上均揭示出显著上风,助力中国智算基础举措措施于要害指标上实现对于国际领先程度的“代差”逾越。将来,跟着“散热即算力”理念的深化,液冷技能将向芯片封装内部的“末了一微米”延长,而开放生态与产学研协同将成为鞭策行业范围化落地的焦点动力,为全世界数字经济成长注入绿色、高效的长期动能。
下一篇【产品推荐】超小型高频同轴连接器u.fl系列
www@米兰官方网站-milan(中国)
Maggie
微信咨询
黎小姐