据国家数据局,我国生成式人工智能的快速发展,10亿参数规模以上的大模型数量已经超过100个;据银河证券,AIGC不断向终端侧及行业应用渗透,国内未来5年智能算力规模年复合增长率预计将达到52.3%。
大模型的快速发展,智算需求与规模的高速增长,为数据中心带来了巨大的产业机遇,但传统数据中心想要承接智算需求力有不逮,需要进行一系列优化,其中尤以液冷改造受关注。
面向未来,液冷是大趋势,改造势在必行,是数据中心开展智算业务、降低PUE的必要条件。
液冷技术优势
相比传统风冷技术,液冷技术可以大幅提高散热效率和业务可靠度,并且环境适应好,可以减少土地占用。
(1)降低设备能耗,助力节能减碳。数字经济时代,算力需求迅速增长,加之5G的广泛应用,带动信息基础设施蓬勃发展,数据中心用电和碳排放也随之大幅增长。借助液冷技术,数据中心PUE可以降至1.1~1.2左右,可有效降低能耗,减少碳排放。以100个20kW液冷机柜为例,PUE从1.45降低到1.15,每年用电可节省超过1×107 kW•h,电费节省超过700万元,减碳6000吨。同时,液冷环境下可以减少或去除风扇,进一步降低服务器能耗。
(2)延长设备寿命,降低运维压力。按照芯片10℃法则,温度每提高10℃,元器件寿命约降低50%。使用液冷方式,可有效降低CPU结温10℃以上(结温是电子设备中半导体的实际工作温度),延长服务器使用寿命。相较传统风冷,浸没式液冷方式可以移除风扇,降低了噪音和灰尘影响,热故障率低。数据显示,浸没式液冷环境下硬盘故障率低于风冷约50%。服务器故障率的降低和寿命的延长,可有效提高业务运行稳定性,降低运维压力。
(3)环境适应性好,机架装机率高。传统风冷机柜对环境要求高,受外部环境和温度影响较大,液冷机柜对环境要求低,在较大温差区域部署仍可获得较稳定PUE。液冷机柜装机密度高,是传统风冷机柜的约3~4倍,相同算力下节省机房面积约75%。液冷机房可免部署空调,减少冷水机组,节省机房空间。
数据中心引入液冷服务器,可以显著降低机房PUE值,提高设备运行稳定性和业务可用性,增加服务器装机密度,减少机房土地占用,实现节能减碳。同时,不断提升的芯片功率密度和AI服务器等高功耗设备的逐步引入,也为液冷引入提供了更加广阔的空间,液冷逐步成为数据中心制冷的重要解决方案。
大模型的快速发展,智算需求与规模的高速增长,为数据中心带来了巨大的产业机遇,但传统数据中心想要承接智算需求力有不逮,需要进行一系列优化,其中尤以液冷改造受关注。
面向未来,液冷是大趋势,改造势在必行,是数据中心开展智算业务、降低PUE的必要条件。
液冷技术优势
相比传统风冷技术,液冷技术可以大幅提高散热效率和业务可靠度,并且环境适应好,可以减少土地占用。
(1)降低设备能耗,助力节能减碳。数字经济时代,算力需求迅速增长,加之5G的广泛应用,带动信息基础设施蓬勃发展,数据中心用电和碳排放也随之大幅增长。借助液冷技术,数据中心PUE可以降至1.1~1.2左右,可有效降低能耗,减少碳排放。以100个20kW液冷机柜为例,PUE从1.45降低到1.15,每年用电可节省超过1×107 kW•h,电费节省超过700万元,减碳6000吨。同时,液冷环境下可以减少或去除风扇,进一步降低服务器能耗。
(2)延长设备寿命,降低运维压力。按照芯片10℃法则,温度每提高10℃,元器件寿命约降低50%。使用液冷方式,可有效降低CPU结温10℃以上(结温是电子设备中半导体的实际工作温度),延长服务器使用寿命。相较传统风冷,浸没式液冷方式可以移除风扇,降低了噪音和灰尘影响,热故障率低。数据显示,浸没式液冷环境下硬盘故障率低于风冷约50%。服务器故障率的降低和寿命的延长,可有效提高业务运行稳定性,降低运维压力。
(3)环境适应性好,机架装机率高。传统风冷机柜对环境要求高,受外部环境和温度影响较大,液冷机柜对环境要求低,在较大温差区域部署仍可获得较稳定PUE。液冷机柜装机密度高,是传统风冷机柜的约3~4倍,相同算力下节省机房面积约75%。液冷机房可免部署空调,减少冷水机组,节省机房空间。
数据中心引入液冷服务器,可以显著降低机房PUE值,提高设备运行稳定性和业务可用性,增加服务器装机密度,减少机房土地占用,实现节能减碳。同时,不断提升的芯片功率密度和AI服务器等高功耗设备的逐步引入,也为液冷引入提供了更加广阔的空间,液冷逐步成为数据中心制冷的重要解决方案。