01为什么"怕停电"会变成"怕漏水"
液冷把冷却液送进机柜、贴近芯片散热,换来了更高的算力密度,也把"水"第一次带到了带电设备的身边。一旦渗漏,威胁的是正在运行的服务器、GPU 与供电。行业普遍的说法是:液冷让数据中心从过去的"怕停电",变成了现在的"怕漏水"。
这不是危言耸听,而是一个经济问题。按 Uptime Institute 的全球数据中心年度调查,过半故障的直接损失超过 10 万美元,约五分之一超过 100 万美元。在这种代价面前,漏液防护不是锦上添花,而是必须前置的基础设施。
所以问题不该是"会不会漏",而是"漏会发生在哪里、能不能第一时间发现并定位"。
02漏液为什么集中在"连接与汇集点"
结论先行:管材本身渗漏的概率,远低于接口、阀门、插拔处与低洼汇集处。漏点是跟着"连接"走的——哪里有拆装、有接口、有压力与温度的反复变化,哪里就更容易漏。中文行业讨论里有一个高度一致的共识:在液冷系统里,快换接头恰恰是最可能漏的地方,因为它要被反复插拔、要承压、又对密封要求极高。
把这条规律倒过来用,就得到一份"该重点盯防的清单"。
035 个高发部位,逐个看
① 快接头插拔处
运维中 CDU、机柜与冷板的管路要被频繁插拔。普通快接在拔管瞬间最容易滴漏、残液,是第一高发点。这一处可以从源头降低风险——用 dry-break 干断快接,让每次插拔几乎不滴漏(见相关文章:《什么是 dry-break 干断快接头》)。
② CDU 冷量分配单元
CDU 是一次侧与二次侧换热、分配冷量的枢纽,接口多、流量与压力变化大,是系统里管路最密集、连接最集中的节点之一,自然也是漏液重点区。
③ 冷板 D2C(Direct-to-Chip,直接芯片冷却)
冷板直接贴在 CPU / GPU 上换热,这里一旦渗漏后果最严重——冷却液会直接接触主板与芯片。D2C 环节的连接与密封,必须被纳入重点监测。
④ 管路接口与弯头
接头、弯头、变径处是应力集中的地方,长期的振动、热胀冷缩会让连接逐渐松动、密封老化,属于"慢性渗漏"的高发位置。
⑤ 冷凝水溢流处
高湿、结露环境下,集水盘溢流、凝露滴落是另一类"非破裂型"漏水来源。它不一定来自管路破损,但同样会在机房低洼处积液,需要一并守住。
04检测该怎么布点
认清高发点之后,布点思路就清晰了——连续覆盖 + 精准守点 + 联动响应。
连续覆盖:用感水绳(线状)
感水绳是线缆式的连续检测,沿管路、机柜列、CDU 周边敷设,沿线任意点漏液都能报警并定位,适合长管路与多点覆盖。它解决的是"漏在哪一段"的问题。
精准守点:用点式探头
点式探头是单点精准检测,放在集水盘、低洼积液点等明确的汇集处,守住那些"水最终会流到"的地方。
组合与联动
实际部署常把两者结合:感水绳做连续覆盖,点式探头守住关键积液点。检测信号再以干接点接入 BMS / 动环系统,实现"渗漏第一时间发现 → 定位 → 联动处置"的闭环。现款这种纯干接点接入的方式无数字通信,简单、可靠。
※ 本文检测产品口径依据英国 Sontay 已核实资料。漏液检测的具体选型与布点,应结合机房工况、冷却液类型与系统部位做确认;本文不构成对特定冷却液兼容性的承诺(WD 系列对哪些冷却液适用,见《感水绳能检测哪些冷却液》)。