行业资讯

您当前的位置:首页 > 行业资讯
借助数据中心模拟看得更清楚
发布时间:2017-03-11  |  来源:  |  浏览次数:2274

 

    据说,计算流体动力学(CFD,Computational Fluid Dynamics)提供了关于数据中心气流的历史视图信息,但到了报告生成时,这些视图信息可能已经过时了。这种将CFD视图作为过去的快照的方法错失了技术(预测的)的真正力量;而这一糟糕的思维方式,似乎在行业内还颇有市场。我曾经与数据中心操作运营人员们在各种不同的会议上进行过无数次的沟通交流,而这些数据中心操作运营人员一直在抱怨说,“为什么我需要有人来进行CFD研究,然后告诉我数据中心基础设施两个星期前的状况呢?我通过传感器就可以及时掌握基础设施当前的状况了呀。”产生这种感觉并不是偶然的。

CFD开始进入数据中心领域

CFD最初进入数据中心领域大约是在10至15年前。彼时,数据中心的功率密度才刚刚开始上升。当IT设备由于过热问题而发生故障运行失败时,数据中心运营人员们发现很难理解其中的原因所在,因为他们缺乏相应的数据来分析这些问题。而这就是CFD的来源:操作运营人员聘请相关的工程顾问来模拟他们的基础设施,告诉他们究竟出了什么问题。

大约三个星期后,这些聘请的工程顾问将返回一份报告,该报告显示了基础设施中的环境。不变的是,这些报告将包含温度面板或显示周围环境的温度视图。

对于许多操作运营人员而言,这是他们第一次实现了对于其基础设施环境的可视化。通常,这是第一次能够看到相应的条件在数据中心操作空间内的变化,提供了巨大的价值。

此外,CFD模拟允许跟踪问题的来源,深入了解基础设施的运行情况。工程顾问们将与运营人员合作,以找到解决方案,然后在执行该方案之前在模型中进行模拟显示,充分利用该技术的预测功能。

开发实时数据

随着时间的推移,市场上开始出现了能够让操作运营人员们实时看到数据中心中所发生的情况的监控系统。这些系统的制造商们必须找到一种以简单易懂的方式呈现来自许多(可能至少100个)单个传感器的数据的方式。他们选择使用一种称为插值的过程来尝试加入传感器之间的点,并创建操作温度视图,这看起来非常像操作运营人员们曾经看到的CFD模型的输出。

在这一点上,考虑一下当操作运营人员们在执行CFD分析时,所提出的主要问题真正意味着什么是值得的:我企业的数据中心到底发生了什么?他们可能已经获得了关于为什么会发生这类情况的答案;以及如果数据中心执行了从CFD模型中所获得的益处,会发生什么情况的答案,但这并不是思维过程的主要推动力。就市场而言,由已经使用的监测系统所提供的温度视图就可以回答这个问题,而不需要专门聘请一名昂贵的顾问。其还有一项额外的好处是,能够显示当前发生的事情,而不是三个星期前的。

我们当前的发展阶段

使用CFD作为工具来获取其基础设施中所发生的情况的快照的数据中心操作运营人员得出了一套结论,即:他们可以通过现代监测技术实时获得几乎相同的信息,而无需花费额外的费用(然而,CFD分析将总是能够给你比监控系统更多的信息)。因此,CFD将被删除,因为其不再是必要的。

我对此表示赞同。

与监控系统相比,如果您用来为您的数据中心的操作环境条件进行快照,那么CFD是昂贵和麻烦的。但有一点需要注意的是:CFD真正的益处在于其能够回答“为什么”及“如果”的假设场景的能力。

监控系统的引入允许数据中心的性能得到大幅改进,因为在运营过程中当发生超出限制的情况时,其能够向运营人员们显示出来。并非提供相同的数据,CFD建模能够添加新的信息到操作人员的资源库。使得未来的计划可以进行压力测试和优化,而这是任何其他技术所无法做到的。这样做将允许进一 步推进数据中心的封装,能够利用更多的容量,并充分利用冷却系统的效率,而不会给IT负载带来风险。

案例研究:金融机构

为了说明借助其可以实现的目标,我想在接下来分享一个例证。该项目的目标是分离大约150台旧的直接冷却的前端为玻璃材质的机柜,并将这些机柜更换为更现代的热通道/冷通道布置,以便能够更好地利用可用的冷却。这相当于该处数据中心设施中大约50%的服务器机柜。同时,额外的200kW的工作负载将被从其他站点的服务器机房迁移到大厅,使得负载总数将从900kW增加到1.1MW。工作将在20个周末进行,使得数据中心的其余能够保持功能的完整和弹性。

首先,我们模拟了前20个阶段的每一个的终点,以确保计划是健全的。这项步骤突出了在地板上的许多电缆托盘需要被移除,因为它们将直接位于新的冷通道下方,会影响到气流。

然而,真正有趣的部分是:一旦工作开始上马后(而且情况往往总是如此),实际工作进程很快偏离了原来的计划,因为应用程序必须在计划移动时保持运行。我们与项目团队现场合作,利用每个周末实际完成的工作和下周末的新计划更新CFD模型。之后,我们运行了一个新的模拟,为迁移团队提供每台新的机柜的安全负载限制。这些每周的安全限值通常明显小于每台机柜的最终设计负载。

该项目在计划预计的时间内完成,没有发生一次单一的热停机(thermal shutdown)。这是因为迁移团队知道确切的限制在哪里,并且可以放心地接近该限制,因为以前已经模拟了每种情况。在不使用模拟的情况下,不会出现这种情况,并且将会超过限制(导致热停机)或每周安装的设备更少(延长项目执行的时长)。

互补而不竞争

CFD所提供的数据可以使数据中心性能实现增加监控系统在过去十年中所能够实现的的相同飞跃。虽然市场有良好的理由将CFD和监控视为互相竞争的技术,但它们实际上是完全互补的。随着数据中心操作运营人员们被要求以更少的成本做更多的事情,他们将需要这二者的协调努力来实现他们的业务目标。

据说,计算流体动力学(CFD,Computational Fluid Dynamics)提供了关于数据中心气流的历史视图信息,但到了报告生成时,这些视图信息可能已经过时了。这种将CFD视图作为过去的快照的方法错失了技术(预测的)的真正力量;而这一糟糕的思维方式,似乎在行业内还颇有市场。我曾经与数据中心操作运营人员们在各种不同的会议上进行过无数次的沟通交流,而这些数据中心操作运营人员一直在抱怨说,“为什么我需要有人来进行CFD研究,然后告诉我数据中心基础设施两个星期前的状况呢?我通过传感器就可以及时掌握基础设施当前的状况了呀。”产生这种感觉并不是偶然的。