数据中心基础设施综合测试初析


严格意义上的数据中心基础设施综合测试是指从“图纸设计审查、设备选型审查、工厂测试见证、到货检查见证、单机测试、单系统测试、联合系统测试”等一个完整的测试验证过程。

一、数据中心基础设施综合测试概念

在国内,“图纸设计审查、设备选型审查、工厂测试见证、到货检查见证”这四个阶段一般由于项目时间紧张、业主的重视及理解程度被忽略掉了,而更侧重于“单机测试、单系统测试、联合系统测试”等环节。实际上,以上七个步骤完整的执行完毕对项目的顺利交付及后续稳定运行是有非常大的帮助的。

一般来说,综合测试是由业主聘请的经验丰富的第三方专业测试机构主导,项目的各承建方、设备供应商、设计院、管理公司、监理等各单位配合执行的一项系统工程。第三方专业测试机构通常提供测试所需要的各种仪器、仪表、工具、测试用假负责、测试方案、测试流程等,并主导具体的测试过程。各承建方、供应商对自己承担的施工安装、设备性能、调试质量负责,在执行测试时由其提供设备专用工具并进行具体的设备及系统操作,在发现安装问题、设备质量问题、调试等其他问题时及时进行整改,以便支持后续综合测试计划。设计院对设计意图、设计图纸负责,遇到问题时需参与解决。甲方、管理公司、监理需见证测试过程,并召集各方参与测试并解决测试过程中发现的问题。

综合测试的核心是通过假负载模拟“数据中心正常运行时、故障运行时”的各种状态是否与设计意图符合,包括验证施工质量、设备质量、调试质量、各种逻辑功能等。使用的假负载以机架位假负载为宜,具有可调功率的能力。根据不同的设计,机架式假负载也存在不同的形式。如按高度可分成2U、3U、4U的假负载,按假负载风扇的不同形式可分为可调风扇假负载、不可调风扇假负载,按电流不同形式可分为交流交付在、直流假负载等。

综合测试理论更详细的介绍在第三节中详述。

二、数据中心基础设施综合测试在国内的发展概况

综合测试在美国、欧洲是一种常规性的测试,在数据中心、医疗系统、舰船等关键设施都会进行综合测试,甚至在办公楼项目中也会进行,是一种社会上普遍接受的验证项目实施正确性的技术性措施。

在国内,直到2008年底世纪互联公司对其自有项目进行了国内第一次综合测试,2009年初百度公司对其自有项目进行了更深入、更完整的综合测试。这两次综合测试的执行均引入国外的专家资源,可以说是国内综合测试发展的开端。

最近几年,综合测试的理念越来越被数据中心业主重视,已经有越来越多的项目进行了各种不同程度的综合测试。特别在互联网行业、金融行业有更深入的接受程度。在这两个行业里,进行过严格意义上综合测试的数据中心项目在运营期往往有更好的稳定性与业务连续性。

综合测试的理念在数据中心行业已经扎根发芽,未来会有更多的业主接受这种严谨理念,行业中也会涌现出更多的专业测试机构。在其他重要的领域,如重要会议、医疗机构等的机电系统也已经开始涉足综合测试。

未来,需要在综合测试的标准制定、推广、测试机构的培育、业主的认识上下更多更大的功夫,推进行业迅速发展,以便关键基础设施得到良好的交付与稳定的运行。

三、数据中心基础设施综合测试方法论

1 综合测试可以给我们解决哪些问题?

(1) 排除设计不合理问题

目前,国内数据中心行业设计图纸的错漏碰缺问题较多,是行业的普遍现象。导致此问题的主要原因是:1)行业发展快,项目周期紧,留给设计院出图的时间不多;2)行业最近几年发展较快,具备很强专业能力的设计院和工程设计人员比较稀缺,缺乏实际经验的积累与设计效果的验证。

另外一个方面,针对数据中心项目,业主单位或者机电顾问单位的设计审核能力也不足以应对机电设计问题。综合测试专业机构具备较多项目的测试经验,通过大量项目的测试积累了很多实际经验,可以通过其的设计审核提前发现众多问题,避免在实际实施及运行维护时出现设计问题。有些问题可以在实施过程中调整,有些不具备调整的空间。

(2) 排查施工质量问题

与设计问题类似,国内针对数据中心项目的优质的施工单位较少,施工问题非常的多,大多数项目都会排除出数百、上千个施工质量问题。根据过往数据统计,施工质量问题在所有问题中起码占50%以上。

这些施工质量问题包括:电缆压接不实、电缆型号错误、电缆接错、控制电缆虚接、未按图纸及规范施工、成品保护不到位、电气设备内存有施工废料、电缆没有规范的编号、电气设备定值设置错误、未完成调试、设备参数设置错误等等各种各样的问题,不一而足。这些问题往往会带来灾难性的后果,有些问题甚至让运维人员无从下手。如电缆压接不实,当负载较低时不会发生问题,当负载越来越高存在烧毁电缆的可能;再如,控制电缆虚接,在设备发送控制信号时可能产生时灵时不灵的现象。这些细小的问题往往成为关键业务的巨大灾难。

施工质量的检查需要全面地进行,通过核对图纸检查施工情况,通过专业设备检测各种施工质量。

(3) 排查设备质量问题

设备在设计、生产、运输、安装等各个阶段均可能存在问题,很多性能及功能性的问题通过调试时无法排查出来的,如不在交付之前发现真正的问题,在实际使用时往往在负载越来越高时带来灾难性的后果。根据过往的数据统计,设备质量问题往往占20-30%的比例。

这些问题诸如:设计错误,关键元器件的批量质量问题,元器件焊接松动,运输过程中元器件损坏,设备真实容量不足等等。

综合测试可通过模拟设备真实负载来检验设备的标称性能及功能是否达标。

(4) 验证系统能力

由于数据中心电气系统、空调系统的复杂性,在工程调试阶段往往无法验证机电系统的真实能力,如系统容量、系统联动能力、故障模式等。

通过模拟假负载,将系统真实运行起来,可以检验机电系统的真实能力,避免运行期的各种莫名其妙的故障。

2 完整的综合测试过程

完整的综合测试包括以下7个过程,在项目实施时尽量全部实施。如不具备条件,可根据实际情况缩减,但是后三个过程是不可缺少的。这7个过程是顺序的过程,不可前后颠倒。以下每个步骤都需要有详细的审查计划或测试流程,检查完成需要有详细的报告。

(1) 设计审核

设计审核一般包括需求审核、方案设计审核、初步设计审核、施工图审核、深化设计审核。

(2) 工厂测试

所有重要设备均需进行工厂测试,需要完整的验证设备与订货技术要求的符合性,重要环节需要进行试验。如高压柜需在工厂进行逻辑测试,发电机需进行带载能力测试,自控系统需进行自控逻辑测试。

工厂测试内容非常之多,具有较好经验的专业测试机构可以提供全套支持。进行过全面工厂测试的项目可大大减少设备质量问题,也可以避免做假的不良行为。

(3) 到货检查

到货检查也是个不可获缺的过程,设备在发货、运输时可能存在各种错误,如发错设备,设备数量不足,运输时损坏等。在这一过程中认真检查设备,可避免在安装时出现的各种问题,避免由于错误导致的工期延期或者根本无法发现问题。

(4) 安装审查

安装审查需要在安装过程中进行检查,特别是对隐蔽工程(如电缆铺设及压接电缆)需要着力审查。在某个系统刚开始安装时就需要审查安装计划、安装的样品,避免安装完成时才发现安装错误。

(5) 单机测试

不管电气设备还是空调设备都需要进行单机测试,以便验证设备的性能及功能。单机测试需要开启假负载模拟真实情况时的负载及功能。

单机测试需要有详细的测试方案及测试流程,每个测试步骤均需要严谨列明,并需要征得设备供应商的同意。

单机测试完成,证明设备合格后可进行单系统测试。

主要的单机测试包括:高压柜、变压器、低压柜、不间断电源、列头柜、PDU、发电机、制冷机组、水泵、冷却塔、空调机组、ATS转换开关、蓄冷罐、变频设备等的测试。

以下表格是UPS单机测试案例:

(6) 单系统测试

单系统是指一个功能单元的集合,如一组并机的UPS系统、一套并机的发电机系统,一套冷冻水空调等。单台设备合格不意味着单系统合格,需要进行实际的验证才能得到证明。

单系统测试需要在单机测试合格后进行,需要对系统内容的所有环节检查合格后方可进行。

单系统测试需要制定完整的测试方案及测试流程,每个步骤都需要得到工程实施单位及设备供应单位的认可,如遇到分歧需进行讨论以便达成共识。

单系统的测试方法主要是通过假负载模拟单系统真实运行时的各种状态及故障模式时的各种状态,通过一定时间的运行,验证系统是否合格。

主要的单系统测试包括:高压系统、低压系统、不间断电源系统、发电机系统、冷却系统、冷冻系统、控制系统等的测试。

具体测试包括25%带载、50%带载、75%带载、100%带载,突发加减载,关闭冗余设备等。

在单机测试、单系统测试完成后,经整改合格后方可进行联合测试。

以下是UPS并机系统测试案例:

(7) 联合测试

联合测试指数据中心所有机电系统作为一个整体进行测试,通过全额假负载模拟真实运行时的各种运行状态及故障模式时的各种状态。进行全额假负载投入的成本非常大,如无法获得高额预算可减少假负载的数量,但不能少于25%的带载量。

联合测试在综合测试中具有最高的技术含量,是验证整个系统所有功能的最佳测试方法。

联合测试需要所有的实施单位、设备供应商到场执行操作,需要按严格修订的操作票执行每一个步骤。操作票需要和各方达成共识。

具体的测试内容举例如下:

在此鸣谢文章原作者朱永忠先生

朱永忠现任平安科技(深圳)有限公司基础架构首席总监、云计算发展与政策论坛用户委员会副主任。曾在百度历任系统部高级经理、副总监、总监、高级总监,加入百度之前供职于中国最大的商业数据中心服务提供商——世纪互联(Nasdaq:VNET).拥有十多年数据中心建设、运营和管理经验,是百度数据中心基础设施的总设计师、规划师和推动者。在百度的七年时间中,永忠组建和培养了国内互联网领域最强大的数据中心团队,打造出中国互联网领域最领先的数据中心基础设施,为百度的大数据战略打下了良好的基础。永忠是国内数据中心领域的顶尖技术专家,身为中国数据中心专家技术委员会副主任委员,和工信部数据中心工作组特聘专家,主持和参与了多项行业标准及白皮书的编写和审核工作,为过去几年中国数据中心行业的大发展做出了突出贡献。


邮箱:marketing_tymap@126.com       TEL:010-58425025
地址:北京市石景山区城通街26号院金融街长安中心F座6层
TYmap天毅鸿图
·专注图形图像生产新基建·
————————————————————
网站地图      法律声明        隐私保护       加入我们