iiiiii新技术研究ii数据中心能z效管理系统的研究与设计郭佳哲(中国移动通信集团广东有限公司,广东广州510000)【摘要〗介绍了数据中心能效管理系统的整体方案设计,给出了系统功能架构图和软硬件部署架构图,并着重阐述了能耗管理、3D温度云图和容量管理等重点功能模块。打造一个全新的能效管理系统可以为管理人员提供有效的能耗管理,为能效提升工作提供决策依据,最终实现降低能耗的目标。【关键词】PUE3D温度云图能耗管理数据中心1|||=“没有测量就没有管理”。节能的关键是要掌近几年来,随着我国互联网、云计算和大数据握能耗的准确情况。而对能耗统计分析情况的准确与产业的加速发展,互联网数据中心(IneternetData否,将直接影响组织管理层的决策。“精确监测、细Center,简称IDC)也如雨后春笋般得到蓬勃的发致分析、及时改进、可视化管理”将是基础设施能效展。据统计,全球数据中心总量已超300万个,我国管理系统的核心需求。随着能效管理系统的实施,它数据中心总量也超过40万个。这么大规模的设备数量将能达到以下目标:已经使得数据中心成为一个高能耗的存在,有数据显(1)通过精确监测环境和能源状态,将数据从示,一个数据中心满负荷工作3年的电费足以重新建设节能的角度进行分析,找出不必要、不合理的能耗源一个数据中心。因此,如何统计用电量,如何引导用头、以及其它可改进之处,加以改进。电,如何节约能耗,如何评估数据中心的能效等等,(2)对于发现的温度上升、能耗上升等问题等,变得越来越重要。数据中心能效管理系统为解决以上以预警、告警的方式提醒管理人员尽快采取相应措问题提供了一个的切入口,它让数据中心的能耗管理施,及时按需调整,避免不必要的浪费。变得更加“智能”和“方便”,并对数据中心的运营(3)对其能耗相关数据进行全面采集、统计,并带来深刻的影响。建立对比分析机制,将改进后与改进前进行对比,将现状与节能目标进行对比,与业界同类机房标杆进行2系统概述对比。数据中心能效管理系统通过对数据中心能耗结构(4)通过可视化的界面方式展示能耗管理信息,的研究与分析,结合国内外数据中心能耗管理的先进让管理人员从纷繁复杂的机器和数据中实现轻松、高理论,以及数据中心运行管理方面的实践经验,对能效的管理。源进行全方位、精细化的监控和管理;通过采集和分(5)对资产、容量等资源从配置、变更、实际使析能耗数据,为数据中心管理人员进行能效提升、资用情况及持续规划等角度进行全面深入管理,提升资源优化工作提供决策依据,最终实现降低能耗。源利用率和管理效率。CA2016年12月U新技术研究iiiiii3总体方案设计f7—1I脑客户M主机3。§8雜*23_i系统功能架构i諡溫;i-§□—b ̄ ̄数据中心能效管理系统是面向数据中心运二二二挪营者的高层次功能集成,它在实现系统基本功'丨〕能的基础上,满足IDC能耗管理的需要,使系4统的设备控制管理、信息通信和信息管理等基\本功能与IDC的运维管理有机地融合为一体。\该系统功能架构如下图1所示。*口p.器和■]紐*口I雜Q数据中心能效管理系统区别于传统的r。薄Sh-‘^丨「;-士]I动力环境监控系统,传统的动环监控系统s!|H;|p?控对象包括ups、配电柜、机房空调、机房|=—:!!38^i']IMSB+I前端“¥1斯^?***-…1—?5?媒KI?WR* ̄内温湿度等环境参数,主要提供一些集中检测,集中告警,以监控动力环境系统工作状?2态是否健康。而数据中心能效管理系统在动__>_环监控系统收集上来的数据和参数的基础上做-些复胃杂性的系统分析和数据处理的功能。:1)servers数据库主要保存设备库等数据采集、处理的定义信息,用于后台采集程序;为了能较好地实现对各类数据的采集和通信’2)center数据库主要保存客户端、后台数据程序需要-装各种智能的装置’可按前端设备层、传输层細置信息,用于后台数据程序和客户端;和展示层进行区分。同时为了节约硬件资源和方便后3)note数据库主要保存后自数据程序处理后的历史续系纟充扩容,采集服务?器与存储服务器放置在云资源数据记录及报表记录信息。用于后台数据程序和客户端。池。如图2所示。3_3软件部署架构4系统功能该软件系统主要由后台采集程序、后台数据数据中心能效管理系统的主要功能包括实时能耗程序、客户端三个子程序组成,同时建立servers、管理、容量管理、3D温度云图、告警管理等功能,由于篇幅所限,本文只对肌能效管理系统|系统的重点功能做一些C—mDC_X)|简要的介绍。PDuis祕H;PUE展g分析B||W|:!?<?■M咖猶展4.1能耗「⑶“卜丨丨'麵[丨 ̄(i)能耗采集■二二=■麵侧线■—,U_3:■能耗采集器的合理厂-1^§[111錄和雜徽将会影响各种能耗指标的ffi示■UfaI!aMiat—动环监控接口IIIN11HIhll-c_/\J.r-_,^^-n.,m.,.设备的能耗采集都采用USi*-!aH?I-11)'I||智能电表,可以采集电图i系统功能架构图流、电压、有功功率、2016广东通信青年论坛专刊65HiiH新技术研究H丨i——一时间点的值;当呈现一天、一个月甚至一年的平均(跳〇續>PUE时,采用电量进行计算,此时PUE是一段时间内的平均值。广N.m*.*(C^iN^w^jicr除了对pue进行实时计算结果显本,可按月度、(LONCOMEP采集)?.叹餅^RXm¥MSSji[ACTNTESSJ*|^^处■二丄二:.1¥麟雜球_PUE_*■敝舫IrnS5Iwi555*ls_PUE的同比、环比分析以及对标分析。此外,还可以&看出不同类型设备在数据中心总耗电中的比例情况。I(―据处理)^如图4所1示:后^’台i?pa*?*■、w?a。《*?a_a据*i=a>WiAmtos#nI ̄m|査询事件日志、一古?1rTF^^|l-咖/■ ̄乞―、连接后台数据库CT)[IICLIENT显示矢■,丨|苎能!麵数雛\功能:保存CLIENT及丨?屬前尔、査看及导出历\Servde的设置'保存事I普音m\件日志-保麵=丨.1-^脚必顧《麟山卿相酬」丨丨他以据、报fftlUIWUM.RMMKm*fCZZ ̄ZX__历史数据His+日期一■广^NOTEgj^^r“Rpt_编码_设备名称图3数据库数据流图:,^,|:■■■电量等参数,对于某些需要分摊能耗的设备,需增加图4PUE展示界面温度、流量等传感器,间接得到分摊能耗值(关于能紐摊这里不做赘述’)。所有采■备都是■集在歷分析的基础上还引伸出了顚告警,包括:数据转换成R232或485串口丨g号,再通过串^服务器⑴PUE异常告警,当PUE发生突变时产生,产生告把串=信号转换成TC■信号,便于数据进行实日桐警,突变值可自定义;(2)PUE趋势预警,当PUE^m〇连续几次上升或下降,产生告警,次数可自定义;(2)食隹择屏禾(3)低能效告警,当PUE超过阈值时,产生告警,根据上传的实时数据,按照不同区域(可分楼'mn,D^^^^v^阈值可自定义。同时,对于告警事件,可自动定位到层、机房、模块等)、不同设备类型(可分IT设备、AranaAfr、曰&、i发生能耗异常的设备,帮助运营者及时甚至提前发现UPS、制冷、照明等)进行电量统计,对于关键的能〇故障。耗值进行实时动态显示,并可形成能耗柱状图、饼图、时__,麵不同需求提織计报表,義运营者掌握数据中心的能耗成本。有耗电,包括汀设备、制冷设备、供配电獅照日月mm-tzvt等其他设施的耗电的总和。而办公等其他用途所消耗的(3)PUE展疋与分析能雖脆率(PUE)评价数据中心能源鮮的指标,題据中心消耗的所有能源与IT负载使用&56哈理设置显得尤其重要。对于数据中心,既可计算能源之比,因此需对能耗雖进-步的计算才能翻PUE。其中,PUE计算公式定义为块),PUE计算的准确性-方面取决于准确的PUE计PUE=数据中心总耗电/IT设备耗电算公式,-方面依罪于各种耗电设备的电量米集。基于能耗定义下的PUE有两种方式可以进行计4.23D温度云图算,分别是Power(功率)和Energy(电量),当呈现通过对IDC机房进行三维图像建模,真实地展示—个瞬时PUE时,采用功率进行计算,此时PUE是某机房的3D场景,同时在每个机架内安装温度传感器002016年12月n新技术研究ii"!i(机架的前、后各3个,按上、中、下布放),在机架外面的通道顶部也均勾布放温度传感器,再将温度数j二据以云图的方式拟合在3D机房场景中。通过三种形式4層释直观全面展示机房温度:(1)机架纵面温度图,可直IIII接掌握每个机柜的进出风温度情况;(2)机房水平温::■I-'_ ̄度图,可分层查看不同高度下的机房整体温度;(3)I=机房整体3D温麵,可近備職机細气顏织.?r.^Li咖图,发现机房热域。如图5、图6所示。__图7机房容量展示界面C'">■'<--H1个机柜电力和空画使用情况,触力,嫌电力容'量均<20%时,机柜显示绿色,表示该容量处于正常状态;当其电力容量介于60%和80%之间时,显示橙色,'-mmtm?—?表示处于提醒状态;当其电力容題过■?时,显示红色,表示容量已满,处于告警状态;帮酬户快速麵地了臟房中容量情况。图5机房水平温度图界面ifliammt, ̄-lli(Huymmuu?SFuQ■*t'■*I?*'??"_**?明上J,■,.???..?.y=?_DDHIIIBI1DQBBBBBBIDommunDDDmmmHillIHBIIIin—I>2t±oCl3?'?U/H?;-0*1-^—v\.:x: ̄ ̄%??......f77t ̄fnnlilL:■图8机房容量展示界面图6机房整体3D温度图界面4.3容量管理5总结容量管理使用户能方便对容量电力、冷量、空间数据中心中传统的规划设计会有一个动力环境监控三个方面进行有效的管理,直观又清晰的描绘出系统系统,该系统监控对象包括UPS、配电柜、机房空调、容量的详细信息,为用户提供有价值的信息。机房内温湿度等环境参数,主要提供一些集中检测,(1)机房容量展示集中告警,以监控动力环境系统工作状态是否健康。机房容量展示以柱状图和文本形式展示出机房的而随着现代数据中心规模越来越大,能耗越来越高,数机柜位、电力和冷量三个方面的容量情况,包括额定据中心的节能减排将是一个重要命题,而破题的一个切功率当前功率、额定冷量、当前冷量、机柜位、已分入点就是实施有效的能耗管理。因此,建设一个全新的配机柜位。同时还可以曲线形式展示出三方面容量的能效管理系统,实现能耗的各类统计、PUE计算、温度变化情况。云图、容量管理等等,可以整体提升数据中心的管理能(2)机柜容量展示力,为管理人员进行能耗优化、能效提升工作提供决策在机房的容量布局图中,可用不同颜色标识出各依据,最终实现降低能耗的目标。★2016广东通倍青年论坛专刊67