引:不久前,IBM推出了一款Intel超低电压处理器的刀片服务器HS20,据称一个机箱刀片服务器的供电只有180瓦。一个机箱的满配是14片刀片,具体配置包括两个双核处理器、两块硬盘,还有光纤通道子卡以及交换机全部插满,其功耗是180瓦,相当于一台台式机的供电。
随着越来越多的刀片走进用户的数据中心,一些带有普遍性的问题就慢慢暴露出来了,诸如部署、管理、功耗、散热等。
从目前来讲,部署和管理工具方面的进展非常明显,用户的抱怨也在逐渐减弱。而在老大难的功耗、散热问题之外,刀片用户又开始面对诸如重量带来的机房改造、刀片结点之间的互连速度、整个系统的运算性能等问题。令人乐观的是,最近的一些新品显示,刀片技术在不断成熟,老大难问题正在得到有效解决。
功耗无“罩门”:
双核、超低电压
很多刀片用户对于刀片服务器的供电问题和散热问题深有感触,我们在以前的报道中也讲过很多。
在双核处理器推出以后,供电问题似乎得到了缓解。作为全球最大的刀片服务器供应商,IBM在去年销售了大量的刀片,对于用户碰到的问题,他们有很多的体验。IBM刀片服务器产品经理周俊杰表示,如果CPU还按照以前的发展思路—不断提高主频,那么刀片这种高密度服务器的供电问题就会越来越突出,而且不但是单个刀片的供电问题,整个机架的电源能否充足供给会成为更突出的挑战,“但是最近各个厂家的策略都开始趋向低功耗处理器,例如Intel的处理器路线图已经很明确地显示在今年三、四季度推出的处理器最低主频可能是1.6GHz,而且是双核,这样主频不断降低,但是双核带来的处理性能的提升,功耗问题就不会那么明显了。”周俊杰说。
就在2月18号,IBM推出了一款Intel超低电压处理器的刀片服务器HS20,据称一个机箱刀片服务器的供电只有180瓦。一个机箱的满配是14片刀片,具体配置包括两个双核处理器、两块硬盘,还有光纤通道子卡以及交换机全部插满,其功耗是180瓦,相当于一台台式机的供电。这样一比,就可以明白这种供电需求对于用户机房用电压力或者对单一机架的供电能力,不会造成很大的压力。
实际上,超低电压处理器不仅受到了IBM的追捧,其他几大刀片供应商也正在酝酿推出超低电压处理器的刀片,并且随着双核处理器的普及,刀片的供电问题将得到有效缓解。
散热无“罩门”:
机箱空间、多元冷却技术
在用户的数据中心里,有两个噪音源。一个是服务器的风扇,另外一个就是空调。尤其是在大量部署刀片服务器的数据中心,有时候甚至声音大得令人不能忍受,其目的就是为了保证整个机房环境温度—大家都知道看上去很皮实的服务器其实很脆弱。
正因为这种非常尽心的维护,刀片的散热问题在国内用户看来并不是大问题—因为似乎没有遇到诸如散热引起宕机这样严重的情况。实际上,这种认识有一定道理,如果刀片服务器的部署量不是很大,散热问题不会表现得很突出。
不过,随着用户采用刀片服务器的量越来越大,在散热方面用户的认识也开始改变了。“绝大部分机房开始知道散热问题。”IBM刀片服务器大中华区总经理刘利民说。IBM在去年末的一个项目中,刀片的供货量甚至达到了2000多片,对于这样的用户来说,散热一定是必须关注的问题。
很多用户改造了机房的冷却风系统,由传统的上送风改为下送风,有的用户干脆采用双管齐下的方式,上送风和下送风系统同时启用。另外,一些新兴的冷却技术也开始走向用户的机房,例如IBM推出了机柜后面的散热解决方案,另外还推出了独立的水冷系统,安装在机架上,让冷却水带走单个机架的热量,从而缓解整个数据中心的散热压力。这种方式可以帮助用户解决原先单个机架40~50%的散热需求,对于一部分用户来说,也许就可以不做机房空调系统的改造,仍然用上送风方式就完全足够了。
另外,扩大刀片机箱的空间也是帮助刀片散热的另外一种思路,例如IBM最近刚刚发布的BladeCenter H刀片机箱,高度变成了9U,但实际上插刀片的机箱本身还是7U,剩下的2U高度中,放置了电源模块、四个InfiniBand交换机的槽位,而且分成上面1U和下面1U完全冗余的结构。周俊杰介绍说,这样的设计一方面是为了达到每个机架2900w的供电,以支持处理器厂商未来推出的更高电源要求的处理器,另外一个目的是可以支持80Gb的InfiniBand交换机,提高刀片结点之间的通信能力,还有一个作用,就是扩大空间,有利于散热。
我们相信,这种多元化的散热系统将成为用户数据中心散热系统的趋势。
刀片带来的好处是密度增加、节省空间,然而,同时带来的问题是用户原有的机房承重量也许不能承载高密度的刀片带来的机房改造压力,这个问题目前尚未有明确的方案出来。但是在刘利民看来,重量却不是问题。他拿1U机架服务器与刀片服务器相比,认为42台1U机架服务器占满一个机柜获得的处理能力,如果用刀片服务器的话,重量要减轻40%,用电要减少25~40%,散热减少25~40%,产生的空气流动量减少大约40%,用户应该还是会选择刀片,只不过前提是不要让这个机架满配,只要获得同样的处理能力就可以了。我们没有能够就这个观点与用户进行沟通,不知道用户是否能够同意。
速度无“罩门”:
InfiniBand、Cell
对使用刀片集群的用户来说,高性能计算的瓶颈往往不在每一个结点,而在于结点与结点之间的交流。很多用户都表示,如果这个交流速度可以提高10倍,整个刀片集群性能会有大幅度的提升,第一,买同样数量的刀片可以成倍提高它的性能和成倍降低计算的时间。第二,如果预算有限,可以压缩刀片的数量,比如30%刀片就可以达到原先要求的Linpack值了,对用户来说就可以降低预算少买一些刀片。
目前的刀片服务器都配单片千兆以太网,下一代刀片加上InfiniBand交换机可以支持万兆,这是整个刀片产业界目前显示的一个潮流。例如IBM最新的BladeCenter H机箱就带两个12倍速InfiniBand交换机,能够使数据在企业网络中的传输速度最高比以前提高10倍。
InfiniBand早就被认为是刀片以及集群结点之间最佳的互联技术之一。当InfiniBand交换机插入刀片后,外面很多设备都简化了,原来每个刀片后面出来都要有单独的网络线和冗余网络线,去跟交换机连接,有了InfiniBand就可以不要这些线了。“BladeCenter H现在内部全部都是万兆,两个刀片插进去跑InfiniBand交换机,进另外一个接口就是万兆对万兆。”刘利民说。
就在推出BladeCenter H机箱以及几款新刀片系统的同时,IBM也推出了一款基于Cell宽带引擎(Cell BE)的刀片计算系统,据悉它在加快3D渲染、压缩和加密等关键算法的速度方面,将带来与其他刀片系统不一样的效果。
从这几个方面来看,刀片系统正在越来越成熟,功耗、散热以及结点之间的速度,这些桎梏正在逐一被打破,而新的问题也会不断出现,例如大规模部署刀片前的机房改造等问题。

|