引:集群架构的超级计算机采用普通电脑上常见的CPU,以其高性价比和灵活性逐渐占据了超级计算领域的主流架构;而专门架构的超级计算机同样具有不可战胜的优势,两种架构将呈现融合的趋势。而目前人们对超级计算机的发展不只是一味地追求更快的计算速度,而是让它们更好用,将其高性能转化为高生产力。
对目前的许多计算机技术用户而言,即使是企业的专业IT管理人员,对于超级计算仍然抱着一幅可望而不可及的心态:一个精彩的展品,虽然很有趣但与自己无甚相关。如同不断刷新陆地奔跑速度的超级赛车一样,超级计算机也在不断刷新着每秒的计算次数,其意义对多数人而言似乎只限在象征性的创造新记录上。
然而,超级计算机的研究专家们正在努力扫除障碍,打算在未来2~5年内让超级计算机来影响日常的IT应用。就本质上来说,单颗处理器内部的计算速度的提升往往超过了处理器与外界之间的数据通信速度,这也是目前限制高性能计算的主要因素。实际上,著名的超级计算机——Cray的外形被设计成圆柱形,就是为了尽可能地缩短数据传输的距离。
超级计算是处于最前沿的尖端技术,世界顶尖的超级计算级随时面临着数据传输瓶颈达到临界点的局面。这种瓶颈需要不断去突破,而专家们对进展情况往往不抱太乐观的态度。
两种架构的融合趋势
在如今的超级计算机领域,有两个比较热门的关键词:多核芯片和集群。多核芯片将多个处理器集成在单块芯片上,可以显著提升计算性能;而集群则是包含了成百上千个普通的Intel风格芯片的超级计算机。
如今双核的PC产品已经出现了,如果按照摩尔定律发展下去,到2010年将会出现集成了64个内核的处理器,按照每个内核同时支持4个线程运行来计算的话,届时一颗芯片上将最多可以有256个线程同时运行。

世界上目前最快速的超级计算机——IBM Blue Gene/L,位于美国Lawrence Livermore国家实验室,包含有131072颗处理器,承担分子动力学研究过程的计算任务。
Jack Dongarra是美国Tennessee大学的计算机科学教授,他所负责维护的超级计算机在世界500强排行中。据他介绍,目前这些最顶尖的计算机一般是包含了500~1000颗处理器的集群计算环境,而其中最快的IBM Blue Gene能在每秒进行280万亿次的浮点运算,包含了131072颗处理器。这些集群必须从内存到所有的处理器之间来回快速地传输大量的数据,这些数据流需要庞大的带宽,而且数据流的传输过程在计算机的工作总量中占用了相当一部分。
Dongarra还介绍说目前世界500强的超级计算机中,有60%以上是采用集群的形式,而非依赖于传统的专门架构,采用传统专门架构的超级计算机基本上都与位于美国西雅图的Cray公司有关。由于集群比专门架构能提供更高的性价比,因此它彻底改变了科学计算领域的局面。一旦集群流行开来,多数用户会发现实际上大量的应用程序并不需要专门架构的超级计算机所提供的快速计算和高宽带,集群已经足够了。不过,Cray公司的主管和一些专家则认为,对于那些特别注重更快速计算的用户来说,专门架构的超级计算机还是他们所青睐的。据他们介绍,实际上在2015年之前,专门架构的超级计算机将携其快速、高带宽的优势与具有高性价优势的集群进行整合,针对各种不同应用的需求产生复合型的超级计算机架构。
据Cray公司企业战略资深副总裁Jan Silverman介绍,他们正在开发一种编译器,可以将最适合其矢量处理器(可以对整个数字串进行同时操作)的代码从那些最适合标量处理器的代码中区分出来。这种编译器将在2009年推出,届时在上述的复合架构超级计算机中自动安排矢量和标量计算任务,它还将为程序员节省大量的劳动,因为人工安排矢量和标量计算的工作既低效又复杂。
|