引:自从2004年初“双核(Dual Core)”这个词精灵般地落入x86架构牢牢统治的凡间后,一下子就传遍了大街小巷,成为了很多关注IT的热心人士谈论的焦点话题。而年初双核x86产品的相继亮相,更引发了广大用户对双核时代的期待与渴望。
自从2004年初“双核(Dual Core)”这个词精灵般地落入x86架构牢牢统治的凡间后,一下子就传遍了大街小巷,成为了很多关注IT的热心人士谈论的焦点话题。而年初双核x86产品的相继亮相,更引发了广大用户对双核时代的期待与渴望。
其实,此前的64位计算风波已经吊足了x86用户们的胃口,而正所谓一波未平,一波又起,在64位计算尚未被大家消化之际,双核的降世再次激起了市场新一轮的异动,这也着实有些令人措手不及。看来,这次x86真的是要一举发力,全面进攻已往被RISC处理器占据的高端计算市场了。
尽管双核的光环早已聚焦了人们的太多目光,但迟迟不出场的双核实物,却让很多心急的用户,特别是国内的用户心痒难耐。所幸,PC World中国实验室在第一时间联合AMD、曙光对最先上市的双核Opteron服务器系统进行了前期测试,这里我们就带大家一起去品尝一下双核x86系统的“芯与鲜”。
将芯比芯
有关双核、乃至多核处理器的架构设计,我们已经在本刊此前的报道中进行过很多的探讨和介绍,这里我们也不想再做过多细节上的赘述,只是作一简要概述,帮大家热热身,以便更好地理解后面的测试结果。

图1 双核处理器架构图
正如很多人了解的,双核处理器就是将两个计算核心单元集成到一颗物理的处理器芯片上,有些像我们生活中常见的“双黄蛋”。如图1所示,双核Opteron在处理器结构设计上将两个计算核心(CPU0/CPU1)连同与之配套的L2 Cache共同嫁接在同一个系统请求接口(System Request Interface)上,并通过矩阵计算协调单元(Crossbar Switch)进行数据协调来实现共享内存控制器和HT(HyperTransport,超传输)通道。最关键的一点需要提醒大家牢记的是,这与之前流行在x86平台上的超线程(HT)技术存在着本质区别,前者是物理上两个真实的计算核心,后者则是由一个计算核心模拟的两个逻辑上的计算单元。
双核技术之前在RISC处理器上得到了较早的应用,其中名气最响亮的可能要数IBM的Power4处理器。而在中低端商用市场上,AMD最新的双核Opteron处理器则是该技术x86服务器系统上首次尝试。借助双核技术,x86系统平台设计和制造的复杂度限制将得到有效的缓解,这无疑将对已往Unix服务器固守的8路以上的高端计算市场形成了压力,因为自此x86系统也能轻松地以较低的成本构造起更多路的并行计算平台了。
这里我们简单摘取了AMD单/双核Opteron处理器和IBM Power4双核处理器的主要规格参数,给大家一个更为感性的认识。
|
|
单核Opteron |
双核Opteron |
Power4 |
|
接口规格 |
Socket 940 |
Socket 940 |
4芯片封装 |
|
缓存容量 |
L1 128KB
L2 1MB
整合内存控制器 |
L1 128KB ×2
L2 1MB ×2
整合内存控制器 |
L1 64+32KB ×2
L2 0.5MB ×3
L3 32~128MB |
|
制造工艺 |
90nm |
130nm |
180nm |
|
晶体管数 |
1.06亿 |
2.33亿 |
1.74亿 |
|
内核尺寸 |
193mm2 |
199mm2 |
415mm2 |
双核尝鲜
一个毫无悬念的事实是,在国内和AMD双核Opteron同步上市的是曙光的多款系列服务器。而我们测试的自然也是其中安装了4颗Opteron-875(实际工作频率2.21GHz)双核处理器,具有8个计算核心的R4380A服务器。这是一台3U的全尺寸机架式服务器,送测机型安装了4GB的DDR 333内存,最大支持20GB内存,支持4块热插拔SCSI硬盘,并且提供了CDROM 和FDD。
为了更好地对双核的实际性能进行考察,我们为其准备了Windows Server 2003 SP1 32位企业版和Windows Server 2003 64位测试版两个不同的系统平台测试环境。而在测试工具方面,我们则给它们安装了ASP .Net 2.0、Visual Fortran 6.5、Visual Studio .Net应用环境和编译平台,并通过SPEC CPU2000 V 1.2、思伯伦的Avalanche对该服务器进行了测试,希望能用第一手的测试结果来显现出双核的计算能力和双核对服务器应用的影响。
SPEC CPU2000测试
作为一项工业标准测试指标,SPEC CPU2000一直也是我们针对CPU子系统进行基准测试的重要手段,这次对于双核Opteron,自然也不能放过。

图2 SPEC CPU2000测试结果图
本项测试中,4路双核Opteron表现出了优异的性能(如图2),峰值成绩胜出我们以往测试数据库中最高的4路3.6GHz Xeon MP 1倍以上的性能,即便是与同频双路单核Opteron系统相比,峰值表现也得到了接近3倍的提升。相较其他的处理器,4路双核Opteron带来的8路计算潜能则充分体现了K8核心点对点独立总线架构的先天设计优势。虽然每一个计算核心的计算能力并没有太大的变化,但是在双核的良好配合和在HT的支持下,总体性能几乎是单颗处理器性能的8倍。
Avalanche下的Web测试
对于Web类应用,我们也采用了几个典型的Web类测试,并通过专业测试仪器供应商思伯伦的Avalanche进行测试,以反映服务器在不同应用环境下的基准表现。
首先是网页点击响应。这里,我们仍然在服务器端使用我们服务器测试规范中制定的一个尺寸800KB的基准网站页面,通过千兆网络环境和Avalanche直接连接,由测试仪器发出请求,并记录完成的响应数量。在我们的实际测试中,其每秒1万次的响应已经超越了我们以往测试结果数据库中积累所有测试结果,但此时被测系统的处理器占用率却始终没能超过50%,显然这个4路双核的Opteron服务器已经不再会把这种没有太大计算量的页面访问任务放在眼里了。遗憾的是,我们的数据库中并没有8路和更高端并行系统的记录,无法进行更直观的对比。
为了给系统增大压力,我们启用了在ASP环境下具有大量阶乘和除法的测试脚本,希望能够给服务器的Web应用施加较大的压力,测试结果为每秒响应6000次,但是处理器的占用率仍然没有超过60%。看来这样的计算负荷,对于曙光R4380a服务器的计算能力仍是远远不够的。
随后我们又进行了纯商业计算脚本——大尺寸水印加密测试。在ASP.Net环境的支持下,这套系统峰值水印处理能力超过了26个,平均处理能力也达到了20个,且处理器占用率也仅维持60%~80%的水平上(如图3)。和前面网页点击响应测试相仿,我们仍然未能将这套双核系统压满,看来双核系统对于以往的重符合压力也是游刃有余的。

图3 大尺寸水印加密测试结果图
另外,在我们历时2天的连续测试过程中,8颗Opteron处理核心有约一半以上的时间都运行在满负荷状态下(其余大部分时间CPU负荷也都超过50%),且内存的峰值占用也超过了1.5GB,在这样的较大负载的连续长时间运转环境下,曙光R4380A的可靠性和稳定性也可以算是经历了较为严酷的考验,表现令人满意。

曙光R4380A
首款双核x86服务器
高性能/高密度计算
其实就双核技术本身而言,在应用上并没有太多实质性的改动,特别是与之前的64位计算运动相比,双核技术无需用户对现有应用进行任何更改就可以从中受益,因此很容易赢得用户的认同。从应用层面看,双核技术与传统的双处理器技术并没有太多的区别,因而其整体表现也自然可以取得异曲同工之妙,这一点在本次测试中也有所印证。
将双核心置于同一个芯片内最大的好处自然是降低成本,提升单位面积的计算能力,为未来的高性能计算和高密度计算的继续发展奠定了基础。但这同样也对周边设备,尤其是内存、硬盘的数据传输带宽提出了更高的要求,如果不能提供充足的后备带宽,则会严重制约双处理核心的效能发挥。
|