前瞻性思维 替代架构会统治超级计算吗?

替代架构会统治超级计算吗?

视频: 懲罰3-愛神的ç®ï¼›æ‡²ç½°4-飢渴的唇 (十月 2024)

视频: 懲罰3-愛神的ç®ï¼›æ‡²ç½°4-飢渴的唇 (十月 2024)
Anonim

近年来,我们已经看到了一些有趣的高性能计算新方法,尤其是从传统的大型处理器转向使用加速器或协处理器的x86 CPU集群以加快特定类型的计算的转变。 在上周的超级计算展览会上,我们看到了英特尔推动将其至强融核协处理器与传统的至强服务器处理器相集成的过程,从而使编程变得更加容易。 Nvidia推出了新版本的Tesla GPU加速器; Micron支持一种完全不同的处理器,用于更专业的计算。 所有这些都是在加速器和协处理器成为世界最快计算机的500强名单中的时候发生的,这促使一些专家建议现有的基准测试对这些处理器的影响太大。

英伟达在大力宣传其Tesla加速器板的成功,该加速器板是与Intel或AMD的主处理器相连的大型GPU集群。 这种芯片可用于多种系统,包括橡树岭国家实验室的Titan系统和瑞士国家超级计算中心的新型Piz Daint系统。 更有趣的是,该公司表示,在最新的Green 500全球最节能超级计算机列表中,Tesla板位居所有前十名系统之列。 除基于AMD Opteron的Titan之外,所有这些系统还使用Intel Xeon,后者是世界500强中排名第二快的系统,但在Green 500列表中排名低得多。

此外,英伟达宣布与IBM合作,在基于IBM Power架构的系统中提供其Tesla加速器。 IBM长期以来一直吹捧其串行性能,其基于Power处理器的BlueGene / Q系统运行着Lawrence Livermore国家实验室的Sequoia系统和Argonne国家实验室的Mira系统。 让IBM和Nvidia一起工作将在将来产生一些有趣的系统。

在展会上,该公司宣布了其下一代GPU加速器板Tesla K40。 该公司表示,它将提供1.4 teraflops的双精度性能,12GB内存(288GBps带宽)以及GPU Boost功能,使其在某些情况下能够以更快的时钟速度运行。 这是对现有Tesla K20系列的升级,使用的是基于28nm技术生产的基本GPU设计。

其他举措包括使GPU编程更容易的方法,其中包括CUDA 6,它现在支持统一内存,即使CPU和GPU内存保持分离,也使开发人员可以将其作为单个池处理。 该公司还支持OpenACC,这是标准的编译器指令集合,可以告诉系统程序的哪些部分(用C / C ++和Fortran编写)可以从CPU卸载到加速器以提高性能。

英特尔将其称为“众筹核心(MIC)架构”的方法大不相同。 它将多个小的x86内核组合到一个称为Xeon Phi的芯片中。 在过去的几年中,英特尔一直在吹捧事实是,所有x86都使编程更加容易,尽管很明显,开发人员仍然必须直接针对该架构。 Xeon Phi的当前版本称为Knights Corner,旨在与更传统的Xeon E服务器芯片一起用作加速器,并被包括中国的Tianhe-2(目前最快的系统)在内的各种顶级系统使用。 )和得克萨斯大学高级计算中心的Stampede系统。

在展会上,英特尔宣布了代号为Knights Landing的新版本,该版本也将作为独立CPU运行,可以安装到标准机架体系结构中并直接运行操作系统,而无需主机CPU(例如Xeon E)。 这对于扩大至强融核的吸引力非常重要,尤其是在工作站市场。 同样,这样做的目的是使软件开发人员更轻松地将其视为单个CPU。 作为Knights Corner的升级,Knights Landing既可以作为独立CPU使用,也可以作为PCI Express板安装到现有系统中。

Knights Landing也有其他重大变化,包括添加“近内存”,即与CPU一起提供的有效DRAM,因此可以提供比传统DDR内存高得多的带宽,而后者受速度的限制。公交车。 (这也越来越快,但是还不快。)这不是朝这个方向迈出的第一步。 IBM多年来一直在其Power架构中吹捧嵌入式DRAM,而英特尔本身也在其Haswell Core系列的Iris Pro版本中将用于图形的嵌入式DRAM投入使用。 不过,我的猜测是,在未来的几年中,我们将朝着这个方向努力。

同时,最有趣的新方法之一来自美光,该公司宣布了一种称为自动机处理器的新加速器,该加速器主要用于解决复杂的非结构化数据问题。

美光公司将其描述为提供一种由数以万计至数百万个处理单元组成的结构,这些结构连接在一起以解决特定任务。 该公司是最大的DRAM和NAND存储器制造商之一,该公司表示将使用基于存储器的处理技术来解决网络安全,生物信息学,图像处理和分析等领域的复杂计算难题。 美光最初将在PC-Express板上分发Automata处理器,以使开发人员可以使用它,但是该公司计划在标准内存模块(称为DIMM)或嵌入式系统的单个芯片上出售处理器。 在某些方面,这听起来与现场可编程门阵列(FPGA)相似,后者经过调整以解决涉及模式匹配的特定应用。

该公司表示正在与佐治亚理工学院,密苏里大学和弗吉尼亚大学合作开发Automata的新应用程序。 尽管该公司尚未宣布最终产品的发布日期,但计划在明年推出软件开发套件以及仿真工具。

自动机听起来像是一个正在进行的工作,现在了解应用程序的广泛性可能为时过早,但这是一种有趣的方法。

总体而言,我们看到了高性能计算的发展。 几年前,最快的计算机大多只是数量众多的标准服务器处理器。 实际上,IBM Blue Gene系统和基于Sparc的系统(例如日本RIKEN高级计算科学研究院的K计算机,使用Fujitsu Sparc处理器)仍然占据着很大的市场份额,其中包括十个最快的系统中的五个世界上的系统。 但是近年来,协同处理器的势头已经转向,使用特斯拉和最近至强融核加速器的系统构成了更多的新系统。 随着这些系统的改进,新的合作伙伴关系,更好的软件和一些新方法的出现,未来超级计算市场可能会大不相同。

替代架构会统治超级计算吗?