【转载】Forbes刊文:服务器的风向已转

2018-10-30 18:57:26 19

原文作者:Jim McGregor,TIRIAS Research 首席分析师

原文链接:《服务器的风向已转

“安全漏洞日益增多,工作负载需求不断变化,摩尔法则的作用速度也有所减缓,加上新型处理器架构的出现,都给行业带来了诸多挑战;在此情况下,服务器OEM厂商和客户都希望实现变革。许多新的处理器供应商都开始专注于特定的目标细分市场。

此时,IBM从企业对AI技术的巨大兴趣中发掘潜力,是一个最佳的定位……而这其中,硬件只是故事的一个面向。”



IBM 与 Power 架构在 AI 领域居于领先


从来没有单个处理器架构能够适用于所有的服务器应用,因为任何两个工作负载都不可能完全相同。

不过,在过去的十年里,Intel 始终居于服务器市场的主导地位,而作为市场上除 Intel 之外唯一的一家 x86 服务器供应商,AMD 一直居于下风,而其他处理器架构只能在 HPC、主机、数据库和其他专业应用领域展开角逐。

对于IT项目的不全面、不稳妥实施导致安全漏洞日益增多,同时工作负载需求也不断变化,摩尔法则的作用速度也有所减缓,加上创新型处理器架构的出现,都给行业带来了诸多挑战;

在此情况下,服务器OEM厂商和客户都希望实现变革。许多新的处理器供应商都开始专注于特定的目标细分市场。此时,IBM从企业对AI技术的巨大兴趣中发掘潜力,是一个最佳的定位。

除了技术与市场方面的变化之外,Intel 也开始进军制造流程和架构技术领域。该公司正在艰难地向 14nm 和 10 nm 处理节点过渡,而且目前在向 7nm 处理节点的过渡过程中,要落后于 Samsung 和 TSMC(市场领先的晶圆代工服务提供商)。

此外,Intel 有意地限制了 Xeon 处理器的内存带宽,旨在推动双插槽服务器的销售,以取代单插槽服务器。

这就给 IBM 及其 Power 架构带来了新机遇。

借助这些领先的铸造厂,IBM 可以灵活地利用最高密度及最具成本效益的处理技术。此外,IBM 专注于面向整体系统性能的 Power 架构设计,并充分利用 PowerAI 等软件来改善数据流。对 AI 训练和推理而言,关键领域在于内存带宽、加速器带宽和网络带宽。

相比 Xeon 平台,IBM 的 Power 架构不仅能支持更多的内存,而且通过 NVLink,可将加速器带宽提升约 10 倍。NVIDIA 是 AI 加速器领域的领导者,在特斯拉设有 GPU 加速器生产线,而 POWER 是市场上唯一一款在其处理器上直接采用 NVIDIA NVLink 接口的处理器架构,可以显著改善性能。

此外,NVLink 具有一致性,能够让 GPU 直接访问系统内存,这样大型 AI 模型的最高内存就可以达到 2TB,而不仅仅局限于 GPU 内存。

尽管 Intel Xeon 处理器在大多数已安装的数据中心神经网络中都被用作主机处理器,但如果能够采用具有更高性能和带宽的加速平台,将可以给客户带来更多优势。


基于 IBM AC922 Power 的平台,

该平台采用 Nvidia GPU 和 NVLink,

可实现更高的系统带宽


不过,硬件只是故事的一个面向。

除了硬件改善之外,IBM 还开发了相应的工具来扩展 TensorFlow 和 Caffe 等开源框架的功能,还提供了一个机器学习库 Snap ML,它采用的是一般化的线性模型(而不是从头开始),可进一步减少新神经网络的训练量。此外,还专门针对图像和视频识别等新兴应用开发了许多专用库。

IBM 称:借助 ImageNet 数据集,最高可将神经网络的训练速度提升 4 倍(相比基于 Xeon 的系统)。借助 Caffe,IBM 能够将神经网络的训练时间从数小时缩短到数分钟,同时能够让数据科学家更轻松地使用直观工具,而不是首先学习如何编码。

面向 AI 的 IBM 硬件和软件 Power 平台


IBM 还开发了分布式深度学习 (DDL) 软件,结合 Power 架构,能够提升使用多个服务器而每个服务器又配备多个 GPU 的大型系统配置的扩展效率,尤其是能够改善通过大型工作负载才能实现的并行性。借助 DDL,IBM 能够通过 64 个 IBM Power 系统中 256 个 NVIDIA GPU 实现95%的高效扩展。


IBM 的分布式深度学习 (DDL) 软件(扩展效率得到了提升)


IBM 的另一个独特之处在于它为内部数据中心和大型云数据中心提供了一系列平台,甚至还提供了 AI 即服务功能,使其能够访问其自己的利用 Power 的数据中心资源。

当工作负载发生变化时,服务器客户都希望能够获得更多选项,以便应对由于各种工作负载的增多而日益提升的系列性能需求。

在 AI 方面,IBM 与其合作伙伴 NVIDIA 联手开发了一个特定领域环境,该环境提供了一个可确保最大 AI 性能的平台。此外,IBM 还提供了一个完整系列的平台和服务,可用于解决数据科学领域的许多技术挑战。在 AI 领域的其他研究方面,比如 Watson,IBM 也为 Power 平台构建了一个坚实的定位。


原文作者: Jim McGregor,TIRIAS Research 首席分析师 


TIRIAS Research 致力于跟踪从半导体到系统与传感器再到云平台的整个电子 生态系统内各个公司的相关信息并为其提供咨询服务。TIRIAS Research 团队曾为 IBM、Intel 和 NVIDIA 提供过咨询服务。