您的位置:首页>>业界动态

决战方寸之间——在Socket上迎战数据中心的成本与架构之困

发布时间:2020-03-25 16:45:08  来源:太平洋电脑网 张垞   背景:

  编者按:以云计算为代表的信息化手段对于当下疫情的防控工作有着卓然的成效,无论是远程视讯、病毒分析、疫情风控分析、视频监控、前端如体温和人脸采集分析等都离不开后端数据中心的支持。这势必牵扯到海量的数据处理能力,而这海量的数据处理能力则依托的是服务器集群所提供的计算能力。

  没有技术能够一劳永逸地解决所有问题,当年的主机如是,现今的PC Server如是,代表未来的云计算更如是。于是,我们也只能边用边改、边总结边探索。

  虽然我们已经推开了数字时代的门扉,看到了数字技术给商业和社会带来的巨大改变。但在数字基础架构层面,问题还远远没有结束。甚至可以说,即使最先进的超大规模数据中心也同样有着自己的近忧和远虑。

  近忧是数据中心的建设和运维成本;而远虑则是全新计算类型不断出现所带来的架构性挑战。

    成本——数据中心永远在翻越的山峰

  即便将数据中心选址在地价、电价相对便宜的地区,数据中心仍是IT建设中最显而易见的重资产项目,其建设与运营都需要巨量的资本。由于需要大量土建工程和基础设备的支持,数据中心内每一平米能够留给IT设备的面积都需要五位数乃至六位数的价格。

  面对堪比北上广房价的数据中心建设费用,计算的密度就成为了任何数据中心建设者都会关心的核心设备指标。而在对于计算密度的极致追求之下,Olympus、Open19、ODCC天蝎项目、OpenRack等定制服务器项目的不断出现也就不足为奇了。

  当然,除了在设备结构上精雕细琢,对于绝大多数数据中心而言,提升计算密度和效率还有另外一条更直接的道路可选——拥有更多核心、更高性能的计算平台。

    AMD第二代EPYC平台:巅峰性能且更具性价比

  继2017年推出代号为“那不勒斯”的第一代EPYC处理器后,AMD于2019年发布了代号为“罗马”的第二代EPYC处理器。

  代号为“罗马”的AMD第二代EPYC系列处理器

  作为业界首款基于7nm工艺的处理器,第二代EPYC处理器最高内置64核128线程,256M三级缓存,八通道DDR4-3200内存(单路4TB)、128条PCIe 4.0等一系列新特性。根据AMD公布的数据,其双倍核心数量加上针对提升周期指令数进行的优化,其浮点性能相较上一代产品提升约4倍。同时,引入7nm制程工艺带来了更高能效;这也意味着第二代EPYC的能效比是上一代产品的2倍。第二代EPYC处理器在多种业内性能基准测试中领先,迄今为止保持超过了 140项世界纪录。

  得益于Chiplets设计,第二代EPYC平台在较短的时间内完成了产品的迭代升级。相比较单片SoC的方式,采用Chiplets设计更具灵活性,因为在许多场景下如果将功能都集成在一颗die上,其性能、功耗、面积通常难以做到最优。而采用Chiplets还可以缩短产品的开发周期,并从一定程度上降低设计风险。AMD将其称为“AMD Infinity”混合多芯片架构,这种架构在第二代EPYC处理器中的应用达到了新的高度。

  在第二代EPYC平台上,AMD采用了最新的7nm工艺设计了Core Chiplet Die(简称CCD)部分,而每个CCD部分均包含两个CPU Complex(简称CCX),每个CCX整合了四个core。而在内存、PCI-e以及磁盘控制器等I/O处理的部分,则采用了14nm的工艺来降低成本与开发周期。每个I/O核心最多可与8个CCD核心相连,即最高64核的设计。

  在2月份举行的SSCC2020大会上,AMD方面谈到了采用7nm+14nm工艺对比单纯7nm工艺设计有效降低了成本:如果将64核产品作为基准比较,在48核、32核、24核、16核产品上有着最高约两倍的节省,其中核心数量越大,所节约的成本越多。

  而采用台积电7nm工艺封装的核心部分不仅大幅提升了能效比,相比第一代EPYC还有效降低了CCD的面积,这使得在第二代EPYC平台中的CCD部分可以塞入更多的内核。同时,改进了的分支预测器,优化过的 L1 指令缓存,两倍的浮点单元数据宽度,指令存储队列,两倍的 L1 数据缓存读写带宽。单个CCX两倍的 L3 缓存等多种改动使得 Zen 2 相对于 Zen1 有超过 15% 的 IPC 提升。最终使得Zen 2相较Zen 1有了约两倍的能效比提升。值得一提的是,由于采用这种非一体化的芯片设计有效地缩短了产品设计周期,AMD还将推出代号“米兰”的第三代EPYC,采用台积电7nm+工艺有望进一步提高能效比。

  目前,AMD EPYC平台已经得到了包括腾讯云、亚马逊、微软、甲骨文、谷歌等大型云服务提供商的青睐;此外,包括戴尔、HPE、H3C、联想等顶级OEM合作伙伴也与AMD合作推出了丰富的基于第二代EPYC平台的服务器产品。

  从另一层面来看,在EPYC平台从第一代到第二代的升级过程中,AMD并没有更换处理器插座。这意味着,用户可以通过升级固件并安装新CPU的形式在不更换服务器整机的前提下就获得更多核心及更多性能。显然,这对于一些用户来说是十分具有吸引力的。

  回看文章最初的问题,构建数据中心通常需要一个相对复杂的流程,实际情况根本没有那么多推倒重来的可能。而在不改变原有风火水电等配套设施的前提下,如何在持续提高计算性能的同时保证出色的能效比则是企业数据中心长期的追求。而纵观AMD EPYC平台的设计思路,则可以很大程度上对客户的原有投资进行保护,满足大多数用户分批次升级的产品生命周期规划。

    Chiplets助力摩尔定律 开创更多可能

  面对越来越丰富的计算类型,服务器也出现了计算场景化的趋势。通过安装GPU、FPGA、AISC等不同类型的计算核心,服务器往往能够获得在特定应用场景中更好的计算效率。但与此同时,通过不断增加计算卡的方式来实现算力多元化,也会对服务器的功耗、散热、物理空间占用等方面提出更高要求。

  面对这样的矛盾, 由AMD在数据中心计算平台中首先实践的Chiplets则给出了令人期待的解决路径。未来,通过将不同的晶片集成在同一基板之上,AMD及其合作伙伴则可以在Socket的方寸之间就解决算力多元化的大挑战。而由于CPU在服务器内往往有着最好的供电和散热资源,通过计算卡形式进行算力多元化所带来的多种问题也将因此迎刃而解。

  换句话说,在已有的基板之上,AMD可以较为方便的对晶片数量进行增减。这就让AMD可以用更低的成本和售价来推出面向中端或入门纯处理器产品。当然,在去掉一些CCD之后,空余的IO带宽和总线还可以用来与同样集成在基板上的其他类型晶片相接驳,从而打造面向特定应用的“异构”处理器。

  顺着这一思路想象,我们可以期待的未来将更加丰富多彩。例如,我们可以将CPU上的其中一个或多个CCD替换为GPU并增加相应的HBM,从而获得更好的ML/DL及推理应用性能(而这种方式也很有可能是解决多GPU之间数据交换与同步的新方法);再比如,我们也可以将这些CCD替换为更有针对性的ASIC来增强CPU在其他特定算法中的性能表现,进而打造出更具场景化的计算平台方案。

  相对于以往的芯片整体设计思路,这种利用Chiplets技术打造异构芯片的方法不仅能够让现有IP继续发挥价值,更可以大幅降低新处理器或计算平台的研发周期和成本,让更多计算场景能够以更低成本获得大幅度的性能优化和基础设施架构简化。

  而从更宏观的层面来看,Chiplets技术也很可能是延续摩尔定律的有效催化剂。

    决战方寸之间

  作为服务器乃至整个数字基础架构的核心,处理器是一门相当复杂的艺术。说它是艺术不仅因为它需要在设计、制程与工程之间不断探索新的平衡,更因为一款处理器要应对来自当下和未来的双重挑战。

  而一款优秀的处理器所代表的计算平台则要做到在为用户提供可见的性能提升的同时,为用户乃至行业的未来提供新的发展方向、新的发展思路。

  从这两方面来看,第二代EPYC处理器都具备独特的意义。64核与7nm的组合为用户带来了肉眼可见的计算性能和密度提升,能够帮助数据中心站上成本与性能的新高度。而Chiplets技术的应用则为制程进步趋缓背景下摩尔定律的继续生效提供了全新路径。

  能够在几百平方毫米的方寸之间将对技术和未来洞察演绎至此,几年以来,这样的产品的确罕见。

  在这里我并不想着墨过多溢美之词;并不是因为这款产品不值得,而是因为很快我们还会有全新的Milan可以期待。届时在做品读亦为时不晚。

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页 本文来源:太平洋电脑网

本文评论
决战方寸之间——在Socket上迎战数据中心的成本与架构之困
编者按:以云计算为代表的信息化手段对于当下疫情的防控工作有着卓然的成效,无论是远程视讯、病毒...
日期:03-25
智能客服的过去、现在和未来
客服行业是一个历史悠久的传统产业,其背后有一个规模可观的潜在市场。长久以来,以人工为主的传统客...
日期:03-25
百视通邀您VR云赏樱 共享辰山植物园户外音乐会
春天,如约而至。
  3月24日,百视通携手上海人民广播电台947频率、上海辰山植物园,特别策...
日期:03-25
争分夺秒 富士施乐人逆行赶制抗疫物资
2020年的春节非同寻常,因为一场突如其来的新冠疫情,也因为这是史上最长的一次春节假期。宅在家就...
日期:03-25
百度地图助力开发者抗击疫情,以协同创新打赢“科技战疫”
三月春暖,和春意渐浓一道而来的,是持续不断地好消息。历时两个多月的严防严控,国内的新冠肺炎疫...
日期:03-25
麒麟820助阵,用“芯”记录!荣耀30S旗舰级影像能力呈现高清世界
在官宣荣耀30S将搭载全新一代5G芯片麒麟820,拥有超能5G体验、超群性能之后,荣耀30S旗舰级影像能力...
日期:03-25
华为P40系列首发:EMUI 10.1明天见
3月25日消息,华为EMUI官方微博预告,P40系列将预装全新的EMUI 10.1系统。
日期:03-25
叮当快药首家打通医保在线支付,医药新零售模式再扩版图
不用扎堆去医院,不用担心交叉感染,隔着屏幕就能向专业医生问诊,使用医保在线支付,由专业送药...
日期:03-25
菲律宾碧瑶综合医院上线华为云AI影像筛查方案
日前,为有效抗击疫情,提高新冠肺炎病毒前期筛查与检测效率,菲律宾碧瑶综合医院(Baguio General Hosp...
日期:03-25
多终端品类搭载紫光展锐芯片,全球已规模出货
今年以来,紫光展锐加速芯片品类布局,据官方消息,目前多终端品牌已经出货。
日期:03-25
NVIDIA RTX 3090突然冒出:4992个流处理器、12GB GDDR6显存
GTC 2020图形技术大会因新冠疫情基本上被取消,NVIDIA下一代显卡也被大大推迟,传闻多时的“安...
日期:03-25
阅文集团吴文辉入选中宣部“宣传思想文化青年英才” 助推中国文化走向世界
  近日,中央宣传部干部局公示了 2019 年文化名家暨“四个一批”人才、宣传思想文化青年英才...
日期:03-25
阿里巴巴:支持东京奥运推迟 将继续打造数字化奥运会
北京时间3月24日晚,国际奥委会(IOC)宣布,原定于2020年7月在日本东京开幕的夏季奥运会将推迟至2021...
日期:03-25
万物智联,MediaTek ASIC定制化芯片解决方案助力企业抢占先机
5G不仅改变人们的通讯生活,也促进云计算和物联网应用的多元化快速发展,云端将面临计算量和数据传...
日期:03-25
一台分饰多角 小度智能屏Air满足家庭多场景全人群需求
在外安心打拼,卧室躺赢人生,拥有一台小度在家智能屏Air,两种生活方式随时切换。3月24日,百度旗...
日期:03-25
Goodram推出入门级PX500系列M.2 NVMe SSD
随着固态硬盘从 SATA 转向 M.2 接口,近年来陆续有许多存储厂商加入了这一领域。本周,Goodram 就发...
日期:03-25
柔宇第二代折叠屏手机柔派2发布:骁龙865加持、影占比全球最高
今天上午(3月25日),柔宇在深圳发布FlexPai 2柔性折叠屏手机。
日期:03-25
柔宇技术大会:第三代蝉翼全柔性屏全面升级 “柔性+”战略平台赋能全新场景
2020年3月25日,深圳—全球柔性电子行业领航者柔宇科技举行了“2020年柔宇技术大会暨战略...
日期:03-25
为何谷歌和LG等厂商不再热衷于装备高通顶级处理器
每年高通的Snapdragon都是众多Android手机旗舰钦定的处理器,不过今年骁龙865和X55 5G通讯模组的捆...
日期:03-25
供应链消息:苹果AR智能眼镜有望2022年到来
DigiTimes 援引业内消息人士的话称,传说中的苹果增强现实(AR)眼镜正在开发中,且有望于 2022 年...
日期:03-25
  专栏介绍
半斤 的专栏
半斤发表的文章
积分:
自我介绍 :