开放融合加速 AI、5G等新技术融入开放计算(2)
5G时代,运营商将在靠近用户的网络边缘侧构建业务平台,将部分关键业务应用下沉到网络边缘,以减少网络传输和多级转发带来的带宽与延时损耗。
中国移动研究院电信云交付技术中心主任唐华斌说,传统的服务器就像温室里的花朵,难以直接部署在边缘数据中心,中国移动的多级边缘机房总数达到数百万个,包括地市机房、区县机房、汇聚机房、基站等,边缘服务器需要耐受更严酷的物理环境,同时也需要具备更好的并发承载能力。
OCP社区在电信项目组设立了Open Edge技术小组,希望为边缘计算服务器等硬件设施开发一套公开标准,小组leader成员诺基亚已贡献了Open Edge Chassis Specification v1.2标准,在大会演讲中,诺基亚硬件架构部门负责人Tomi M nnikk 说,该标准以3U高度、19英寸宽度和430mm深度的机箱为基本部署单元,机箱可以支持高度为1U和2U的扩展节点,每个节点的宽度可以为半宽、1/4宽和全宽,机箱最大供电功率2000W,支持AC和DC两种供电模式,可以兼容边缘计算、远端边缘计算等各类部署环境。
浪潮也展示了两款边缘计算服务器,两款产品为2U双路服务器,深度430mm,宽温宽湿,耐腐蚀,并且可以支持GPU、NVM-e等,针对电信应用进行了NUMA Balance优化。
OAI,缩短异构加速计算技术到应用的时间
AI的飞速发展推动了一系列面向深度学习、机器学习以及高性能计算等应用的异构加速方案的发展,加速器硬件系统的技术挑战和设计复杂性很大,将加速器集成到系统中通常需要大约6-12个月,较长的开发周期阻碍了新的AI加速器的快速采用。
不同异构方案的需求是相同的,包括供/制冷、弹性、可用性、可管理性、内部I/O交互和外部可扩展的I/O链路等。OCP社区在服务器项目组下设立了OAI(OpenAccelerator Infrastructure)小组,负责开发OAM(OCP Accelerator Module)规范,将加速器模块标准化,简化AI基础架构的设计,缩短硬件设计周期。OAI项目负责人表示,企业开发一个AI方案很容易,也很快,但是要单独发展一个生态,却很困难,加入OCP会是一个好的选择。
腾讯和浪潮在大会上宣布将T-Flex2.0规范贡献给OCP社区,该规范并不仅着眼于异构加速的规范设计,而是基于I/O池化技术,通过服务器不同模块的解耦重组,实现服务器的模块化迭代和灵活组合,用户可以基于该规范,可以实现异构加速、冷存储、HPC集群等各类不同的应用方案。
OpenRMC,统一开放的数据中心管理架构
OCP正在构建下一代数据中心管理架构,社区的Open Firmware项目组的宗旨是发展敏捷、开放、标准的固件设计规范来适应新一代云计算基础架构发展需求。项目组正在开发开源套件,这些套件仅包括最基本的平台代码来识别白盒硬件,同时用Intel FSP发展可构建和引导的白盒硬件系统,形成软硬一体化的Open Firmware生态。