Meta基础建设全面改造,包括Meta首款客制化AI晶片,新的AI最佳化资料中心设计,以及配备1万6000组GPU的超级电脑。
Meta宣布将重新改造新一代基础建设架构,其中涵盖硬体及软体堆叠层面,藉此强化人工智慧技术发展,并且能更有效率地布署各项新技术,进而透过人工智慧驱动未来元宇宙应用发展。
在新一代针对人工智慧设计的基础设施架构中,将包含Meta第一个用於执行人工智慧模型的客制化晶片,以及全新人工智慧运作最佳化资料中心设计,并且配备1万6000组GPU进行加速运算的超级电脑。
同时,Meta更强调人工智慧是其产品核心,不仅提升个人化体验程度、开发更安全且公正的产品,并且创造更丰富的体验,更能协助企业商家接触到最重视的受众。
接下来,Meta更计画调整程式编写的方式,透过内部开发的生成式人工智慧程式编写辅助工具──Code Compose,藉此提高开发人员在软体开发生命周期的工作效率。
从2010年设立第一个资料中心之後,Meta更从2015年的Big Sur硬体,到PyTorch程式语言开发,再到去年针对人工智慧研究设计的超级电脑,目前将以三大方式精进基础建设架构:
• MTIA (Meta Training and Inference Accelerator): MTIA是Meta第一个由内部开发的客制化加速器晶片系列,专门用於处理推理相关的工作。MTIA针对内部的工作内容设计,其提供运算效能及处理效率优於CPU。藉由同时部署MTIA晶片与GPU,将能提高每项工作的绩效、减少延迟,并且提升处理效率。
• 新一代资料中心:Meta的新一代资料中心设计除了支援现有产品外,更将协助未来新的人工智慧硬体展开训练及推理。这个新资料中心将为人工智慧最佳化所设计,支援液体冷却式人工智慧硬体设备 (liquid-cooled AI hardware) 及高效人工智慧网路,将数千个人工智慧晶片串联在一起,形成资料中心规模的人工智慧训练集 (AI training clusters)。
无论其开发的时间与成本都将提升,还能与其他新的硬体设备相辅相成,像是 Meta 为了支援持续成长的影音内容而首度在内部开发的 ASIC 解决方案──MSVP (Meta Scalable Video Processor)。
• Research SuperCluster (RSC)人工智慧超级电脑:Meta的RSC是全世界最快的人工智慧超级电脑之一,可训练新一代的大型人工智慧模型支援新的扩增实境 (AR)工具、内容理解 (Content Understanding)系统、即时翻译技术等,配备1万6000个GPU,全数皆可透过3层Clos网路结构存取,为2000个训练系统各自提供足够资源。
从去年开始,RSC已经开始参与各项研究计画,例如Meta推动、在今年初公布的大型语言模型LLaMA (Large Language Model Meta AI)。
另外,特别量身打造设计的基础建设架构,将让Meta在实体层面、虚拟层面、软体层面,以及对应用户实际使用的端对端体验全面提升。目前Meta从资料中心到伺服器设备,乃至於维持所有运行的机械系统,均由自行设计、开发及运行,不仅从顶端到底层掌握整个架构,更根据Meta实际需求设计。
而Meta预期未来大量自制基础建设架构将显得更加重要,并且预期未来10年将会看见更多客制化晶片设计,以及针对特定领域打造的人工智慧计处建设架构,以及针对大规模布署需求设计的新系统与工具,将使Meta藉由最新研究成果开发更复杂的人工智慧模型。