OpenStack 改善對 AI 工作負載的支持

OpenStack 允許企業在內部管理自己的類似 AWS 的私有雲。即使經過 29 個版本的發佈,它仍然是全球最活躍的開源項目之一,在本週,OpenInfra Foundation 宣布推出 OpenStack 第 29 版。這個新版本被命名為“Caracal”,強調了支持 AI 和高性能計算(HPC)工作負載的新功能。

典型的 OpenStack 用戶是大型企業公司,可能是像沃爾瑪這樣的零售商,或者像 NTT 這樣的大型電信公司。現在幾乎所有企業共同面臨的問題是,他們正在考慮如何將他們的 AI 模型投入生產,同時保證其數據的安全。對於許多企業來說,這意味著對整個堆棧保持總控制。

OpenInfra Foundation 首席營運官 Mark Collier。圖片來源:Frederic Lardinois/TechCrunch

正如 Nvidia CEO Jensen Huang 最近指出的那樣,我們正處於一個將投入資金進入數據中心基礎設施的數千億美元投資浪潮的開端。其中一大部分是由大型超大規模運算公司投資的,但很多也將用於私有部署,這些數據中心需要一個軟件層來管理它們。

這使得 OpenStack 目前處於一個有趣的位置,作為對 VMware 提供的完整替代方案之一,VMware 正面臨著自己的問題,因為許多 VMware 用戶對其出售給 Broadcom 並不感到滿意。比以往任何時候都更多的 VMware 用戶正在尋找替代方案。OpenInfra Foundation 執行董事 Jonathan Bryce 解釋說:“隨著 Broadcom 收購 VMware 和他們進行的一些許可證更改,我們吸引了許多公司前來審視 OpenStack。”

圖片來源:Frederic Lardinois/TechCrunch

在最近幾年裡,OpenStack 的增長主要是由其在亞太地區的應用驅動的。的確,正如 OpenInfra Foundation 本週宣布的那樣,其最新的白金會員是 Okestro,這是一家韓國雲服務提供商,專注於 AI。但由於歐洲具有強大的數據主權法律,所以在歐洲也是一個增長市場,例如英國的 Dawn AI 超級計算機運行著 OpenStack。

OpenInfra Foundation 首席營運官 Mark Collier 告訴 TechCrunch 說:“所有事物都對基礎設施的開源採用形成了一個重大的增長趨勢。”這意味著主要是 OpenStack,還有 Kata Containers 和一些我們的其他項目。因此看到基礎設施升級的另一波浪潮為我們的社區提供了一些重要的工作,將使我們的工作在未來幾年內繼續進行。

在實際方面,此次更新新增功能包括 Nova 支持 vGPU 實時遷移的能力,Nova 是 OpenStack 的核心計算服務。這意味著用戶現在可以將 GPU 工作負載從一台物理伺服器移動到另一台而對工作負載產生最小的影響,企業一直要求這樣做是因為他們希望盡可能高效地管理昂貴的 GPU 硬件。CPU 的實時遷移長時間以來一直是 Nova 的標準功能,但這是第一次適用於 GPU。

最新版本還帶來了一系列安全增強功能,包括針對像 Ironic 裸金屬服務這樣的更多核心 OpenStack 服務的基於規則的訪問控制。這是為支持 HPC 工作負載的網絡更新之外的另一方面以及一系列其他更新。您可以在這裡找到完整的發佈說明。

2015年7月10日加利福尼亞州伯班克的7-Eleven舉行的7-Eleven 88周年慶祝活動的整體氛圍。圖片來源:Chris Weeks/Getty Images for 7-Eleven

這次更新也是自一年前 OpenStack 轉移到“跳級升級發布流程”(SLURP)以來的首次更新。OpenStack 項目每六個月切割一倥版本,但對於大多數企業來說,這太快了——在項目的早期階段,大多數用戶將升級過程描述為“痛苦”(或更糟)。

如今,升級變得更加容易,項目也變得更加穩定。SLURP節奏引入了類似長期發布版本的概念,每隔一年,每隔一個版本是一個易於升級的 SLURP 版本,即使團隊仍然按照原始每六個月的週期進行主要更新,對於那些想要更快節奏的用戶來說仍然很重要。

多年來,OpenStack 在感知方面經歷了良莠不齊的發展週期。但它現在是一個成熟的系統,由一個可持續發展的生態系統支持——這在 10 年前的項目第一次炒作高峰時並不一定是這種情況。近年來,它在電信世界取得了很大成功,這使它得以經歷這個成熟階段,今天,它可能正處於合適的位置和時間來利用 AI 熱潮。