在雲端執行 HPC 工作負載
HPC 雲端運算在效能等級和可用性上已有極長的發展。需要執行 HPC 工作負載的組織可利用雲端服務,達成其複雜且充滿挑戰的運算及儲存密集型需求。雲端 HPC 也能改善取得成果所需時間,因此研究人員可將時間花在研究本身,而非等待作業佇列。許多支援內部 HPC 部署的 Intel® 技術也能在雲端 HPC 中找到。Intel 與雲端服務供應商緊密合作,使用關鍵工具套件與硬體式安全與加速功能,將 Intel® 架構上的 HPC 工作負載最佳化。
雲端 HPC 架構考量
在雲端,客戶是按時數付費,會依據取得成果所需時間來編列預算的優先順序。架構扮演關鍵角色,能促進效能,在時限內完成 HPC 工作負載的運算,從而對客戶營收有所貢獻。Intel 帶頭與雲端服務供應商合作,部署對於 HPC 雲端執行個體等影響最大的高效能架構。其主要框架和技術如下:
- Intel® Xeon® 可擴充處理器 為 HPC 雲端伺服器的心臟,能為最運算密集型的工作負載提供效能及記憶體容量。Intel® Xeon® 可擴充處理器平台也支援下列幾項關鍵技術,這些技術皆能實現包括人工智慧融合等特定 HPC 使用案例。第 3 代 Intel® Xeon® 可擴充處理器即將部署於各大雲端服務供應商的 HPC 雲端方案,將帶來更大的記憶體頻寬1 且每週期指令(instructions per clock)比上一代處理器更高 2 Intel® Xeon® 可擴充處理器上的 Intel® Speed Select Technology 支援以單一伺服器進行多重配置,能因應多元工作負載的需求。這些增強功能有助客戶獲得更佳的性價比,並加速取得成果。
- 數款精選 Intel® Xeon® 可擴充處理器上的 Intel® Software Guard Extensions (Intel® SGX) 是執行及協助保護雲端 HPC 工作負載的極理想功能。許多安全技術著重保護休止中的資料,然而 Intel® SGX 則有助在資料進行處理中的關鍵時刻加以保護。在多租戶的 HPC 雲端環境中,Intel® SGX 也能利用記憶體指定位址空間來隔離加密金鑰和傳輸中資料,協助保護容器和虛擬機器。
- Intel® Advanced Vector Extensions 512 (Intel® AVX-512) 是一組處理器指令,可提升向量密集型的運算工作負載效能。Intel® AVX-512 尤其適合大量資料集的向量/矩陣作業,是 Intel® Xeon® 可擴充處理器的差異化競爭款。研究人員和資料科學家可使用 Intel® AVX-512 協助提升 AI/DL 工作負載、DNA 排序、模擬、金融分析和 3D 建模的效能。
- Intel® Xeon® 可擴充處理器所配備的 Intel® Deep Learning Boost (Intel® DL Boost) 功能包含全新的向量神經網路指令集 (VNNI),可延伸 AVX-512 的功能。VNNI 也有助降低人工智慧推斷所需卷積作業的數量及複雜度,使 HPC 雲端系統的電力和記憶體需求更低。3 Intel® DL Boost 可加速卷積神經網路迴路,並增加 HPC 雲端執行個體的人工智慧作業,將效能提升 3.4 倍。3
- Intel® oneAPI 是統一的程式設計模型,專為異質 HPC 基礎結構所設計。此模型包含 Intel® Distribution for Python 和 Intel® MKL 等主要效能程式庫,這些程式庫能協助最佳化及加速 Intel 架構上的 HPC 工作負載。Intel® MPI 是許多雲端服務供應商市場中可找到的差異化方案,讓開發人員能輕鬆在多個叢集中部署複雜的應用程式、將程式碼最佳化以提升效能,並利用自動微調來達到低延遲和高頻寬。客戶和雲端服務供應商使用這些框架,可協助確保其 HPC 投資發揮最大效果。
- Intel® HPC 平台規格 是一組最低需求,針對 HPC 基礎架構的運算、記憶體、儲存、架構及其相容的應用程式。此規格確保 HPC 雲端服務供應商的方案能滿足客戶 HPC 工作負載的高品質標準,足供客戶和企業仰賴。
搭載 Intel® 技術的 HPC 雲端服務供應商
Intel 與頂尖 HPC 雲端服務供應商緊密合作,包括 AWS、Google Cloud Platform、Microsoft Azure 和 Oracle。每家雲端服務供應商提供各自的雲端執行個體,其堅實基礎皆為 Intel® Xeon® 可擴充處理器,這些處理器已為 Intel® MPI 最佳化,並內建 Intel® DL Boost。此外,每家雲端服務供應商皆有各自的 Intel® 及第三方解決方案服務商場,協助企業在搭載 Intel® 技術的 HPC 執行個體上迅速起步。
- 搭載 Intel® 技術的 Amazon Web Services 執行個體 使用 Intel® Xeon® 可擴充處理器,並提供多個設定選項,有助匹配產能與 HPC 需求。AWS ParallelCluster 是另一個協助客戶將多個 AWS 叢集協調整合為單一 HPC 雲端解決方案的服務。Intel 也已獲選為 AWS 高效能運算能力合作夥伴,這項身分展示 Intel 在 AWS HPC 雲端解決方案中的深度專業技術。
進一步瞭解 Intel 與 AWS 的合作 ›
閱讀 AWS 電子設計自動化的案例研究 ›
進一步瞭解 Intel 技術支援的 Amazon EC2 案例 ›
影片:改善雲端的高效能運算模擬效率 › - Google Cloud Platform 的 N2 和 C2 虛擬機器類型皆採用 Intel® Xeon® 可擴充處理器和 Intel® AVX-512 來支援高強度的雲端 HPC 工作負載。N2 執行個體使用 Intel® DL Boost,與 N1 執行個體相比,其人工智慧推斷效能提升 2.82 倍。4 自 2021 年起,Google Cloud 公布可用於其叢集的預先調校 HPC 虛擬機器映像,而 Intel® MPI Library 獲列為主要最佳化方案之一。
進一步瞭解 Intel 與 Google Cloud 的合作 ›
開始在 Google Cloud Platform 上進行基因組分析 ›
閱讀 Intel 如何賦予 Google Cloud 強大功能 › - Microsoft Azure HC 系列虛擬機器擁有多達 44 個 Intel® Xeon® 可擴充處理器核心,以及諸如 Intel® AVX-512 和 Intel® MKL 等功能。Azure 也使用 Intel® Arria® 10 FPGA,為 HPC 工作負載加速人工智慧和機器學習模型訓練。Microsoft 近期推出 Azure HPC and AI Collaboration Center,協助宣傳 HPC 和人工智慧最佳實務,而 Intel 即為一大關鍵合作夥伴。
部落格:在 Azure 上評估基因組分析管道:搭載 Intel 技術的虛擬機器 ›
影片:Microsoft Azure HPC 發表專為 EDA 工作負載設計的全新 FX 服務虛擬機器 ›
進一步瞭解 Intel 與 Microtoft Azure 的合作 ›
閱讀 Intel 與 Microsoft Azure HPC 指南 ›
閱讀瞭解 Azure 的商務優勢 › - Oracle 的 HPC 雲端服務由 Intel 技術支援,其效能媲美內部解決方案,還提供雲端經濟和隨選資源的額外優勢。Oracle X9 代執行個體的第 3 代 Intel® Xeon® 可擴充處理器與現有 X7 代執行個體相較,提升效能達 42%。5
閱讀 Oracle X9 的新聞稿 ›
閱讀日產(Nissan)的工程模擬案例研究 ›
搭載 Intel® 技術的雲端服務,上線流程化繁為簡
當企業考慮採用 Intel® 技術支援的雲端服務供應商時,要挑選對的 HPC 雲端方案或許是複雜的苦差事。所幸有許多第三方雲端服務整合的合作夥伴,可協助企業挑選最適合的方案,並簡化上線流程。這些合作夥伴通常是較小型的組織,協助設定工作負載、啟用非標準功能、以豐富 UI 儀表板提供獨特洞察,甚至是找到與內部使用模式一致的方式來複製工作負載的處理。此類型技術合作夥伴的主要範例包括 RONIN、Six Nines 和 OnScale。雲端 HPC 有大量且形形色色的服務方案可選,但選擇太多亦可能是雙面刃,讓挑選對的解決方案更添難度。合作夥伴能予以協助,提供指引、專業知識和專業化服務。
HPC 雲端案例研究
這些使用案例展示了雲端 HPC 工作負載如何協助提供必要的運算資源,並結合回答問題和解決難題的雲端彈性與靈活性:
引領雲端 HPC 的道路
許多 IT 決策者的確瞭解 Intel 能在內部 HPC 架構設計上扮演提供專業知識的角色,然而 Intel 同樣能在雲端 HPC 領域擔任可靠的顧問。任何尋找進入點的組織都能從 Intel 出發,從其雲端服務供應商和技術合作夥伴的全球生態系統獲益。