建構最佳化高效能運算 (HPC) 架構與應用程式

新技術和軟體開發工具為使用者、系統建構商和軟體開發人員釋放了全系列 HPC 架構和運算模型的強大功能。

HPC 系統的建構區塊

  • HPC 系統可能涵蓋平行運算、叢集運算和網格/分佈式運算策略的組合。

  • 混合雲方法結合了具備公有雲資源的本地基礎設施,讓您根據需要進行擴充,從而降低錯失機會的風險。

  • Intel® HPC 技術包括處理器、記憶體、 Intel® 高效能網路和軟體,為高效能且令人驚豔的可擴充系統奠定基礎。

  • oneAPI 開源軟體、基於標準的跨架構程式化使 HPC 應用程式能夠在各種異類架構類型和分佈式運算模型中以最佳方式運作。

  • Intel® 資料庫和工具透過代碼和最佳化的高效使用幫助客戶充分利用我們的系統。

author-image

作者

在當今加速的業務環境中,HPC 技術的成功採用始於定義明確的 HPC 架構。根據您組織的工作負載和運算目標,可以使用不同的 HPC 系統設計和支援資源來幫助您提高工作效率和可擴充的效能。

設計 HPC 系統

HPC 架構可根據您的需求採用多種形式。組織可以選擇不同的方式來設計 HPC 系統。

跨多個架構的平行運算

HPC 平行運算允許 HPC 叢集執行大型工作負載並將之拆分為可同時執行的單獨運算任務。

可將這些系統設計為縱向擴充或橫向擴充。縱向擴充設計涉及在單獨任務中完成一項工作並將其拆解,以便各個內部核心執行工作,盡可能多地使用伺服器。相較之下,橫向擴充設計涉及將相同的工作拆解為可管理的部分,然後將這些部分分發到多個伺服器或電腦,平行執行所有工作。

隨著模擬、建模和進階分析等密集型工作負載變得越來越普遍,HPC 系統的設計整合了 CPU 和加速器。這些加速器引入了範圍更廣、異類的可能配置,需要開發人員的支援。

開發人員可以使用 oneAPI 跨架構程式工具 來建立可跨 CPU、GPU 和 FPGA 架構使用的單一代碼庫,以提高開發效率和效能。oneAPI 可以透過移除專有程式化模型的限制、簡化新硬體的採用並減少代碼維護來加速 HPC 創新。oneAPI 和 Intel® oneAPI 工具包支援 HPC 開發人員所需的現有開放標準和語言,包括 C++、SYCL、Fortran、OpenMP、MPI 和 Python。了解有關 oneAPI 和 Intel® oneAPI 工具包的更多詳細資訊

叢集運算

高效能運算叢集可透過區域網路 (LAN) 連結多台電腦或多個節點。這些相互連接的節點等同於一台具備尖端運算能力的電腦。HPC 叢集經過獨特設計,可透過跨節點在系統中解決一個問題或執行一項複雜的運算任務。HPC 叢集具有定義的網路拓撲結構,允許組織以不妥協的處理速度處理進階運算。

網格和分散式運算

HPC 網格運算和 HPC 分散式運算屬於同義的運算架構。涉及了透過網路連接的多台電腦,且具有共同的目標,例如解決複雜問題或執行大型運算任務。這種方法非常適合解決可以拆解成單獨區塊並分散在網格中的工作。系統中的每個節點都可以獨立執行任務,無需與其他節點進行溝通。

HPC 雲端基礎設施

過去,HPC 系統被侷限於本地基礎設施可以提供的容量和設計。如今,雲端可使用其它資源擴充本地容量。

最新的雲端管理平台使混合雲方法成為可能,融合了具備公有雲服務的本地基礎設施,因此工作負載可以在所有可用資源之間無縫流動。可在部署和擴充 HPC 系統的速度方面提供更大的靈活度,並且最佳化總體擁有成本 (TCO) 的機會。

通常,相較於在雲端中全天候儲備的等效 HPC 系統,本地 HPC 系統的 TCO 更低。然而,這是僅有在達到峰值容量時才會充分利用針對峰值容量調整的本地解決方案。大部分時間當中,本地解決方案可能未得到充分利用,導致資源受到閒置。然而,缺乏可用容量而無法運算的工作負載可能會導致錯失良機。

簡而言之,使用雲端來增強您的本地 HPC 基礎設施 適用於時間敏感型工作可以降低錯失大機會的風險。

為了推動雲端中的 HPC 創新,Intel 與雲端服務業者深入合作以最大限度地提高效能,套用 Intel® Software Guard Extensions(Intel® SGX)和 Intel® Advanced Vector Extensions 512(Intel® AVX-512)等技術,並簡化初次使用的步驟。閱讀更多關於我們的 HPC 雲端技術以及如何幫助提升結果的資訊

為可擴充性和效能選擇 HPC 處理器

Intel 憑藉著 HPC 技術方面的廣泛專業知識,可滿足處理最苛刻的未來工作負載的效能要求。Intel® Xeon® Scalable 處理器提供了一個高度通用的平台,可以無縫擴充以支援重要 HPC 工作負載的不同效能要求。我們即將推出的基於 Xe HPG 微架構的數據中心 GPU,與 Intel® Xeon® Scalable 處理器相得益彰,有助於進一步提高效能。

Intel 與生態系統合作無間,優先建立藍圖,有助於實現最佳化 HPC 系統設計。為了驗證效能要求,Intel® Cluster Checker(Intel® oneAPI HPC 工具包的一部分)確保您的 HPC 叢集系統完好無損並配置於運作絕佳可攜式平行應用程式,以便在本地和 HPC 雲端系統之間移動。

有了 Intel® CoFluent™ 技術,您可以加快複雜系統的部署,並透過對模擬硬體和軟體互動進行建模,以實現最佳設定。

HPC 記憶體的突破

記憶體是 HPC 系統設計的一個組成元件。負責對於系統的短期數據儲存,而記憶體可能是工作流程效能的限制因素。Intel® Optane™ 技術可彌合儲存和記憶體層次結構中的差距,幫助克服數據中心的這些瓶頸,因此您仍能保有運算能力。

已有實例證明,高頻寬記憶體可成功運用在 HPC 程式化的 GPU 中,並且很快也將運用在 x86 處理器上。許多情況下,高頻寬記憶體技術可以加速受記憶體頻寬限制的代碼,而無需變更代碼。可以且有助於降低 DDR 記憶體成本。

使用 HPC Fabric 擴充效能

為了有效地擴充較小的 HPC 系統,組織需要一種旨在支援 HPC 叢集的高效能結構。

Intel® 高效能網路 (HPN) 使用熟悉且具有成本效益的乙太網技術提供最佳化的效能。可為叢集管理器提供了一個端對端解決方案,涵蓋了其 HPC 和機器學習訓練需求。現有熱門的 HPC 和 AI 中介軟體和框架,包括 oneAPI,可以透過 OpenFabrics 介面(OFI,也稱為 libfabric)和 Intel® Ethernet Fabric Suite。

通往 HPC 成功之路更加輕鬆

Intel 提供專業知識來深入了解 HPC 應用程式、架構以及 HPC 系統(無論是本地、雲端還是混合系統)需要什麼來幫助使用者產生結果並最大限度地取得成就。有了基於 Intel® 技術的 HPC 架構,您可以準備好滿足未來的 HPC、exascale 以及 zettascale 需求。

此外,我們的 oneAPI 工具包已準備好幫助開發人員簡化其 HPC 程式化工作,以支援更多的硬體類型並最大限度地提升業務成果。

常見問題集 (FAQ)

常見問題集

高效能運算架構指的是用於建構 HPC 系統的各種組件以及如何將之整合在一起。通常,這些組件包括 CPU 和加速器(例如 FPGA 或 GPU),以及記憶體、儲存和網路組件。節點或伺服器等各種架構協同工作,作為平行或叢集節點,處理複雜的運算任務。

對於任何 HPC 系統而言,三個最重要的組件是處理器、任何所需的加速器(例如 FPGA 或 GPU)以及所需的網路連接。高頻寬記憶體是另一個重要的考慮因素。