英特爾於Hot Chips 2024分享從資料中心、雲端和網路,到邊緣和PC等各種AI應用場景的最新進展,展現其技術的深度與廣度,其中包括業界最先進、用於高速AI資料處理的首款全面整合光學運算互連(optical compute interconnect,OCI)小晶片。英特爾也公佈預計於2025年上半年推出的Intel® Xeon® 6 SoC(代號Granite Rapids-D)最新細節。
「英特爾持續為消費性和企業AI應用推出各類平台、系統和技術,創造新的可能。隨著AI工作負載加重,英特爾運用豐富的業界經驗充分了解客戶需求,進而推動創新、發揮創造力並達到理想的商業成果。雖然更高效能的晶片和更大的平台頻寬至關重要,英特爾理解到每個工作負載都面臨獨特挑戰,專為資料中心設計的系統無法輕易地直接挪到邊緣使用。英特爾對於跨領域運算的系統架構具備受肯定的專業知識,此絕佳優勢將推動新一代AI創新。」
英特爾於Hot Chips 2024發表四篇技術論文,分別介紹Intel Xeon 6 SoC、Lunar Lake客戶端處理器、Intel® Gaudi® 3 AI加速器和OCI小晶片。
專為邊緣應用打造的新一代Intel Xeon 6 SoC
英特爾院士暨網路與邊緣運算晶片設計工程師Praveen Mosur說明Intel Xeon 6系統單晶片(System-on-Chip ,SoC)設計的新細節,以及它如何克服不穩定網路連接以及有限空間和功率等邊緣應用情境中出現的挑戰。基於全球超過9萬次1邊緣布署所累積的知識經驗,這款SoC將成為英特爾目前為止最符合邊緣應用的最佳化處理器。從邊緣裝置擴展到邊緣節點,透過單系統架構和整合的AI加速功能,企業能更輕鬆、更有效率、更保密地管理從資料擷取到推論的完整AI工作流程,有助於改善決策、提升自動化程度,為客戶創造價值。
Intel Xeon 6 SoC結合Intel Xeon 6處理器的運算小晶片以及基於Intel 4處理技術打造的邊緣最佳化I/O小晶片,使這款SoC的效能、能耗效率和電晶體密度與先前相比都有顯著改善。其他特色包括:
- 高達32個通道的PCI Express(PCIe)5.0。
- 高達16個通道的Compute Express Link(CXL)2.0。
- 雙埠100G乙太網路。
- 4個和8個記憶體通道,採用相容的BGA封裝。
- 強化邊緣應用的功能,包括擴大工作負載溫度範圍和提升工業級可靠度,成為高效能強固型裝置的理想選擇。
Intel Xeon 6 SoC還有專為提高邊緣和網路工作負載效能和效率的設計,包括新媒體加速,強化即時OTT、VOD和廣播媒體的視訊轉碼和分析能力;提高推論效能的Intel® Advanced Vector Extensions和Intel® Advanced Matrix Extensions;可實現更有效率網路和儲存效能的Intel® QuickAssist 技術;降低虛擬化RAN功耗的Intel® vRAN Boost;此外,還支援Intel® Tiber™ Edge Platform,使用者可利用此平台在標準硬體上進行如雲端般簡易的建構、布署、執行、管理並擴充邊緣和AI解決方案。
Lunar Lake:成就新一代AI PC的最強動力
客戶端CPU SoC資深設計工程師Arik Gihon探討了Lunar Lake客戶端處理器,以及其設計如何提升x86處理器的能耗效率,並提供領先的核心、繪圖處理與客戶端AI效能。全新P-core和E-core有著驚人的效能,與上一代產品相比,系統單晶片功耗可降低高達40%。新的神經元處理單元(Neural Processing Unit,NPU)速度最多可提升4倍,執行生成式AI任務的表現優於上一代產品。此外,新的Xe2 GPU核心也將遊戲和繪圖效能提高到上一代的1.5倍。
Lunar Lake的更多詳細資訊將在 9月3日 的Intel Core Ultra發表會中分享。
Intel Gaudi 3 AI加速器:專為生成式AI訓練和推論所打造
AI加速器首席設計工程師Roman Kaplan介紹了需要大量運算能力的生成式AI模型訓練和布署。隨著系統從單節點擴充到數千個節點的大型叢集,也帶來了巨大的成本和能耗挑戰。
Intel Gaudi 3 AI加速器運用最佳化的架構改善運算、記憶體和網路架構,解決了上述的問題;透過採用高效率的矩陣乘法引擎(Matrix Multiplication Engines ,MME)、雙階層(two-level)快取整合和廣泛的RoCE(RDMA over Converged Ethernet)網路通訊等策略,Gaudi 3 AI加速器能夠實現顯著的效能和能耗效率表現,使AI資料中心的運作更具成本效益與永續性,解決布署生成式AI工作負載時的可擴充性問題。
Gaudi 3 AI加速器和未來Intel Xeon 6產品的相關資訊將在9月的發表會中分享。
每秒4 TB的光學運算互連小晶片,實現XPU對XPU連接
英特爾整合光學解決方案(Integrated Photonics Solutions,IPS)事業部展示業界最先進的首款全面整合光學運算互連(OCI)小晶片,能與英特爾CPU共同封裝並處理即時資料。
首席工程師暨光學整合(Photonics Integration)負責人Saeed Fathololoumi介紹了OCI小晶片,其設計可在長達100公尺的光纖上雙向支援64個通道、32 Gbps資料傳輸。Fathololoumi也說明了OCI小晶片如何滿足AI基礎設施對更高頻寬、更低功耗和更大覆蓋範圍日益增加的需求。英特爾的OCI小晶片使高頻寬互連獲得重大進展,可實現未來CPU/GPU叢集連接的可擴充性和新式運算架構,包括資料中心和高效能運算(HPC)應用的新興AI基礎設施,也可達到一致的記憶體擴充和資源分散。
AI提供了一條便捷路徑,讓企業和消費者能將各種想法提升到前所未有的高度。舉例來說,消費者現在可選擇具備智慧功能的AI PC,提升生產力、創造力、遊戲體驗、娛樂享受和安全性;企業則可運用邊緣運算和AI的強大能力來改善決策過程、提高自動化程度、從專有資料中獲得更多價值。