跳到主要內容
支援知識庫

第 5 代 Intel® Xeon® 處理器的 Intel® 現場掃描改善伺服器機群管理

內容類型: 安裝與設定   |   文章 ID: 000099537   |   最近查看日期: 2025 年 01 月 31 日

Intel® 現場掃描概覽

第 5 代 Intel® Xeon® 可擴充處理器原代號 Emerald Rapids,推出了名為 Intel® In-Field Scan 的全新可靠性、可用性與服務性 (RAS) 功能。這是一系列工具,旨在幫助系統管理員快速輕鬆地找到隨時間推移而發生故障的處理器。Intel® In-Field Scan 具有一系列功能藍圖,將會包含在目前和未來的處理器中。現場掃描 (SAF) 和數位內置自我測試 (BIST) 是現場掃描系列中的前兩項功能,並且兩者都可在第 5 代 Intel® Xeon® 處理器上使用。

Intel® In-Field Scan 的侵入性極小,設計用於快速測試一個核心,而節點中的所有其他核心則繼續執行客戶工作負載。

    掃描位置欄位摘要

    Scan* 是偵測半導體裝置故障的業界標準方法。到目前為止,掃描已被晶元製造工廠的專業測試設備使用。Intel 在大批量製造 (HVM) 期間使用掃描來測試處理器。

    現場掃描使客戶能夠執行 Intel 製造掃描測試的子集,以檢查各個處理核心是否存在故障。使用 Intel 提供的測試模式(稱為掃描測試映射),處理器封裝中的每個內核都可以獨立進行測試,以確認作正常。

    陣列內置自我測試 (BIST)

    數位 BIST 檢查每個核心中的 L1(級別 1)和 L2(級別 2)快取以及許多寄存器檔和數據陣列。作為內置自檢 (BIST),沒有要載入的測試圖像;所有測試均由每個內核中的專用測試模組協調。

    更多資訊

    SAF 和 ArrayBIST 的高級技術概述在 即時佇列環境中查找故障元件技術論文中提供。有關系統要求以及如何執行現場掃描的詳細資訊,請參閱《 Intel® 針對第 5 代Intel® Xeon®處理器的現場掃描啟用指南》。

    Intel® 現場掃描是可靠性和可用性服務領域向前邁出的重要一步,因為它使客戶能夠使用行業測試功能,快速識別其設備中的瑕疵設備。

    系統要求

    在平台上啟用 Intel® 現場掃描需要硬體和軟體。以下是要求的摘要。

    • 支援 Intel® 現場掃描的Intel® Xeon®處理器
    • 掃描測試映像(掃描核心的測試模式)
    • Intel® In-Field Scan Linux 裝置驅動程式
    • Intel® 現場掃描應用程式

    測試和測試結果

    Intel® 現場掃描經過設計與優化,可供系統管理員用來定期測試設備,以確保處理器正常運作。Intel® In-Field Scan 為系統管理員提供了極快速的處理器測試,可以在活動節點(指在線並執行使用者應用程式的節點)上執行,而不會中斷整個節點的運作。在這種情況下, 術語“非常快” 表示~200ms或更短。

    建議對佇列進行定期測試,以查找隨時間推移發生故障的元件。測試車隊的頻率以及要運行的測試範圍是一個複雜的問題。許多變數都會發揮作用,例如:處理器運行了多長時間;處理器預測的時間故障 (FIT) 2 率是多少;客戶對SDE(靜默數據錯誤)的容忍度是多少;以及系統管理員願意投入到主動系統維護上的時間。

    在即時車隊環境中尋找故障元件》技術論文 提供了現場掃描執行頻率的注意事項和示例。

    ® Intel 第 5 代Intel Xeon處理器的現場掃描啟用指南 包含有關如何執行和測試以及了解結果的詳細資訊。

    第 5 代 Intel® Xeon® 處理器的 Intel® 現場掃描掃描測試映射已發佈,以及檢查版本或載入新映射的說明(需要 NDA 帳戶 - 如何申請 Intel® 資源和說明檔中心)。

    Intel® 現場掃描申請 已發佈 (需要 NDA 帳戶 - 如何申請 Intel® 資源與說明檔中心)。

    結論

    在擁有數十萬或數百萬處理器的佇列中,故障可能經常發生。儘快發現這些缺陷是盡量減少客戶運營中斷的關鍵。

    Intel 提供多種工具與功能發展藍圖,測試處理器是否正確作,目前處於業界領先地位。Intel® In-Field Scan 擴充了這些測試功能,改善系統管理員對機群的管理。

    Intel 還提供 Intel® Data Center Diagnostic Tool(Intel® DCDiag)。Intel® DCDiag 是一套測試,可有條不紊地檢查大部分 SoC 功能,包括每個微處理器核心的功能。通過驗證每個 DCDIAG 計算是否正確,而不僅僅是確認測試正確完成執行,DCDIAG 能夠檢測多種類型的故障,包括表現為靜默數據錯誤的故障。如需 Intel® DCDiag 的詳細資訊,請前往此連結

    Intel® In-Field ScanIntel® DCDiag 是輔助測試工具。Intel® In-Field Scan 的侵入性極小,設計用於快速測試一個核心,而節點中的所有其他核心則繼續執行客戶工作負載。Intel® DCDiag 是一個全面的處理器測試套件,當整個處理節點專用於測試時,它最有效。由於工具執行的測試內容不同,Intel 發現每個工具都能在測試的處理器中識別不同的故障。

    注意: 並非所有第 5 代Intel® Xeon®處理器的 SKU 都支援 Intel® 現場掃描。

    現場掃描測試圖像下載

    相關產品

    本文章適用 1 產品。

    免責聲明

    這個頁面的內容綜合了英文原始內容的人工翻譯譯文與機器翻譯譯文。本內容是基於一般資訊目的,方便您參考而提供,不應視同完整或準確的內容。如果這個頁面的英文版與譯文之間發生任何牴觸,將受英文版規範及管轄。 查看這個頁面的英文版。