Ir al contenido principal
Base de conocimientos de asistencia

La® exploración Intel en campo de los procesadores Intel® Xeon® de 5a Generación mejora la administración del conjunto de flotas de servidores

Tipo de contenido: Instalación y configuración   |   ID del artículo: 000099537   |   Última revisión: 31/01/2025

Descripción general de la exploración en campo de Intel®

Los procesadores escalables Intel® Xeon® de 5ª generación, anteriormente denominados Emerald Rapids, introdujeron una nueva función de confiabilidad, disponibilidad y capacidad de servicio (RAS) denominada Intel® In-Field Scan. Se trata de una familia de herramientas diseñadas para ayudar a los administradores de sistemas a encontrar rápida y fácilmente los procesadores que han fallado con el tiempo. Intel® In-Field Scan tiene una hoja de ruta de capacidades que se incluirán en los procesadores actuales y futuros. Scan-at-Field (SAF) y Array Built-In Self Test (BIST) son las dos primeras características de la familia In-Field Scan, y ambas están disponibles en procesadores Intel® Xeon® de 5ta Generación.

El análisis en campo de Intel® es mínimamente intrusivo y está diseñado para probar rápidamente un núcleo, mientras que todos los demás núcleos del nodo siguen ejecutando cargas de trabajo de los clientes.

    Resumen de escaneo en campo

    Scan* es un método estándar de la industria para detectar fallas en dispositivos semiconductores. Hasta ahora, el escaneo ha sido utilizado por equipos de prueba especializados en fábricas de fabricación de chips. Intel utiliza el escaneo para probar los procesadores durante la fabricación de alto volumen (HVM).

    El escaneo en campo permite a los clientes ejecutar un subconjunto de pruebas de escaneo de fabricación de Intel para verificar si hay fallas en los núcleos de procesamiento individuales. Utilizando patrones de prueba suministrados por Intel (llamados Scan Test Images), cada núcleo dentro del paquete del procesador se puede probar de forma independiente para confirmar el funcionamiento correcto.

    Comprobación automática incorporada de la matriz (BIST)

    Array BIST comprueba las cachés L1 (nivel 1) y L2 (nivel 2) y muchos de los archivos de registro y matrices de datos en cada núcleo. Al ser un Built-In Self Test (BIST), no hay imágenes de prueba para cargar; Todas las pruebas están coordinadas por un módulo de prueba dedicado en cada núcleo.

    Más información

    En el documento técnico Finding Faulty Components in a Live Fleet Environment se proporciona una descripción técnica de alto nivel de SAF y ArrayBIST. Los detalles sobre los requisitos del sistema y cómo ejecutar el análisis en campo se proporcionan en la Guía de habilitación del análisis en campo de Intel® para el procesador Intel® Xeon® de 5a Generación.

    Intel® In-Field Scan es un importante paso adelante en el ámbito de los servicios de confiabilidad y disponibilidad, ya que permite a los clientes utilizar capacidades de prueba de la industria para identificar rápidamente las unidades defectuosas en su flota.

    Requisitos del sistema

    Existen requisitos de hardware y software para habilitar el análisis Intel® en campo en una plataforma. A continuación se muestra un resumen de los requisitos.

    • Un procesador Intel® Xeon® compatible con la exploración en campo Intel®
    • Imágenes de prueba de escaneo (patrones de prueba de escaneo para los núcleos)
    • El controlador de dispositivo Intel® In-Field Scan Linux
    • La aplicación de escaneo en campo de Intel®

    Pruebas y resultados de pruebas

    El análisis Intel® en campo está diseñado y optimizado para que los administradores de sistemas lo utilicen para probar la flota periódicamente y asegurarse de que los procesadores funcionen correctamente. Intel® In-Field Scan proporciona a los administradores de sistemas una prueba de procesador muy rápida que se puede ejecutar en nodos activos (es decir, un nodo que está en línea y ejecuta aplicaciones de usuario) sin interrumpir el funcionamiento de todo el nodo. En este caso, el término muy rápido significa ~200ms o menos.

    Se recomienda realizar pruebas periódicas de la flota para encontrar componentes que hayan fallado con el tiempo. La frecuencia con la que se debe probar la flota y la extensión de una prueba para ejecutar es una pregunta compleja. Muchas variables entran en juego, por ejemplo: cuánto tiempo ha estado funcionando el procesador; cuál es la tasa prevista de errores en el tiempo (FIT) 2 del procesador? cuál es la tolerancia del cliente para SDE (Silent Data Errors); y la cantidad de tiempo que el administrador del sistema está dispuesto a dedicar al mantenimiento proactivo del sistema.

    El documento técnico "Finding Faulty Components in a Live Fleet Environment" (Encontrar componentes defectuosos en un entorno de flota activa ) proporciona consideraciones y un ejemplo de la frecuencia con la que se puede ejecutar el análisis en campo.

    La guía de habilitación de la exploración en campo de Intel® para procesadores Intel Xeon de 5ta generación contiene información detallada sobre cómo ejecutar, probar y comprender los resultados.

    Se publican las imágenes de prueba de escaneo en campo de Intel® para procesadores Intel® Xeon® de 5a Generación y las instrucciones para verificar la versión o cargar una nueva imagen (se requiere una cuenta NDA - Cómo solicitar un Centro de recursos y documentación de Intel®).

    Se publica la solicitud de escaneo en campo de Intel® (se requiere una cuenta NDA: Cómo solicitar un centro de recursos y documentación de Intel®).

    Conclusión

    En una flota con cientos de miles, o millones, de procesadores, las fallas pueden ocurrir regularmente. Encontrar estos defectos lo más rápido posible es clave para minimizar las interrupciones en las operaciones del cliente.

    Intel lidera la industria al proporcionar varias herramientas y una guía de características, para probar el correcto funcionamiento de los procesadores. Intel® In-Field Scan amplía estas capacidades de prueba para mejorar la administración de flotas por parte de los administradores de sistemas.

    Intel también ofrece el Intel® Data Center Diagnostic Tool (Intel® DCDiag). Intel® DCDiag es un conjunto de pruebas que verifica metódicamente la mayor parte de la funcionalidad del sistema integrado en chip, incluida la de cada núcleo de microprocesador individual. Al verificar que cada cálculo DCDIAG es correcto, y no solo confirmar que la prueba se completó correctamente, DCDIAG puede detectar muchos tipos de fallas, incluidas las que se manifiestan como errores de datos silenciosos. Para obtener más información sobre Intel® DCDiag , vaya a este enlace.

    Intel® In-Field Scan e Intel® DCDiag son herramientas de prueba complementarias. El análisis en campo de Intel® es mínimamente intrusivo y está diseñado para probar rápidamente un núcleo, mientras que todos los demás núcleos del nodo siguen ejecutando cargas de trabajo de los clientes. Intel® DCDiag es un conjunto de pruebas de procesadores completo y es más eficaz cuando todo el nodo de procesamiento está dedicado a las pruebas. Debido a que las herramientas ejecutan un contenido de prueba diferente, Intel descubrió que cada herramienta identifica diferentes fallas entre los procesadores probados.

    Nota: No todos los SKU de los procesadores Intel® Xeon® de 5a Generación son compatibles con el escaneo en campo Intel®.

    Descargas de imágenes de prueba de escaneo en campo

    Productos relacionados

    Este artículo se aplica a 1 productos.

    Descargos de responsabilidad legales

    El contenido de esta página es una combinación de la traducción humana y automática del contenido original en inglés. Este contenido se ofrece únicamente para su comodidad como información general y no debe considerarse completa o precisa. Si hay alguna contradicción entre la versión en inglés de esta página y la traducción, prevalecerá la versión en inglés. Consulte la versión en inglés de esta página.