Introducción
Si tenemos todo correctamente configurado, un fallo en un disco debería ser algo prácticamente automático, ya que el propio Appliance abrirá un caso reportando el incidente y contactarán con nosotros del soporte para ver cuando nos viene bien que nos cambien el disco. Esta es una tarea que hace automáticamente el fabricante y no debemos preocuparnos de ello.
Si es interesante tener los pasos claros y realizar alguna comprobación tras el cambio para ver que todo está funcionando correctamente.
Procedimiento de reemplazo
Si el callhome está correctamente configurado, el appliance abrirá un caso automáticamente. Es muy importante por este motivo revisar que está funcionando correctamente. Podemos revisar las notas técnicas de Veritas para estar seguros:
Configuring Call Home from the NetBackup Appliance Shell Menu
También es muy útil tener configurado el appliance en myveritas donde podremos comprobar si está reportando correctamente, así como la poder comprobar información de contacto:
Podemos ver que se reporta la fecha/hora de la última conexión y así podremos identificar si hay algún problema. También se envía información (metadatos) de uso que puede ser importante para identifcar alertas de poco espacio en la partición de msdp o en alguna del sistema operativo (logs, root, etc…). Se puede ver más detalle seleccionando un appliance.
Podría ocurrir que nos cambiaran un disco en fallo preventivo aunque todavía no esté fallando, si así fuese, para estar más seguros podríamos encender la luz del disco para que no haya confusión en el momento de retirar el disco, esto se puede hacer desde el clish con la opción «Beacon»:
Main > Monitor > Beacon — This command flashes or stops flashing lights on your appliance.
Cuando un disco falla, automáticamente se comienza a reconstruir el Raid6 con el disco de «spare». Tras el reemplazo del disco fallido, se copia el contenido del disco de «spare» en el disco reemplazado. Esta operación se llama «copyback». Podemos comprobar si se está haciendo con este comando:
/opt/MegaRAID/MegaCli/MegaCli64 -PDCpyBk -ShowProg -PhysDrv[<EnvID:Slot#>] –aN
También podremos monitorizar el «copyback» para estar seguros de que se ha completado correctamente.
Referencias
Collecting Appliance ‘DataCollect’ logs to troubleshoot hardware and disk related issues.
Troubleshoot the CallHome feature on 52xx Symantec Appliances
Enrique eres un crack. Buen articulo
Muchas gracias a ti. Encantado de que te sirva de ayuda.
Enrique
Buen articulo Enrique
Hola Angel,
Siempre encantado de poder ayudar :-)
Saludos,
Enrique