Reemplazo de disco fallido en un Appliance de Netbackup

Introducción

 

Si tenemos todo correctamente configurado, un fallo en un disco debería ser algo prácticamente automático, ya que el propio Appliance abrirá un caso reportando el incidente y contactarán con nosotros del soporte para ver cuando nos viene bien que nos cambien el disco. Esta es una tarea que hace automáticamente el fabricante y no debemos preocuparnos de ello.

Si es interesante tener los pasos claros y realizar alguna comprobación tras el cambio para ver que todo está funcionando correctamente.

 

 

Procedimiento de reemplazo

 

Si el callhome está correctamente configurado, el appliance abrirá un caso automáticamente. Es muy importante por este motivo revisar que está funcionando correctamente. Podemos revisar las notas técnicas de Veritas para estar seguros:

 

Configuring Call Home from the NetBackup Appliance Shell Menu

 

También es muy útil tener configurado el appliance en myveritas donde podremos comprobar si está reportando correctamente, así como la poder comprobar información de contacto:

 

blog1

Podemos ver que se reporta la fecha/hora de la última conexión y así podremos identificar si hay algún problema. También se envía información (metadatos) de uso que puede ser importante para identifcar alertas de poco espacio en la partición de msdp o en alguna del sistema operativo (logs, root, etc…). Se puede ver más detalle seleccionando un appliance.

 

Podría ocurrir que nos cambiaran un disco en fallo preventivo aunque todavía no esté fallando, si así fuese, para estar más seguros podríamos encender la luz del disco para que no haya confusión en el momento de retirar el disco, esto se puede hacer desde el clish con la opción «Beacon»:

 

Main > Monitor > Beacon — This command flashes or stops flashing lights on your appliance.

 

Cuando un disco falla, automáticamente se comienza a reconstruir el Raid6 con el disco de «spare». Tras el reemplazo del disco fallido, se copia el contenido del disco de «spare» en el disco reemplazado. Esta operación se llama «copyback». Podemos comprobar si se está haciendo con este comando:

 

/opt/MegaRAID/MegaCli/MegaCli64 -PDCpyBk -ShowProg -PhysDrv[<EnvID:Slot#>] –aN

blog2

 

También podremos monitorizar el «copyback» para estar seguros de que se ha completado correctamente.

 

Referencias

Collecting Appliance ‘DataCollect’ logs to troubleshoot hardware and disk related issues.

Troubleshoot the CallHome feature on 52xx Symantec Appliances

4 comentarios en “Reemplazo de disco fallido en un Appliance de Netbackup”

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *