Reemplazo de disco fallido en un Appliance de Netbackup

Introducción

Si tenemos todo correctamente configurado, un fallo en un disco debería ser algo prácticamente automático, ya que el propio Appliance abrirá un caso reportando el incidente y contactarán con nosotros del soporte para ver cuando nos viene bien que nos cambien el disco. Esta es una tarea que hace automáticamente el fabricante y no debemos preocuparnos de ello.

Si es interesante tener los pasos claros y realizar alguna comprobación tras el cambio para ver que todo está funcionando correctamente.

Procedimiento de reemplazo

Si el callhome está correctamente configurado, el appliance abrirá un caso automáticamente. Es muy importante por este motivo revisar que está funcionando correctamente. Podemos revisar las notas técnicas de Veritas para estar seguros:

Configuring Call Home from the NetBackup Appliance Shell Menu

También es muy útil tener configurado el appliance en myveritas donde podremos comprobar si está reportando correctamente, así como la poder comprobar información de contacto:

Podemos ver que se reporta la fecha/hora de la última conexión y así podremos identificar si hay algún problema. También se envía información (metadatos) de uso que puede ser importante para identifcar alertas de poco espacio en la partición de msdp o en alguna del sistema operativo (logs, root, etc…). Se puede ver más detalle seleccionando un appliance.

Podría ocurrir que nos cambiaran un disco en fallo preventivo aunque todavía no esté fallando, si así fuese, para estar más seguros podríamos encender la luz del disco para que no haya confusión en el momento de retirar el disco, esto se puede hacer desde el clish con la opción «Beacon»:

Main > Monitor > Beacon — This command flashes or stops flashing lights on your appliance.

Cuando un disco falla, automáticamente se comienza a reconstruir el Raid6 con el disco de «spare». Tras el reemplazo del disco fallido, se copia el contenido del disco de «spare» en el disco reemplazado. Esta operación se llama «copyback». Podemos comprobar si se está haciendo con este comando:

/opt/MegaRAID/MegaCli/MegaCli64 -PDCpyBk -ShowProg -PhysDrv[<EnvID:Slot#>] –aN

También podremos monitorizar el «copyback» para estar seguros de que se ha completado correctamente.

Referencias

Collecting Appliance ‘DataCollect’ logs to troubleshoot hardware and disk related issues.

Troubleshoot the CallHome feature on 52xx Symantec Appliances

4 comentarios en “Reemplazo de disco fallido en un Appliance de Netbackup”

Manuel Vivero dice:

enero 12, 2017 a las 22:18

Enrique eres un crack. Buen articulo

Responder
1. Enrique Pereira Calvo dice:
  
  enero 18, 2017 a las 09:32
  
  Muchas gracias a ti. Encantado de que te sirva de ayuda.
  
  Enrique
  
  Responder
Angel M Rodriguez dice:

julio 26, 2018 a las 19:09

Buen articulo Enrique

Responder
1. Enrique Pereira Calvo dice:
  
  agosto 1, 2018 a las 11:06
  
  Hola Angel,
  
  Siempre encantado de poder ayudar :-)
  
  Saludos,
  
  Enrique
  
  Responder

4 comentarios en “Reemplazo de disco fallido en un Appliance de Netbackup”

Deja una respuesta Cancelar la respuesta