El tiempo requerido para la tolerancia de fallos depende de cuánto le tome para impulsar la réplica y redireccionar el tráfico de forma manual. El tiempo promedio varía entre 2 y 10 minutos.
Promover una réplica no configura la replicación para aplicativos existentes automáticamente. Despues de promoverla, si así lo quieres, puedes configurar la replicacion desde el nuevo aplicativo principal hacia uno existente y hacia el aplicativo primario previo.
-
Para permitir que la replicación finalice antes de cambiar aparatos, pon el aparato principal en modo mantenimiento:
- Para usar el administrador de consola, consulta "Habilitar y programar el modo mantenimiento"
- También puedes usar el comando
ghe-maintenance -s
.$ ghe-maintenance -s
-
Cuando la cantidad de operaciones activas de Git, consultas de MySQL y jobs de Resque lleguen a cero, espera 30 segundos.
Nota: Nomad siempre tendrá jobs en ejecución, incluso si está en modo de mantenimiento, así que puedes ignorar estos jobs de forma segura.
-
Para verificar que todos los canales de replicación informan
OK
, utiliza el comandoghe-repl-status -vv
.$ ghe-repl-status -vv
-
Para frenar la replicación e impulsar el aparato de réplica a un estado primario, utiliza el comando
ghe-repl-promote
. Esto también pondrá de forma automática al nodo primario en nodo mantenimiento si es accesible.$ ghe-repl-promote
-
Actualiza el registro de DNS para que apunte a la dirección IP de la réplica. El tráfico es direccionado a la réplica después de que transcurra el período TTL. Si estás utilizando un balanceador de carga, asegúrate de que esté configurado para enviar el tráfico a la réplica.
-
Notifica a los usuarios que pueden retomar las operaciones normales.
-
Si se desea, configura una replicación desde el aparato principal nuevo al aparato existente y el principal anterior. Para obtener más información, consulta "Acerca de la configuración de alta disponibilidad."
-
Los aplicativos en los que no pretendas configurar la replicación que eran parte de la configuración de disponibilidad alta antes de la recuperación del fallo deberán eliminarse de dicha configuración de disponibilidad alta a través de UUID.
- Para los aplicativos anteriores, obtén su UUID a través de
cat /data/user/common/uuid
.$ cat /data/user/common/uuid
- En el primario nuevo, elimina las UUID utilizando
ghe-repl-teardown
. Por favor, reemplazaUUID
con aquella UUID que recuperaste en el paso anterior.$ ghe-repl-teardown -u UUID
- Para los aplicativos anteriores, obtén su UUID a través de