Sobre a alta disponibilidade de replicação de clusters
Você pode fornecer proteção contra interrupções em um datacenter ou uma região de nuvem configurando uma implantação de cluster do GitHub Enterprise Server para alta disponibilidade. Em uma configuração de alta disponibilidade, um conjunto idêntico de nós de réplica é sincronizado com os nós do cluster ativo. Se falhas no hardware ou software afetarem o centro de dados com o seu cluster ativo, você poderá transferir a falha manualmente para os nós da réplica e continuar processando as solicitações do usuário, minimizando o impacto da interrupção.
Em uma configuração de alta disponibilidade, os nós que hospedam serviços de dados sincronizam regularmente com o cluster de réplica. Nós de réplica são executados em modo de espera e não atendem a aplicativos nem processa solicitações de usuário.
Recomendamos configurar uma alta disponibilidade como parte de um plano de recuperação de desastres abrangente para clustering do GitHub Enterprise Server. Também recomendamos realizar backups regulares. Para obter mais informações, confira "Como configurar backups em sua instância".
Pré-requisitos
Hardware e software
Para cada nó existente no seu cluster ativo, você precisará fornecer uma segunda máquina virtual com recursos de hardware idênticos. Por exemplo, se o cluster tiver 13 nós e cada nó tiver 12 vCPUs, 96 GB de RAM e 750 GB de armazenamento anexado, você precisará fornecer 13 novas máquinas virtuais, tendo cada uma 12 vCPUs, 96 GB de RAM e 750 GB de armazenamento anexado.
Em cada nova máquina virtual, instale a mesma versão do GitHub Enterprise Server que é executada nos nós do seu cluster ativo. Você não precisa fazer o upload de uma licença ou executar qualquer configuração adicional. Para obter mais informações, confira "Configurar uma instância do GitHub Enterprise Server".
Observação: os nós que você pretende usar para a replicação de alta disponibilidade devem ser instâncias independentes do GitHub Enterprise Server. Não inicialize os nós de réplica como um segundo cluster.
Rede
Você deve atribuir um endereço IP estático a cada novo nó que você fornecer e você deve configurar um balanceador de carga para aceitar conexões e direcioná-las para os nós na sua camada frontal do cluster.
A latência entre os nós primário e de réplica deve ser inferior a 70 milissegundos. Não recomendamos configurar um firewall entre as duas redes de nós. Para obter mais informações sobre a conectividade de rede entre os nós no cluster de réplica, confira "Configuração de rede de cluster".
Criar uma alta réplica de disponibilidade para um cluster
Para criar uma réplica de alta disponibilidade para o cluster, você deve concluir as tarefas a seguir. Você também pode revisar uma configuração de exemplo.
- Atribua nodes ativos ao datacenter primário.
- Adicione nodes de réplica ao arquivo de configuração do cluster
- Veja esta configuração de exemplo.
1. Atribua nodes ativos ao datacenter primário
Antes de definir um centro de dados secundário para seus nós de réplica, certifique-se de atribuir seus nós ativos para o centro de dados primário.
-
SSH em qualquer nó no seu cluster. Para obter mais informações, confira "Acesar o shell administrativo (SSH)".
-
Em um editor de texto, abra o arquivo de configuração do cluster em
/data/user/common/cluster.conf
. Por exemplo, você pode usar o Vim. Crie um backup do arquivocluster.conf
antes de editá-lo.Shell sudo vim /data/user/common/cluster.conf
sudo vim /data/user/common/cluster.conf
-
Observe o nome do centro de dados primário do seu cluster. A seção
[cluster]
no início do arquivo de configuração do cluster define o nome do datacenter primário usando o par chave-valorprimary-datacenter
.[cluster] mysql-master = HOSTNAME redis-master = HOSTNAME primary-datacenter = primary
- Opcionalmente, altere o nome do datacenter primário para algo mais descritivo ou preciso editando o valor de
primary-datacenter
.
- Opcionalmente, altere o nome do datacenter primário para algo mais descritivo ou preciso editando o valor de
-
O arquivo de configuração do cluster lista cada nó sob um título
[cluster "HOSTNAME"]
. Embaixo do cabeçalho de cada nó, adicione um novo par chave-valor para atribuir o nó a um centro de dados. Use o mesmo valor deprimary-datacenter
da etapa 3 acima. Por exemplo, caso você deseje usar o nome padrão (default
), adicione o par chave-valor a seguir à seção de cada nó.datacenter = primary
Ao concluir, a seção para cada nó no arquivo de configuração de cluster deve parecer-se com o exemplo a seguir. A ordem dos pares chave-valor não importa.
[cluster "HOSTNAME"] datacenter = default hostname = HOSTNAME ipv4 = IP-ADDRESS ... ...
Observação: se você alterou o nome do datacenter primário na etapa 3, localize o par chave-valor
consul-datacenter
na seção de cada nó e altere o valor para o datacenter primário renomeado. Por exemplo, se você nomeou o datacenter primárioprimary
, use o par chave-valor a seguir para cada nó.consul-datacenter = primary
-
Aplique a nova configuração. Esse comando pode levar algum tempo para ser concluído. Portanto, recomendamos executar o comando em um multiplexador de terminal como
screen
outmux
.ghe-cluster-config-apply
-
Após a conclusão da configuração executada, GitHub Enterprise Server exibe a mensagem a seguir.
Finished cluster configuration
Após GitHub Enterprise Server encaminhar você para a instrução, isso significa que você terminou de atribuir seus nós para o centro de dados primário do cluster.
2. Adicione nodes de réplica ao arquivo de configuração do cluster
Para configurar a alta disponibilidade, você deve definir um nó de réplica correspondente para cada nó ativo no seu cluster. Para criar uma nova configuração de cluster que defina nós ativos e de réplica, você concluirá as tarefas a seguir.
- Criar uma cópia do arquivo de configuração do cluster ativo.
- Editar a cópia para definir nós de réplica que correspondem aos nós ativos, adicionando os endereços IP das novas máquinas virtuais que você forneceu.
- Mescle a cópia modificada da configuração do cluster de volta à sua configuração ativa.
- Aplique a nova configuração para iniciar a replicação.
Para ver um exemplo de configuração, confira "Revise esta configuração de exemplo".
-
Para cada nó no seu cluster, forneça uma máquina virtual correspondente com especificações idênticas, executando a mesma versão do GitHub Enterprise Server. Observe o endereço de host e endereço IPv4 para cada novo nó de cluster. Para obter mais informações, confira "Pré-requisitos".
Observação: se você estiver reconfigurando a alta disponibilidade após um failover, use os nós antigos do datacenter primário.
-
SSH em qualquer nó no seu cluster. Para obter mais informações, confira "Acesar o shell administrativo (SSH)".
-
Faça o backup da sua configuração de cluster existente.
cp /data/user/common/cluster.conf ~/$(date +%Y-%m-%d)-cluster.conf.backup
-
Crie uma cópia do arquivo de configuração de cluster existente em um local temporário, como
/home/admin/cluster-replica.conf
.grep -Ev "(?:|ipv|uuid)" /data/user/common/cluster.conf > ~/cluster-replica.conf
-
Remova a seção
[cluster]
do arquivo de configuração temporário do cluster que você copiou na etapa anterior.git config -f ~/cluster-replica.conf --remove-section cluster
-
Defina um nome para o centro de dados secundário onde você forneceu seus nós de réplica e, em seguida, atualize o arquivo de configuração temporário do cluster com o novo nome do centro de dados. Substitua
SECONDARY
pelo nome escolhido.sed -i 's/datacenter = default/datacenter = SECONDARY/g' ~/cluster-replica.conf
-
Defina um padrão para os nomes de host dos nós de réplica.
Aviso: os nomes do host dos nós de réplica precisam ser exclusivos e diferentes do nome do host do nó ativo correspondente.
-
Abra o arquivo de configuração temporário do cluster da etapa 3 em um editor de texto. Por exemplo, você pode usar o Vim.
sudo vim ~/cluster-replica.conf
-
Em cada seção dentro do arquivo de configuração temporária, atualize as configurações do nó. O arquivo de configuração do cluster lista cada nó sob um título
[cluster "HOSTNAME"]
.- Altere o nome do host citado no título da seção e o valor para
hostname
na seção do nome do host do nó de réplica pelo padrão escolhido na etapa 7 acima. - Adicione uma nova chave chamada
ipv4
e defina o valor como o endereço IPv4 estático do nó de réplica. - Adicione um novo par chave-valor,
replica = enabled
.
[cluster "NEW REPLICA NODE HOSTNAME"] ... hostname = NEW REPLICA NODE HOSTNAME ipv4 = NEW REPLICA NODE IPV4 ADDRESS replica = enabled ... ...
- Altere o nome do host citado no título da seção e o valor para
-
Adicione o conteúdo do arquivo de configuração de cluster temporário que você criou na etapa 4 ao arquivo de configuração ativo.
cat ~/cluster-replica.conf >> /data/user/common/cluster.conf
-
Nomeie os nós primários do MySQL e Redis no centro de dados secundário. Substitua
REPLICA MYSQL PRIMARY HOSTNAME
eREPLICA REDIS PRIMARY HOSTNAME
pelos nomes do host do nó de réplica que você provisionou para corresponder aos primários existentes do MySQL e do Redis.git config -f /data/user/common/cluster.conf cluster.mysql-master-replica REPLICA-MYSQL-PRIMARY-HOSTNAME git config -f /data/user/common/cluster.conf cluster.redis-master-replica REPLICA-REDIS-PRIMARY-HOSTNAME
Aviso: revise o arquivo de configuração do cluster antes de prosseguir.
- Na seção
[cluster]
de nível superior, verifique se os valores demysql-master-replica
eredis-master-replica
são os nomes do host corretos dos nós de réplica no datacenter secundário servirão como os primários do MySQL e do Redis após um failover. - Em cada seção de um nó ativo chamado
[cluster "ACTIVE NODE HOSTNAME"]
, verifique novamente os pares chave-valor a seguir.datacenter
deve corresponder ao valor deprimary-datacenter
na seção[cluster]
de nível superior.consul-datacenter
deve corresponder ao valor dedatacenter
, que deve ser o mesmo que o valor deprimary-datacenter
na seção[cluster]
de nível superior.
- Verifique se, para cada nó ativo, a configuração tem uma seção correspondente para um nó de réplica com as mesmas funções. Em cada seção para um nó de réplica, verifique novamente cada par de chave-valor.
datacenter
deve corresponder a todos os outros nós de réplica.consul-datacenter
deve corresponder a todos os outros nós de réplica.hostname
deve corresponder ao nome do host no título da seção.ipv4
deve corresponder ao endereço IPv4 estático exclusivo do nó.replica
deve ser configurado comoenabled
.
- Aproveite a oportunidade para remover seções para nós off-line que não estão mais sendo usados.
Para revisar um exemplo de configuração, confira "Revise esta configuração de exemplo".
- Na seção
-
Inicializar a nova configuração de cluster. Esse comando pode levar algum tempo para ser concluído. Portanto, recomendamos executar o comando em um multiplexador de terminal como
screen
outmux
.ghe-cluster-config-init
-
Após a conclusão da inicialização , GitHub Enterprise Server exibirá a seguinte mensagem.
Finished cluster initialization
-
Aplique a nova configuração. Esse comando pode levar algum tempo para ser concluído. Portanto, recomendamos executar o comando em um multiplexador de terminal como
screen
outmux
.ghe-cluster-config-apply
-
Após a conclusão da execução da configuração, verifique se a replicação do cluster está corretamente configurada e funcionando.
ghe-cluster-repl-status
-
Após a conclusão da configuração executada, GitHub Enterprise Server exibe a mensagem a seguir.
Finished cluster configuration
-
Configure um balanceador de carga que aceitará conexões de usuários depois de fazer failover para os nós de réplica. Para obter mais informações, confira "Configuração de rede de cluster".
Você terminou de configurar uma replicação de alta disponibilidade para os nós do seu cluster. Cada nó ativo começa a replicar a configuração e os dados para o seu nó de réplica correspondente e você pode direcionar o tráfego para o balanceador de carga para o centro de dados secundário em caso de falha. Para obter mais informações sobre failover, confira "Iniciar failover no seu cluster de réplica".
3. Revise esta configuração de exemplo
A configuração de [cluster]
de nível superior será parecida com o exemplo a seguir.
[cluster]
mysql-master = HOSTNAME-OF-ACTIVE-MYSQL-MASTER
redis-master = HOSTNAME-OF-ACTIVE-REDIS-MASTER
primary-datacenter = PRIMARY-DATACENTER-NAME
mysql-master-replica = HOSTNAME-OF-REPLICA-MYSQL-MASTER
redis-master-replica = HOSTNAME-OF-REPLICA-REDIS-MASTER
mysql-auto-failover = false
...
A configuração para um nó ativo no nível de armazenamento do seu grupo deve parecer o seguinte exemplo.
...
[cluster "UNIQUE ACTIVE NODE HOSTNAME"]
datacenter = default
hostname = UNIQUE-ACTIVE-NODE-HOSTNAME
ipv4 = IPV4-ADDRESS
consul-datacenter = default
consul-server = true
git-server = true
pages-server = true
mysql-server = true
elasticsearch-server = true
redis-server = true
memcache-server = true
metrics-server = true
storage-server = true
uuid = UUID SET AUTOMATICALLY
...
A configuração para o nó de réplica correspondente no nível de armazenamento deve parecer-se com o seguinte exemplo.
- Diferenças importantes do nó ativo correspondente são destacadas em negrito.
- O GitHub Enterprise Server atribui valores para
uuid
automaticamente, ou seja, você não deve definir esse valor para os nós de réplica que serão inicializados. - As funções do servidor, definidas pelas chaves
*-server
, correspondem ao nó ativo correspondente.
...
[cluster "UNIQUE REPLICA NODE HOSTNAME"]
replica = enabled
ipv4 = IPV4 ADDRESS OF NEW VM WITH IDENTICAL RESOURCES
datacenter = SECONDARY DATACENTER NAME
hostname = UNIQUE REPLICA NODE HOSTNAME
consul-datacenter = SECONDARY DATACENTER NAME
consul-server = true
git-server = true
pages-server = true
mysql-server = true
elasticsearch-server = true
redis-server = true
memcache-server = true
metrics-server = true
storage-server = true
uuid = DO NOT DEFINE
...
Monitoramento de replicação entre nós de cluster ativos e de réplica
A replicação inicial entre os nós ativos e de réplica do seu cluster leva tempo. A quantidade de tempo depende da quantidade de dados para a replicação e dos níveis de atividade para GitHub Enterprise Server.
Você pode monitorar o progresso em qualquer nó do cluster, usando ferramentas de linha de comando disponíveis através do shell administrativo do GitHub Enterprise Server. Para obter mais informações sobre o shell administrativo, confira "Acesar o shell administrativo (SSH)".
Para monitorar a replicação de todos os serviços, use o comando a seguir.
ghe-cluster-repl-status
Use ghe-cluster-status
para analisar a integridade geral do cluster. Para obter mais informações, confira "Utilitários de linha de comando".
Reconfigurar a replicação de alta disponibilidade após um failover
Após fazer failover dos nós ativos do cluster para os nós de réplica do cluster, você poderá reconfigurar a alta disponibilidade de duas maneiras. O método escolhido dependerá da razão pela qual você gerou o failover e do estado dos nós ativos originais.
- Forneça e configure um novo conjunto de nós de réplica para cada um dos novos nós ativos no seu centro de dados secundário.
- Use os nós ativos originais como os novos nós de réplica.
O processo de reconfiguração de alta disponibilidade é idêntico à configuração inicial de alta disponibilidade. Para obter mais informações, confira "Como criar uma réplica de alta disponibilidade para um cluster".
Se você usar os nós ativos originais, depois de reconfigurar a alta disponibilidade, será necessário remover a definição do modo de manutenção nos nós. Para obter mais informações, confira "Habilitar e programar o modo de manutenção".
Desabilitar a replicação de alta disponibilidade para um cluster
Você pode parar a duplicação nos nodes de réplica para a sua implantação de cluster de GitHub Enterprise Server.
-
SSH em qualquer nó no seu cluster. Para obter mais informações, confira "Acesar o shell administrativo (SSH)".
-
Em um editor de texto, abra o arquivo de configuração do cluster em
/data/user/common/cluster.conf
. Por exemplo, você pode usar o Vim. Crie um backup do arquivocluster.conf
antes de editá-lo.Shell sudo vim /data/user/common/cluster.conf
sudo vim /data/user/common/cluster.conf
-
Na seção
[cluster]
de nível superior, exclua os pares chave-valorredis-master-replica
emysql-master-replica
. -
Exclua cada seção para um nó de réplica. Para os nós de réplica,
replica
é configurado comoenabled
. -
Aplique a nova configuração. Esse comando pode levar algum tempo para ser concluído. Portanto, recomendamos executar o comando em um multiplexador de terminal como
screen
outmux
.ghe-cluster-config-apply
-
Após a conclusão da configuração executada, GitHub Enterprise Server exibe a mensagem a seguir.
Finished cluster configuration