Skip to main content

복제본 클러스터로 장애 조치(failover) 시작

GitHub Enterprise Server 클러스터가 실패하면 복제본에 대한 장애 조치(failover)를 할 수 있습니다.

복제본 클러스터로 장애 조치(failover) 정보

고가용성을 구성한 상태에서 활성 클러스터의 데이터 센터에서 오류가 발생한 경우 복제본 클러스터로 장애 조치(failover)할 수 있습니다.

복제본 클러스터로 장애 조치하면 복제본 클러스터가 새 활성 클러스터로 승격되고 새 활성 클러스터가 이전 활성 클러스터에서 분리됩니다. 이전 활성 클러스터의 노드는 이 작업을 수행할 수 있을 만큼 정상 상태인 경우 유지 관리 모드로 전환됩니다.

장애 조치(failover) 후에는 고가용성을 구성하지 않은 두 개의 독립 실행형 클러스터를 갖게 됩니다. 새 활성 클러스터에서 복제본을 재구성할 수 있습니다. 자세한 내용은 클러스터에 대한 고가용성 복제 구성을(를) 참조하세요.

필수 조건

복제본 노드로 장애 조치(failover)하려면 클러스터에 대한 고가용성 복제를 구성해야 합니다. 자세한 내용은 클러스터에 대한 고가용성 복제 구성을(를) 참조하세요.

복제본 클러스터로 장애 조치(failover) 시작

Note

클러스터 구성의 인스턴스에서 이전 주 노드가 장애 조치(failover) 후 새로 승격된 노드에 액세스할 수 있었습니다. 이 문제는 패치 릴리스 3.12.2에서 수정되었습니다. 자세한 내용은 릴리스 정보 항목을 참조하세요.

이 수정의 결과로 ghe-cluster-failover는 이전 기본 클러스터에서 차단할 IP를 식별하여 /data/user/common/cluster-ip-blocklist에 기록합니다. 장애 조치(failover)가 완료되면 명령은 ghe-cluster-block-ips를 실행하여 새 활성 클러스터의 IP를 차단합니다.

또한 이러한 패치 릴리스에서는 ghe-cluster-block-ips, ghe-cluster-block-ip, ghe-cluster-unblock-ips, ghe-cluster-unblock-ip 명령도 도입되었습니다. 이러한 명령을 사용하면 새로 승격된 클러스터에 액세스할 수 있는 IP를 수동으로 제어할 수 있으며 전체 ghe-cluster-failover 명령을 실행할 때 발생할 수 있는 구성 실행 시간이 길어지는 것을 방지할 수 있습니다. 자세한 내용은 명령줄 유틸리티을(를) 참조하세요.

  1. 복제본 클러스터의 기본 MySQL 노드에 SSH합니다. 자세한 내용은 관리 셸(SSH)에 액세스을(를) 참조하세요.

  2. 보조 클러스터로의 장애 조치(failover)를 시작하고 요청에 응답하도록 노드를 구성하려면 다음 명령을 실행합니다.

    ghe-cluster-failover
    
  3. 구성 실행이 완료되면 GitHub Enterprise Server에서 다음 메시지를 표시합니다.

    Finished cluster configuration
    
  4. 복제본 클러스터에 대한 부하 분산 장치의 IP 주소를 가리키도록 DNS 레코드를 업데이트합니다. TTL 기간이 만료되면 요청이 복제본 클러스터로 전달됩니다.

GitHub Enterprise Server에서 프롬프트를 표시하고 DNS 업데이트가 전파되면 장애 조치(failover)가 완료됩니다. 사용자는 클러스터의 일반적인 호스트 이름을 사용하여 GitHub Enterprise Server에 액세스할 수 있습니다.