クラスタノードの入れ替え

GitHub Enterprise Server クラスターノードの交換について

GitHub Enterprise Server クラスター内の問題なく動いているノードを交換することもでき、突然問題が発生したノードを交換することもできます。

ノードの交換後、お使いの GitHub Enterprise Server インスタンスによってジョブが新しいノードに自動的に配布されることはありません。ノード間でジョブのバランスを取るためにインスタンスを強制できます。詳しくは、「クラスターワークロードの再調整」をご覧ください。

Warning

競合を避けるため、クラスターのノードに以前に割り当てられていたホスト名を再利用しないでください。

関数ノードの入れ替え

クラスター内の既存の関数ノードを置き換えることができます。たとえば、追加の CPU、メモリ、またはストレージリソースを仮想マシン (VM) に提供できます。

問題なく動いているノードを交換するには、新しい VM に GitHub Enterprise Server アプライアンスをインストールし、IP アドレスを構成し、新しいノードをクラスター構成ファイルに追加し、クラスターを初期化して構成を適用し、(新しいノードに取って代わられる) 古いノードをオフラインにします。

Note

プライマリデータベースノードを置き換える場合は、「プライマリデータベースノードを置き換える」を参照してください。

置き換えノードに一意のホスト名を指定し、GitHub Enterprise Server をプロビジョニングしてインストールします。1. 管理シェルまたは DHCP を使用して、置換ノードの IP アドレスのみを構成します。その他の設定は行わないでください。1. 任意のノードに対して、新たにプロビジョニングされた置換ノードを追加するには、cluster.conf ファイルを修正し、障害が起きたノードを取り除き、置換ノードを追加します。たとえば、このように変更した cluster.conf ファイルでは、ghe-data-node-3 を新しくプロビジョニングされた ghe-replacement-data-node-3 ノードで置換します。
```
[cluster "ghe-replacement-data-node-3"]
  hostname = ghe-replacement-data-node-3
  ipv4 = 192.168.0.7
  # ipv6 = fd12:3456:789a:1::7
  consul-datacenter = PRIMARY-DATACENTER
  git-server = true
  pages-server = true
  mysql-server = true
  elasticsearch-server = true
  redis-server = true
  memcache-server = true
  metrics-server = true
  storage-server = true
```
新しい MySQL レプリカノードのデータベースシード処理の延期ができます。その結果、アプライアンスをトラフィックに対してより早く開くことができます。詳しくは、「データベースシード処理の遅延」をご覧ください。1. 変更された cluster.conf があるノードの管理シェルから、ghe-cluster-config-init を実行します。これで、クラスタに新たに追加されたノードが初期化されます。1. 同じノードから、ghe-cluster-config-apply を実行します。これにより、構成ファイルが検証され、クラスター内の各ノードにコピーされ、変更された cluster.conf ファイルに従って各ノードが設定されます。
置き換えるノードをオフラインにするには、クラスターのプライマリ MySQL ノードから次のコマンドを実行します。
```
ghe-remove-node NODE-HOSTNAME
```
このコマンドは、ノードで実行されているデータサービスからデータを除外し、ノードを構成でオフラインとしてマークし、ノードへのトラフィックのルーティングを停止します。詳しくは、「コマンドラインユーティリティ」をご覧ください。

緊急時のノードの入れ替え

クラスター内の障害が発生したノードを置き換えることができます。たとえば、ソフトウェアまたはハードウェアの問題がノードの可用性に影響を与える可能性があります。

Note

プライマリデータベースノードを置き換える場合は、「プライマリデータベースノードを置き換える」を参照してください。

緊急時にノードを置き換えるには、障害が発生したノードをオフラインにし、交換ノードをクラスターに追加してから、コマンドを実行して、削除されたノード上のデータサービスへの参照を削除します。

クラスターから問題が発生しているノードを削除するには、クラスターのプライマリ MySQL ノードから、次のコマンドを実行します。 NODE-HOSTNAME を、オフラインにするノードのホスト名に置き換えます。
```
ghe-remove-node --no-evacuate NODE-HOSTNAME
```
このコマンドは、構成でノードをオフラインとしてマークし、ノードへのトラフィックのルーティングを停止します。このコマンドを no-evacuate モードで実行できるようになりました。これは、この手順の後半で、クラスター内の他の使用可能なノードにレプリカをコピーするようにノード上のデータサービスに指示するコマンドを実行するためです。詳しくは、「コマンドラインユーティリティ」をご覧ください。
代替ノードをクラスターに追加します。
1. 置き換えノードに一意のホスト名を指定し、GitHub Enterprise Server をプロビジョニングしてインストールします。
管理シェルまたは DHCP を使用して、置換ノードの IP アドレスのみを構成します。その他の設定は行わないでください。
1. 任意のノードに対して、新たにプロビジョニングされた置換ノードを追加するには、cluster.conf ファイルを変更して置換ノードを追加します。たとえば、次の変更された cluster.conf ファイルは、新しくプロビジョニングされたノード ghe-replacement-data-node-3 を追加します。
```
[cluster "ghe-replacement-data-node-3"]
  hostname = ghe-replacement-data-node-3
  ipv4 = 192.168.0.7
  # ipv6 = fd12:3456:789a:1::7
  git-server = true
  pages-server = true
  mysql-server = true
  elasticsearch-server = true
  redis-server = true
  memcache-server = true
  metrics-server = true
  storage-server = true
```
2. 変更された cluster.conf があるノードの管理シェルから、ghe-cluster-config-init を実行します。これで、クラスタに新たに追加されたノードが初期化されます。
同じノードから、ghe-cluster-config-apply を実行します。これにより、構成ファイルが検証され、クラスター内の各ノードにコピーされ、変更された cluster.conf ファイルに従って各ノードが設定されます。
削除したノード上のデータサービスへの参照を削除します。
1. 削除したノードの UUID を見つけます。 UUID を見つけるには、次のコマンドを実行し、HOSTNAME をノードのホスト名に置き換えます。この UUID は次のステップで使用します。
```
ghe-config cluster.HOSTNAME.uuid
```
2. データサービスへの参照を削除するには、次のコマンドを実行します。 UUID をノードの UUID に置き換えます。
  
  これらのコマンドは、ノードが完全に削除されることを各サービスに示します。サービスは、クラスター内の使用可能なノード上のノード内に含まれるすべてのレプリカを再作成します。
  
  Note
  
  レプリカ間でデータのバランスが取られる間、これらのコマンドによってサーバーの負荷が増える可能性があります。
  
  git-server サービスの場合 (リポジトリデータに使用)：
```
ghe-spokesctl server destroy git-server-UUID
```
  pages-server サービスの場合 (GitHub Pages サイトビルドに使用)：
```
ghe-dpages remove pages-server-UUID
```
  storage-server サービス (Git LFS データ、アバター画像、添付ファイル、リリースアーカイブに使用)：
```
ghe-storage destroy-host storage-server-UUID --force
```
必要に応じて、 cluster.conf ファイル内の削除されたノードのエントリを削除します。そうすることで、cluster.conf ファイルが整理された状態に保たれ、今後の config-apply の実行時の時間を節約できます。
1. ファイルからエントリを削除するには、次のコマンドを実行し、HOSTNAME が削除されたノードのホスト名に置き換えます。
```
ghe-config --remove-section "cluster.HOSTNAME"
```
2. 構成をクラスター内の他のノードにコピーするには、cluster.conf を変更したノードの管理シェルから ghe-cluster-config-apply を実行します。

プライマリデータベースノードを置き換える (MySQL または MySQL と MSSQL)

データベースサービスを提供するには、クラスターにプライマリ MySQL ノードと少なくとも 1 つのレプリカ MySQL ノードが必要です。詳しくは、「クラスタノードについて」をご覧ください。

クラスターで GitHub Actions が有効な場合は、以下の手順で MSSQL も考慮する必要があります。

プライマリ MySQL (または MySQL と MSSQL) ノードにさらにリソースを割り当てる必要がある場合、または障害が発生したノードを置き換える必要がある場合は、クラスターに新しいノードを追加できます。ダウンタイムを最小限に抑えるには、新しいノードを追加し、MySQL (または MySQL と MSSQL) データをレプリケートしてから、それをプライマリノードに昇格させます。昇格プロセス中には、ある程度のダウンタイムが必ず発生します。

置き換えノードに一意のホスト名を指定し、GitHub Enterprise Server をプロビジョニングしてインストールします。
管理シェルまたは DHCP を使用して、置換ノードの IP アドレスのみを構成します。その他の設定は行わないでください。
お使いの GitHub Enterprise Server インスタンスに接続するには、クラスターのいずれかのノードに SSH 接続します。ワークステーションから、次のコマンドを実行します。 HOSTNAME は、ノードのホスト名に置き換えます。詳しくは、「管理シェル (SSH) にアクセスする」をご覧ください。
Shell
```
ssh -p 122 admin@HOSTNAME
```
```
ssh -p 122 admin@HOSTNAME
```
テキストエディターで、/data/user/common/cluster.conf のクラスター構成ファイルを開きます。たとえばVimを利用できます。ファイルを編集する前に、 cluster.conf ファイルのバックアップを作成します。
Shell
```
sudo vim /data/user/common/cluster.conf
```
```
sudo vim /data/user/common/cluster.conf
```
クラスター構成ファイルでは、[cluster "HOSTNAME"] 見出しの下に各ノードが示されます。ノードの新しい見出しを追加し、構成のキーと値のペアを入力します。プレースホルダーは実際の値に置き換えます。
- mysql-server = true キーと値のペアを必ず含めます。
- クラスターで GitHub Actions が有効な場合は、mssql-server = true キーと値のペアも含める必要があります。
- 次のセクションは例であり、ノードの構成は異なる場合があります。
```
...
[cluster "HOSTNAME"]
  hostname = HOSTNAME
  ipv4 = IPV4-ADDRESS
  # ipv6 = IPV6-ADDRESS
  consul-datacenter = PRIMARY-DATACENTER
  datacenter = DATACENTER
  mysql-server = true
  redis-server = true
  ...
...
```
変更された cluster.conf があるノードの管理シェルから、ghe-cluster-config-init を実行します。これで、クラスタに新たに追加されたノードが初期化されます。
cluster.conf を変更したノードの管理シェルから、ghe-cluster-config-apply を実行します。新しく追加されたノードはレプリカ MySQL ノードになり、他の構成済みサービスはそこで実行されます。

Note

前のスニペットは、クラスター内で GitHub Actions が有効になっていることを前提としていません。
MySQL レプリケーションが完了するまで待ちます。クラスター内の任意のノードからの MySQL レプリケーションを監視するには、ghe-cluster-status -v を実行します。

クラスター内で GitHub Actions が有効な場合は、MSSQL レプリケーションが完了するまで待つ必要があります。

クラスターにノードを追加した直後、レプリケーションが追いつくまでレプリケーションステータスのエラーが表示される場合があります。インスタンスの負荷、データベースデータ量と、インスタンスが最後にデータベースシードを生成した時間によっては、レプリケーションに数時間かかる場合があります。
予定メンテナンスウィンドウで、メンテナンスモードを有効にします。詳しくは、「メンテナンスモードの有効化とスケジューリング」をご覧ください。
ghe-cluster-status -v を実行して、クラスター内の任意のノードから MySQL (または MySQL と MSSQL) のレプリケーションが完了していることを確認します。

Warning

MySQL (または MySQL と MSSQL) のレプリケーションが完了するまで待たないと、インスタンス上のデータが失われる恐れがあります。
現在の MySQL プライマリノードを読み取り専用モードに設定するには、MySQL プライマリノードから次のコマンドを実行します。
Shell
```
echo "SET GLOBAL super_read_only = 1;" | sudo mysql
```
```
echo "SET GLOBAL super_read_only = 1;" | sudo mysql
```
プライマリ MySQL ノードとレプリカ MySQL ノードで設定されたグローバルトランザクション識別子 (GTID) が同じになるまで待ちます。 GTID をチェックするには、いずれかのクラスターノードから次のコマンドを実行します。
Shell
```
ghe-cluster-each -r mysql -- 'echo "SELECT @@global.gtid_executed;" | sudo mysql'
```
```
ghe-cluster-each -r mysql -- 'echo "SELECT @@global.gtid_executed;" | sudo mysql'
```
- グローバル MySQL 変数が正常に設定されたことをチェックするには、次のコマンドを実行します。
Shell
```
 echo "SHOW GLOBAL VARIABLES LIKE 'super_read_only';" | sudo mysql
```
```
 echo "SHOW GLOBAL VARIABLES LIKE 'super_read_only';" | sudo mysql
```
クラスター内で GitHub Actions が有効な場合は、新しいプライマリ MSSQL ノードとなるノードに SSH で接続します。
Shell
```
ssh -p 122 admin@NEW_MSSQL_NODE_HOSTNAME
```
```
ssh -p 122 admin@NEW_MSSQL_NODE_HOSTNAME
```
- screen セッション内から次のコマンドを実行して、MSSQL を新しいノードに昇格させます。
Shell
```
/usr/local/share/enterprise/ghe-mssql-repl-promote
```
```
/usr/local/share/enterprise/ghe-mssql-repl-promote
```
これにより、現在のプライマリ MSSQL ノードへのアクセスが試行され、正常なフェールオーバーが実行されます
プライマリ MySQL ノードとレプリカ MySQL ノードの GTID が一致したら、テキストエディターの /data/user/common/cluster.conf でクラスター構成ファイルを開いてクラスター構成を更新します。
- ファイルを編集する前に、 cluster.conf ファイルのバックアップを作成します。
- トップレベルの [cluster] セクションで、置き換えたノードのホスト名を mysql-master キーと値のペアから削除し、代わりに新しいノードを割り当てます。新しいノードがプライマリ Redis ノードでもある場合は、redis-master キーと値のペアを調整します。
- クラスターで GitHub Actions が有効な場合は、mssql-server = true キーと値のペアも含める必要があります。
```
[cluster]
  mysql-master = NEW-NODE-HOSTNAME
  redis-master = NEW-NODE-HOSTNAME
  primary-datacenter = primary
...
```
cluster.conf を変更したノードの管理シェルで、screen セッションを開始し、ghe-cluster-config-apply を実行します。このコマンドを実行すると、クラスターを再構成し、新しく追加されたノードをプライマリ MySQL ノードに昇格させ、元のプライマリ MySQL ノードをレプリカに変換することができます。

Note

前のスニペットは、クラスター内で GitHub Actions が有効になっていることを前提としていません。
ghe-cluster-status -v を実行して、クラスター内の任意のノードから MySQL (または MySQL と MSSQL) のレプリケーションの状態をチェックします。
クラスター内で GitHub Actions が有効な場合は、新しい MySQL および MSSQL ノードから次のコマンドを実行します。
Shell
```
/usr/local/share/enterprise/ghe-repl-post-failover-mssql
```
```
/usr/local/share/enterprise/ghe-repl-post-failover-mssql
```
MySQL (または MySQL と MSSQL) のレプリケーションが完了したら、クラスター内の任意のノードからメンテナンスモードを無効にします。「メンテナンスモードの有効化とスケジューリング」を参照してください。

クラスタノードの入れ替え

この機能を使用できるユーザーについて

この記事の内容

GitHub Enterprise Server クラスターノードの交換について

関数ノードの入れ替え

緊急時のノードの入れ替え

プライマリデータベースノードを置き換える (MySQL または MySQL と MSSQL)

クラスタノードの入れ替え

この機能を使用できるユーザーについて

この記事の内容

GitHub Enterprise Server クラスター ノードの交換について

関数ノードの入れ替え

緊急時のノードの入れ替え

プライマリ データベース ノードを置き換える (MySQL または MySQL と MSSQL)

GitHub Enterprise Server クラスターノードの交換について

プライマリデータベースノードを置き換える (MySQL または MySQL と MSSQL)