アラートの推奨閾値

推奨されるアラートのしきい値について

外部監視システムを構成して、お使いの GitHub Enterprise Server インスタンスの問題を起こす可能性のあるストレージ、CPU、メモリの使用状況を警告できます。詳細については、「外部モニタリングのセットアップ」および「モニターダッシュボードについて」を参照してください。

ストレージのモニタリング

ルート及びユーザストレージデバイスの両方をモニタリングし、利用可能なディスク領域が少なくなったときに十分な対応時間が持てるような値でアラートを設定することをおすすめします。

重大度	しきい値
警告	ディスクの使用量が総容量の60%を超えた
重大	ディスクの使用量が総容量の75%を超えた

これらの値は、割り当てられたストレージの総量、過去の増大パターン、対応が求められる時間に基づいて調整できます。ストレージリソースは、増加を許容し、追加ストレージの割り当てに必要なダウンタイムを回避するために、多めに割り当てておくことをおすすめします。

CPUとロードアベレージのモニタリング

リソース集約的なGitの操作によってCPUの利用状況が変動するのは通常のことですが、異常に高いCPU利用状況にはアラートを設定することをおすすめします。これは、長引くスパイクはインスタンスのプロビジョニングが不足しているということかもしれないためです。さらに、インスタンスが正常な状態にある通常の稼働日に CPU 稼働率を監視して、リファレンスとして使用できるベースラインを確立することをお勧めします。

重大度	しきい値
警告	ベースラインを 20% 上回る
重大	ベースラインを 40% 上回る

また、仮想化の"steal"時間をモニタリングして、同一ホスト上で動作している他の仮想マシンがインスタンスのリソースをすべて使ってしまっていることがないことを確認するようおすすめします。

メモリ使用率の監視

お使いの GitHub Enterprise Server インスタンスに割り当てられている物理メモリの量は、全体的なパフォーマンスとアプリケーションの応答性に大きな影響を与える可能性があります。システムは、Gitの処理を高速化するためにカーネルのディスクキャッシュを頻繁に利用するよう設計されています。プロセスに割り当てられた物理メモリの量は、ピーク時に使用可能な RAM の合計の 50% 以内に収まるようにすることを推奨しています。

重大度	しきい値
警告	持続的にメモリ使用量が使用可能なメモリ総量の50%を超える
重大	持続的にメモリ使用量が使用可能なメモリ総量の70%を超える

ただし、クラスターのインストールでは、CPU 監視と同様のアプローチに従うことをお勧めします。通常の使用と見なされるものを定義するベースラインを確立し、これに応じてしきい値を設定します。このしきい値は、役割によっても異なる場合があります。

メモリが使い切られると、カーネルOOMキラーはRAMを大量に使っているアプリケーションプロセスを強制的にkillしてメモリリソースを解放しようとします。これは、サービスの中断につながることがあります。通常の処理の状況で必要になる以上のメモリを仮想マシンに割り当てることをおすすめします。

アラートの推奨閾値

この記事の内容

推奨されるアラートのしきい値について

ストレージのモニタリング

CPUとロードアベレージのモニタリング

メモリ使用率の監視