ストレージのモニタリング
ルート及びユーザストレージデバイスの両方をモニタリングし、利用可能なディスク領域が少なくなったときに十分な対応時間が持てるような値でアラートを設定することをおすすめします。
重要度 | 閾値 |
---|---|
Warning | ディスクの使用量が総容量の70%を超えた |
Critical | ディスクの使用量が総容量の85%を超えた |
これらの値は、割り当てられたストレージの総量、過去の増大パターン、対応が求められる時間に基づいて調整できます。 ストレージリソースは、増加を許容し、追加ストレージの割り当てに必要なダウンタイムを回避するために、多めに割り当てておくことをおすすめします。
CPUとロードアベレージのモニタリング
リソース集約的なGitの操作によってCPUの利用状況が変動するのは通常のことですが、異常に高いCPU利用状況にはアラートを設定することをおすすめします。これは、長引くスパイクはインスタンスのプロビジョニングが不足しているということかもしれないためです。 15分間のシステムロードアベレージが、仮想マシンに割り当てられたCPUコア数に近いかそれを超える値になっていないかをモニタリングすることをおすすめします。
重要度 | 閾値 |
---|---|
Warning | 15分間のロードアベレージが1x CPUコアを超える |
Critical | 15分間のロードアベレージが2x CPUコアを超える |
また、仮想化の"steal"時間をモニタリングして、同一ホスト上で動作している他の仮想マシンがインスタンスのリソースをすべて使ってしまっていることがないことを確認するようおすすめします。
メモリの利用状況のモニタリング
your GitHub Enterprise Server instanceに割り当てられている物理メモリの量は、全体的なパフォーマンスとアプリケーションの反応性に大きな影響があります。 システムは、Gitの処理を高速化するためにカーネルのディスクキャッシュを頻繁に利用するよう設計されています。 ピークの利用状況で、通常のRSSワーキングセットがRAMの総容量の50%以内に収まるようにすることをおすすめします。
重要度 | 閾値 |
---|---|
Warning | 持続的にRSSの利用状況が利用可能なメモリ総量の50%を超える |
Critical | 持続的にRSSの利用状況が利用可能なメモリ総量の70%を超える |
メモリが使い切られると、カーネルOOMキラーはRAMを大量に使っているアプリケーションプロセスを強制的にkillしてメモリリソースを解放しようとします。これは、サービスの中断につながることがあります。 通常の処理の状況で必要になる以上のメモリを仮想マシンに割り当てることをおすすめします。