サーバ/インフラを支える技術 第5章 省力運用 その1

  • サービスの稼動監視(Nagios)
    • 機能(ホストやサービス)が動いているかどうかの死活監視
    • 負荷状態の監視
    • 一定期間のサービス提供できていた稼働率の計測
    • 死活監視する上では個別のサーバだけでなく VIP に対する監視もすることでユーザに対するサービスの影響の有無も確認する
    • 負荷状態の監視は原因を推測してそれに応じた対策を取ることが必要
    • Nagios の設定