監視 とは†
- 「正常な状態」を定義する
- 「正常な状態」でなくなったときの対応を定義する
- 「正常な状態」であることを継続的に確認する
- 「正常な状態」でなくなった場合は復旧させる
- 監視の定義や手順は、最初から多くを望みすぎず、運用しながら育てる
監視の種類†
監視項目と閾値の定義†
- アラート発報を極力減らす
- 念のためのアラートは不要
優先順位†
- 復旧か再発防止か
- セキュリティインシデント発生時にどうるするか
- 運用フロー
- エスカレーション方法
- ユーザへのアナウンス方法
ツールを使った監視†
- 監視間隔は1分くらい?
- 秒単位での監視の場合は復旧の自動化がセットになるもの
運用監視ツール†
モニタリングツール†
パケットキャプチャツール†
システム監視†
外形監視†
内部監視†
- CPU
- ディスク
- HTTPリクエスト
- プロセス監視
監視の実装†
アクティブチェック†
- 監視サーバ自らがチェックする
- チェックするまでの間は異常が検知できない
パッシブチェック†
- 監視対象側で異常をチェックして監視サーバに報告する
- SNMP Trap
- 監視対象側が異常を検知できずにダウンすると検知できない
障害対応†
監視ツール†
ログ収集ツール†
関連サイト†
関連用語†