#author("2021-09-04T21:11:25+09:00","default:k1rou","k1rou")
*監視 [#b443565a]
-システム監視
**監視 とは [#f6965fa1]
-[[可用性]]向上
-[[障害]]対応
-データ解析
-「正常な状態」を定義する
-「正常な状態」でなくなったときの対応を定義する
-「正常な状態」であることを継続的に確認する
-「正常な状態」でなくなった場合は復旧させる
-監視の定義や手順は、最初から多くを望みすぎず、運用しながら育てる
**監視の種類 [#eca61176]
-パフォーマンス監視
-キャパシティ監視
-ネットワーク監視
--[[SNMP]]
--[[RMON]]
**監視項目と閾値の定義 [#lf9e0c7b]
-アラート発報を極力減らす
-念のためのアラートは不要
**優先順位 [#f00d538b]
-復旧か再発防止か
-セキュリティインシデント発生時にどうるするか
-運用フロー
-エスカレーション方法
-ユーザへのアナウンス方法
-解析と復旧の関係
**ツールを使った監視 [#mda46527]
-監視間隔は1分くらい?
-秒単位での監視の場合は復旧の自動化がセットになるもの
***運用監視ツール [#jea0707a]
-「[[運用監視ツール]]」参照
***モニタリングツール [#f2dfb9c7]
-「[[モニタリング]]」参照
***パケットキャプチャツール [#if6e2857]
-「[[パケットキャプチャ]]」参照
**対応 [#zad452c4]
-一次対応(暫定対応)
-二次対応(根本対応)
**システム監視 [#yb699f28]
-外形監視
-内部監視
--サービス稼働状況監視
--システムリソース監視
***外形監視 [#t5e77403]
-HTTPレスポンス
-POP,SMTP,FTP
***内部監視 [#r004801b]
-CPU
-ディスク
-HTTPリクエスト
-プロセス監視
**監視の実装 [#pae69d6d]
***アクティブチェック [#bbc101b0]
-監視サーバ自らがチェックする
-チェックするまでの間は異常が検知できない
***パッシブチェック [#hcf745ce]
-監視対象側で異常をチェックして監視サーバに報告する
-[[SNMP]] Trap
-監視対象側が異常を検知できずにダウンすると検知できない
**障害対応 [#waa10b8f]
-「[[システム障害]]」参照
**監視ツール [#m5cb59ed]
-[[Ganglia]]
-[[Moloch]]
**ログ収集ツール [#ve3fa7c8]
-[[Fluentd]]
-[[syslog]]
**関連サイト [#vb269838]
-Downdetector~
https://downdetector.jp/
**関連用語 [#w5ff59f1]
-[[モニタリング]]
-[[SIEM]]
-[[SNMP]]
-[[SOC]]
-[[ログ]]