監視 のバックアップ差分(No.1)


  • 追加された行はこの色です。
  • 削除された行はこの色です。
#author("2021-09-04T21:11:25+09:00","default:k1rou","k1rou")
*監視 [#b443565a]
-システム監視

**監視 とは [#f6965fa1]
-[[可用性]]向上
-[[障害]]対応

-データ解析

-「正常な状態」を定義する
-「正常な状態」でなくなったときの対応を定義する
-「正常な状態」であることを継続的に確認する
-「正常な状態」でなくなった場合は復旧させる

-監視の定義や手順は、最初から多くを望みすぎず、運用しながら育てる

**監視の種類 [#eca61176]
-パフォーマンス監視

-キャパシティ監視

-ネットワーク監視
--[[SNMP]]
--[[RMON]]

**監視項目と閾値の定義 [#lf9e0c7b]
-アラート発報を極力減らす
-念のためのアラートは不要

**優先順位 [#f00d538b]
-復旧か再発防止か
-セキュリティインシデント発生時にどうるするか

-運用フロー
-エスカレーション方法
-ユーザへのアナウンス方法

-解析と復旧の関係

**ツールを使った監視 [#mda46527]
-監視間隔は1分くらい?
-秒単位での監視の場合は復旧の自動化がセットになるもの

***運用監視ツール [#jea0707a]
-「[[運用監視ツール]]」参照

***モニタリングツール [#f2dfb9c7]
-「[[モニタリング]]」参照

***パケットキャプチャツール [#if6e2857]
-「[[パケットキャプチャ]]」参照

**対応 [#zad452c4]
-一次対応(暫定対応)
-二次対応(根本対応)

**システム監視 [#yb699f28]
-外形監視
-内部監視
--サービス稼働状況監視
--システムリソース監視

***外形監視 [#t5e77403]
-HTTPレスポンス
-POP,SMTP,FTP

***内部監視 [#r004801b]
-CPU
-ディスク
-HTTPリクエスト
-プロセス監視

**監視の実装 [#pae69d6d]
***アクティブチェック [#bbc101b0]
-監視サーバ自らがチェックする
-チェックするまでの間は異常が検知できない

***パッシブチェック [#hcf745ce]
-監視対象側で異常をチェックして監視サーバに報告する
-[[SNMP]] Trap
-監視対象側が異常を検知できずにダウンすると検知できない

**障害対応 [#waa10b8f]
-「[[システム障害]]」参照

**監視ツール [#m5cb59ed]
-[[Ganglia]]
-[[Moloch]]

**ログ収集ツール [#ve3fa7c8]
-[[Fluentd]]
-[[syslog]]

**関連サイト [#vb269838]
-Downdetector~
https://downdetector.jp/

**関連用語 [#w5ff59f1]
-[[モニタリング]]
-[[SIEM]]
-[[SNMP]]
-[[SOC]]
-[[ログ]]