監視 の変更点


#author("2022-05-06T18:35:37+09:00","default:k1rou","k1rou")
#author("2022-05-06T18:39:07+09:00","default:k1rou","k1rou")
*監視 とは [#f6965fa1]
-システム監視
-[[可用性]]向上
-[[障害]]対応

-データ解析

-「正常な状態」を定義する
-「正常な状態」でなくなったときの対応を定義する
-「正常な状態」であることを継続的に確認する
-「正常な状態」でなくなった場合は復旧させる

-監視の定義や手順は、最初から多くを望みすぎず、運用しながら育てる

*監視の種類 [#eca61176]
-パフォーマンス監視

-キャパシティ監視

-ネットワーク監視
--[[SNMP]]
--[[RMON]]

*監視項目と閾値の定義 [#lf9e0c7b]
-アラート発報を極力減らす
-念のためのアラートは不要

*優先順位 [#f00d538b]
-復旧か再発防止か
-セキュリティインシデント発生時にどうるするか

-運用フロー
-エスカレーション方法
-ユーザへのアナウンス方法

-解析と復旧の関係

*ツールを使った監視 [#mda46527]
-監視間隔は1分くらい?
-秒単位での監視の場合は復旧の自動化がセットになるもの

**運用監視ツール [#jea0707a]
-「[[運用監視ツール]]」参照

**モニタリングツール [#f2dfb9c7]
-「[[モニタリング]]」参照

**パケットキャプチャツール [#if6e2857]
-「[[パケットキャプチャ]]」参照

*対応 [#zad452c4]
-一次対応(暫定対応)
-二次対応(根本対応)

*システム監視 [#yb699f28]
-外形監視
-内部監視
--サービス稼働状況監視
--システムリソース監視

**外形監視 [#t5e77403]
-HTTPレスポンス
-POP,SMTP,FTP

**内部監視 [#r004801b]
-CPU
-ディスク
-HTTPリクエスト
-プロセス監視

*監視の実装 [#pae69d6d]
**アクティブチェック [#bbc101b0]
-監視サーバ自らがチェックする
-チェックするまでの間は異常が検知できない

**パッシブチェック [#hcf745ce]
-監視対象側で異常をチェックして監視サーバに報告する
-[[SNMP]] Trap
-監視対象側が異常を検知できずにダウンすると検知できない

*障害対応 [#waa10b8f]
-「[[システム障害]]」参照

*監視ツール [#m5cb59ed]
-[[Ganglia]]
-[[Moloch]]
-[[Sentry]]~
https://sentry.io/
-[[Hinemos]]
-[[Nagios]]
-[[Prometheus]]
-[[Cockpit]]~
https://cockpit-project.org/

*ログ収集ツール [#ve3fa7c8]
-[[Fluentd]]
-[[syslog]]

*関連サイト [#vb269838]
-Downdetector~
https://downdetector.jp/

*関連用語 [#w5ff59f1]
-[[モニタリング]]
-[[SIEM]]
-[[SNMP]]
-[[SOC]]
-[[ログ]]