書籍名: 『オライリー 入門 監視』(著者:Mike Julian) 日時:2019年3月7日~3月31日 Before 監視はインフラエンジニアが片手間でするようなものだろうか? NWエンジニア、DBエンジニアはいるのに監視エンジニアはなぜいない? そもそも監視を学べる機会・本が少ない。など、色々な悩みを抱えていた時に、 『オライリー 入門 監視』 を手にした。 今まで自分がやってきた監視が正しいのか、間違いだったのか、この本で見極めようと思う。 気づき 1章 監視のアンチパターン アンチパターンとは、一見よいアイデアだが実装すると手痛いしっぺ返しをくらうものをいう。 ツール依存になっていないか。 監視とは複雑な問題をひとくくりにしたもの、専門化されたツールが複数あって良い。 監視Agentは詳細な情報をもたらしてくれる。 小さく何かに特化したツールなら作る選択肢も。pythonコードのスクリプトなど。 役割をもつ全員が監視に責任を持つべき 。 アプリエンジニアはソースコードのどこに監視のポイントがあるか、ネットワークエンジニアならネットワーク監視の勘所が一番詳しいはず。 「動いている」かを監視する。リクエストが200 OKか?文字列は正しいか?レイテンシは増大していないか? アラートに関してはOSのメトリクスはあまり意味がない。CPU使用率が99%でも、正しく動いていれば良い。ただし分析・診断には必要。 メトリクスは高頻度(最低でも60秒)で取らないと意味がない。保存期間に応じてデータの間引き設定を忘れないように。 監視設定にも手動ではなく、自動化を。 従来型環境は個別に何かを監視していたが、クラウドは集合体(複数システムのまとまり)として監視するよう変わってきた。 まとめ ツールに依存しても、監視の仕組みは良くならない。 監視は全員がやるべき仕事。チームや部署内での役割ではない。 素晴らしい監視は、チェックボックスに「これは監視しています」とチェックを入れるだけで済むものではない。 2章 監視のデザインパターン 組み合わせ可能な監視⇒専門化されたツールを複数使い、監視プラットフォームを作ること。 代表的なものGraphite, Sensu, logstas...