-
コマンド編
logrotate設定ミスによる障害事例まとめ【実務で実際に起きた事故集】
logrotateはLinux運用では「当たり前」の存在ですが、 設定を誤ると確実に障害を引き起こすツール でもあります。 本記事では、現場で実際に発生しがちな よくある設定ミス 発生する症状 なぜ起きたのか どう防ぐべきか を障害事例形式でまとめます。 ... -
コマンド編
logrotateでtruncateを使うべきケース・使うべきでないケース【実務判断ガイド】
Linux運用でログ肥大化対策として必ず登場するのが logrotate の copytruncate(truncate) ですが、 「とりあえず使う」は非常に危険 です。 本記事では、 truncateとは何をしているのか 使うべきケース 絶対に避けるべきケース 正しい代替策 を、実務障... -
コマンド編
削除したファイルの容量が解放されない理由|dfとduがズレる本当の原因
Linux運用で非常によくあるトラブルが、 「rmでファイルを削除したのに、ディスク容量が空かない」 という現象です。 この問題は、仕組みを理解していないと 無意味なrm -rfの連発 不要な再起動 原因不明のディスク逼迫 を引き起こします。 本記事では、な... -
コマンド編
lsofの実務的な使い方まとめ|Linux障害調査で必須の活用パターン
lsof(List Open Files)は、Linux障害対応において 原因特定のスピード 再現性のある調査 「なぜ起きているか」の説明力 を一気に引き上げてくれる必須コマンドです。 本記事では、マニュアルには載らない実務で本当に使うlsofの使い方を、 障害シナリオ... -
コマンド編
dfとduの結果が一致しない理由|Linuxディスク使用量のズレを完全解説
Linux運用で必ずと言っていいほど遭遇するのが、df と du の結果が合わない問題です。 df -h du -sh / 「dfでは空きがないのに、duではそんなに使っていない」 この状態、実は障害の前兆であることも少なくありません。 本記事では、 df と du の本質的な... -
コマンド編
/var/logが肥大化する原因と正しいlogrotate設計
Linuxサーバー運用で頻発するトラブルの一つが、/var/log の肥大化です。 気付いた時にはディスク逼迫、サービス停止、最悪の場合 inode 枯渇に発展します。 本記事では、なぜ /var/log が肥大化するのか、そして logrotate を正しく設計・運用する方法を... -
コマンド編
inode枯渇による障害の見抜き方と解消手順
Linuxサーバーで「ディスク容量は空いているのにファイルが作れない」 という障害が発生した場合、真っ先に疑うべきなのがinode枯渇です。 本記事では、inode枯渇障害を即座に見抜く方法から、 その場で復旧する手順・再発防止策まで、現場対応レベルで解... -
コマンド編
OOM Killer詳細|Linuxメモリ枯渇時の挙動・調査・対処を完全解説
Linuxサーバーで突然プロセスが落ちる/サーバーが不安定になる原因として非常に多いのが OOM Killer(Out Of Memory Killer)です。 本記事では、OOM Killerの仕組み・発動条件・ログの見方・調査方法・再発防止策を、 現場対応レベルで徹底解説します。 ... -
コマンド編
Linuxサーバーが突然再起動する時に確認すべきログ
運用中のLinuxサーバーが予告なく突然再起動するトラブルは、現場で非常に厄介です。 再起動後はサーバー自体が正常に見えるため、原因調査が後回しになりがちですが、放置すると再発します。 本記事では、Linuxサーバーが突然再起動した際に、どのログを... -
コマンド編
LinuxでCPU使用率が高止まりする原因と調査手順
CPU使用率が高止まりしている状態とは CPU使用率の高止まりとは、一時的なスパイクではなく、以下のような状態が継続している状況を指します。 CPU使用率が常時80〜100%付近で推移している 処理が終わってもCPU使用率が下がらない サービス応答が遅くなっ...
