Linux障害対応で最も重要なのは、「症状を正しく切り分け、確認順を固定すること」です。
本記事は、実務でよくある障害パターンを症状別のチェックリストとして整理し、詳細記事(個別手順)へ最短で辿れるようにしたトラブルシューティングのまとめ記事です。
目次
このハブ記事でできること
- 障害対応の「最初に見るべき順番」が分かる
- 症状(通信できない/起動しない/遅い/突然再起動など)から原因へ辿れる
- 個別の詳細手順(あなたの既存記事)へ迷わず飛べる
目次
- まず最初にやること(初動チェック)
- ログ調査の基本(最重要)
- サービスが起動しない/落ちる(systemd系)
- 通信できない/不安定(DNS/疎通/遅延)
- FW / SELinux / 権限で止まる
- cron・logrotateが動かない(自動化系)
- CPU/メモリ/ディスク/FD枯渇(リソース系)
- 時刻ずれ(NTP/chrony)
- NICが認識されない/仮想NIC変更で通信不能
- Web系(pingは通るがアクセス不可/503など)
- すぐ使える:症状→リンク早見表
まず最初にやること(初動チェック)
障害対応は「闇雲に設定を見る」のではなく、確認順を固定すると速くなります。
初動チェック(5分でやる)
- 影響範囲:単一サーバか/複数サーバか/特定ユーザーのみか
- いつから:直前に変更した設定・デプロイ・再起動の有無
- 再現性:常に起きるか/断続的か
- 一次切り分け:サービス/ネットワーク/リソース/セキュリティのどれっぽいか
「ログを見る」準備が整ったら、次へ進みます。
ログ調査の基本(最重要)
トラブル対応の勝率を上げるなら、まずはここを固めるのが最短です。
あわせて読みたい


Linuxのログ管理とトラブルシューティングの基本
Linuxのログ管理は、システムの安定稼働とトラブルシューティングの鍵となります。ここでは、Linuxのログ確認やリアルタイム監視を行うための主要なコマンド「dmesg」「…
あわせて読みたい


systemctlとjournalctlの使い方:Linuxでのサービス管理と起動の基本
systemdとは? Linuxのシステム起動とサービス管理を担うsystemdは、従来のinitシステムに代わり、多くのLinuxディストリビューションで採用されています。systemdの目…
あわせて読みたい


journalctlの実務的な使い方まとめ
systemd環境のLinuxでは、ログ確認といえば journalctl が基本です。 しかし実際の現場では、 ログが多すぎて追えない 何を見れば原因が分かるのか分からない 結局grep…
あわせて読みたい


journalctl でログが見れない/permission denied になる場合の原因と解決方法
📌 Linuxトラブル対応を体系的に知りたい方へ本記事はLinux障害の一部症状を解説しています。初動チェックや症状別の切り分け手順をまとめた総合ガイドはこちら…
ポイント:「どのログを」「どの時間帯で」「何を根拠に異常と判断するか」を固定すると、調査がブレません。
サービスが起動しない/落ちる(systemd系)
最初に見るのは systemctl status と journalctl です。
よくある症状
- サービスが起動しない(failed)
- 起動するがすぐ落ちる
- 突然再起動を繰り返す
詳細手順(個別記事)
あわせて読みたい


systemdサービスが突然再起動する原因とログの追い方
Linux運用中、systemd管理のサービスが 勝手に再起動している 停止していないのにPIDが変わっている ユーザー操作の記録がない といった事象に遭遇することがあります。…
あわせて読みたい


Linuxサーバーが突然再起動する時に確認すべきログ
運用中のLinuxサーバーが予告なく突然再起動するトラブルは、現場で非常に厄介です。 再起動後はサーバー自体が正常に見えるため、原因調査が後回しになりがちですが、…
あわせて読みたい


Nginx/Apache が起動できないときの確認手順
Web サーバーとして広く使われる Nginx や Apache (httpd) は、設定変更や環境の影響で起動に失敗することがあります。「起動コマンドを実行してもエラーが出る」「サー…
あわせて読みたい


PHP-FPM が起動しない/503 エラーが出る原因と解決方法
Web サーバー(Nginx や Apache)を使う際にバックエンドで動作する PHP-FPM (FastCGI Process Manager) が起動しない、あるいは 503 Service Unavailable を返すトラブ…
通信できない/不安定(DNS/疎通/遅延)
① まず疎通(ping)で切り分け
あわせて読みたい


pingが通らない原因と対処法【初心者〜実務者向け完全ガイド】
ネットワークトラブルの切り分けにおいて、最も基本のコマンドが ping です。ping が通らない場合、原因は物理層からアプリ層まで多岐にわたります。本記事では、初心者…
② pingは通るのにアクセスできない
あわせて読みたい


ping は通るのにブラウザでアクセスできない原因と対処方法
Linuxサーバにアクセスできないとき、まず多くの人が試すのが ping コマンドです。 ping example.com これで応答が返ってくれば「ネットワークは生きている」と安心しま…
③ 名前解決(DNS)がおかしい/不安定
あわせて読みたい


DNS名前解決ができない時のチェックリスト【原因・対処・確認手順】
DNS(Domain Name System)は、インターネット通信の根幹を担う仕組みであり、名前解決ができないと Web サイト閲覧や各種サービスの利用ができなくなります。本記事で…
あわせて読みたい


DNS解決ができないときの調査手順(dig/nslookup)
はじめに サーバやPCからインターネットに接続しようとしたとき、ping google.com が失敗する、ブラウザでサイトが開けない、といったトラブルに遭遇することがあります…
あわせて読みたい


Linuxで名前解決が不安定になる原因(resolv.conf以外)
「pingは通るのに名前解決だけ失敗する」「たまに名前解決できるが、再現性が低い」「resolv.confは正しいのにDNSエラーが出る」 このようなトラブルは、resolv.conf以…
あわせて読みたい


systemd-resolved と glibc の関係
Linux環境で名前解決トラブルが発生した際、 dig は引けるがアプリは名前解決できない /etc/resolv.conf を直したのに直らない systemd-resolved を止めたら直った とい…
あわせて読みたい


Docker環境で名前解決がズレる理由
Docker環境で以下のような「名前解決のズレ」に悩まされたことはないでしょうか。 ホストでは引けるが、コンテナ内では引けない dig は成功するが、アプリは失敗する VP…
④ ネットワークは生きているのに通信が遅い
あわせて読みたい


Linuxでネットワークは正常なのに通信が遅い時の考え方
Linuxサーバーで通信遅延が発生した際、 pingは通る パケットロスも見えない NICエラーも出ていない それでも、 「なぜか通信だけが遅い」 という状況に遭遇したことは…
FW / SELinux / 権限で止まる
「設定は正しいはずなのに通らない」は、FW/SELinux/権限の三点セットが多いです。
firewalld / firewall-cmd
あわせて読みたい


firewalld でポートが開かないときの対処方法
Linux サーバでサービスを公開しようとして firewalld を設定したのに、外部からアクセスできない…。そんなときに確認すべきポイントをまとめます。 🔎 実務での…
あわせて読みたい


firewall-cmd で permanent 設定を忘れて再起動時に設定が消える問題
🔎 実務での切り分け手順を知りたい方へログ確認・リソース確認・ネットワーク確認など、よくあるLinux障害対応の基本フローを整理したまとめ記事はこちら。…
SELinux
あわせて読みたい


非標準ポートを使う時のSELinux設定まとめ【semanage完全解説】
Linuxでアプリケーションを非標準ポート(例:8081 / 8443 / 9000など)で公開した際、 Firewallは開いているのに接続できないというトラブルは非常に多く、 原因の大半…
あわせて読みたい


【完全版】SSHエラー大全|接続できない原因と解決方法まとめ
SSH(Secure Shell)はLinuxサーバー管理に欠かせないリモート接続の手段ですが、実際の運用では「接続できない」「認証に失敗する」「タイムアウトする」など、さまざ…
あわせて読みたい


ssh: connect to host XXX port 22: Connection refused の解決方法
LinuxサーバーにSSH接続しようとした際に ssh: connect to host xxx port 22: Connection refused というエラーが表示されることがあります。これは「ネットワーク的に…
あわせて読みたい


SSH接続で Permission denied が出るときの確認ポイント~鍵認証・権限設定・sshd_configの見直し~
LinuxサーバへSSH接続しようとしたとき、 Permission denied (publickey,password). と表示されてログインできないことがあります。これはSSHで最もよくあるトラブルの…
cron・logrotateが動かない(自動化系)
「手動なら動くのに自動だと動かない」は、環境変数(PATH)・権限・ログが鍵です。
cron
あわせて読みたい


cron が動かない/実行されないときのチェックリスト
Linux の自動化でよく使われる cron。「手動でコマンドを打つと動くのに、cron に設定すると動かない…」という経験をした方は多いと思います。 本記事では、cron ジョブ…
あわせて読みたい


cron ジョブが実行されない/ログも出ないときの調査手順
Linux サーバーで定期的な処理を自動化するために利用される cron。しかし「設定したジョブが動かない」「ログに何も出ていない」という状況に直面することがあります。…
logrotate
あわせて読みたい


ログローテーション設定(logrotate)が動かない/古いログが消えないときの修正
概要 Linux サーバーではログファイルの肥大化を防ぐために、logrotate による定期的なローテーションが行われます。しかし設定ミスや権限、cron の不具合などにより、…
CPU/メモリ/ディスク/FD枯渇(リソース系)
性能監視(まず土台)
あわせて読みたい


Linuxのシステムリソースとパフォーマンス監視の徹底解説
システムリソースとパフォーマンスの監視 Linuxでシステムのリソースやパフォーマンスを監視することは、サーバーやコンピュータの安定した運用に不可欠です。この記事…
メモリ枯渇(OOM Killer)
あわせて読みたい


OOM Killer詳細|Linuxメモリ枯渇時の挙動・調査・対処を完全解説
Linuxサーバーで突然プロセスが落ちる/サーバーが不安定になる原因として非常に多いのが OOM Killer(Out Of Memory Killer)です。 本記事では、OOM Killerの仕組み・…
ファイルディスクリプタ枯渇
あわせて読みたい


ファイルディスクリプタ枯渇時の症状と対処
Linuxサーバーで突然アプリケーションが不安定になったり、 「ファイルが開けない」「接続できない」といったエラーが多発する場合、 ファイルディスクリプタ(FD)枯渇…
ディスク容量はあるのに書けない(inode等)
あわせて読みたい


df で空き容量があるのに書き込みエラーになる原因(inode不足など)
Linux でファイルを書き込もうとした際に、 No space left on device というエラーが出ることがあります。 しかし df -h を実行すると、空き容量がまだ十分にあるように…
アーカイブ展開で失敗(tar EOFなど)
あわせて読みたい


tar: Unexpected EOF in archive の解決方法
tar コマンドでアーカイブを展開するときに tar: Unexpected EOF in archive tar: Error is not recoverable: exiting now といったエラーが出ることがあります。これは…
時刻ずれ(NTP/chrony)
時刻がズレると、認証・ログ相関・証明書・バッチ処理など、広範囲に影響します。
あわせて読みたい


Linuxで時刻ずれが起きる原因とNTP同期確認方法【chrony/ntpd対応】
Linuxサーバーの時刻ずれは、一見地味ですが、 ログの時系列が崩れる 証明書認証が失敗する クラスタ・DB・認証系が不安定になる など、深刻な障害の引き金になります。…
NICが認識されない/仮想NIC変更で通信不能
物理・ドライバ起因(NIC未認識)
あわせて読みたい


NICが認識されない時のドライバ確認手順
Linuxサーバーでネットワーク設定を行おうとした際に、 NICが表示されない インターフェース名が存在しない NetworkManagerやsystemd-networkdで制御できない といった…
仮想環境(NIC後付け/変更)
あわせて読みたい


仮想NICを後付けした時に通信できない理由
仮想サーバや仮想マシン(VM)に仮想NIC(ネットワークインターフェース)を後付けしたところ、 OS上ではNICが見えているのに通信できないというトラブルは非常に多く発…
あわせて読みたい


仮想NIC変更時にネットワークが消える理由
KVM / VMware / Proxmox / OpenStack などの仮想環境で、 仮想NICの種類を変更したら通信できなくなった 再起動後にIPが付かない eth0 が消えた/別名になった NICは見…
Web系(プロキシ/バックエンド/構成)
「Nginxは動いているのにバックエンドに繋がらない」など、構成依存の障害はチェックポイントを固定すると速いです。
あわせて読みたい


Nginx Proxy 経由でバックエンドに繋がらないときの確認ポイント
はじめに Nginx をリバースプロキシとして利用していると、バックエンドサーバーに接続できない というエラーに直面することがあります。たとえば、以下のような症状で…
すぐ使える:症状→リンク早見表
| 症状 | まず読む |
|---|---|
| サービスが起動しない/すぐ落ちる | systemctl/journalctl / 突然再起動 |
| サーバが突然再起動した | 突然再起動のログ確認 |
| pingが通らない | pingが通らない切り分け |
| DNS名前解決できない | DNSチェックリスト / dig/nslookup手順 |
| ポートを開けたのに通信できない | firewalld / SELinux(非標準ポート) |
| cronが動かない | チェックリスト / ログに出ないとき |
| メモリ不足っぽい(プロセスが落ちる) | OOM Killer |
| ディスク容量はあるのに書けない | inode/クォータ/tmpfs |
| ログローテーションされない | logrotateが動かない |
| 時刻がずれる/認証が変 | NTP/chrony |
| NICが認識されない/仮想NIC変更で通信不能 | NIC未認識 / 仮想NIC変更 |
