HSRP や VRRP はネットワーク冗長化の基本技術ですが、
切替時に数秒〜数十秒の通信断が発生するケースは非常に多く見られます。
本記事では、
なぜHSRP/VRRP切替時に通信断が起きるのか を内部動作から解説し、 通信断を最小化するための設計・設定ポイント を現場目線で整理します。
目次
HSRP/VRRP切替時に何が起きているのか
切替時、ネットワーク内部では以下が同時に発生します。
- Active(Master)ルータの変更
- 仮想IPの引き継ぎ
- 仮想MACアドレスの移動
- ARPキャッシュの更新
- STPトポロジ変化(場合による)
この中で最も遅延要因になるのが、
ARPキャッシュとL2学習の遅延です。
通信断を引き起こす主な原因
① ARPキャッシュが更新されない
端末やサーバは、
仮想IPに対するMACアドレスを一定時間キャッシュしています。
切替後も旧Active機器のMACを使い続けるため、
パケットがブラックホール化します。
② Gratuitous ARP が届かない
HSRP/VRRP では切替時に
Gratuitous ARP(GARP) を送信し、 端末に新しいMACを通知します。
以下の場合、GARPが機能しません。
- L2でフィルタされている
- VLANまたぎ
- 無線LANや一部FW配下
③ STP再計算と重なる
Active機器が変わることで、
トラフィックの流れが変化しSTP再計算が発生します。
結果、切替+STPで通信断が増幅します。
通信断を最小化する設計原則(最重要)
原則①:L3冗長とL2設計を必ずセットで考える
HSRP/VRRP だけ正しくても、
L2が追従しなければ意味がありません。
- Root Bridge を Active側に固定
- 切替後もSTP再計算を起こさない
原則②:プリエンプトを安易に有効化しない
preempt を有効にすると、
障害復旧時に再度切替が発生します。
結果、短時間で2回通信断が起きます。
安定性重視なら preempt 無効が基本です。
即効性が高い設定ポイント
① HSRP / VRRP のタイマー調整
HSRP例
standby 1 timers 1 3
- Hello: 1秒
- Hold: 3秒
※ 過度に短くすると誤検知に注意
② track 機能で実際の障害に連動
回線や上位ルート障害時に
即座に切替が行われるようにします。
track 1 interface GigabitEthernet0/0 line-protocol
standby 1 track 1 decrement 50
これにより「生きているが通信不能」状態を防げます。
③ Gratuitous ARP の送信確認
確認方法
debug standby events
debug vrrp events
切替時にGARP送信ログが出ているかを確認します。
④ STP設計の固定化
- Active機器を Root Primary に設定
- Standby機器を Root Secondary に設定
spanning-tree vlan 10 root primary
spanning-tree vlan 10 root secondary
設計時によくある失敗例
- HSRPは冗長だがSTPが非対称
- preempt有効で切替ループ
- track設定なしで障害検知が遅い
- 無線LAN配下でGARPが効かない
切替後の確認チェックリスト
- Active状態の確認
- ARPテーブルが更新されているか
- MACテーブルが新ポートを指しているか
- STP状態が安定しているか
- ping/業務通信が安定しているか
まとめ
- 通信断の正体はARPとL2遅延
- HSRP/VRRP単体設計は不十分
- L2・STP・ARPを含めて初めて冗長化が成立
「切替は起きるもの」ではなく 「切替してもユーザが気づかない設計」 を目指すことが、実務ネットワーク設計のゴールです。
あわせて読みたい


HSRP / VRRP / GLBP の違いと実装ベストプラクティス【冗長化設計】
ネットワークのデフォルトゲートウェイ冗長化を実現する代表的なプロトコルである HSRP、VRRP、GLBP の違いと、実務で使う際の設計・運用上の注意点をわかりやすく解説…
あわせて読みたい


ARP の仕組みとトラブル時の診断方法
ネットワーク通信の基礎である ARP(Address Resolution Protocol) は、 IPアドレスからMACアドレスを解決するための重要な仕組みです。 通信が届かない・疎通が取れな…
あわせて読みたい


STP再計算による通信断を防ぐ方法【設定・設計の見直しポイント】
STP(Spanning Tree Protocol)はループ防止の重要な仕組みですが、トポロジ変動が起こると STP再計算 が発生し、一時的な通信断が発生することがあります。本記事では…
あわせて読みたい


Gratuitous ARPが届かない環境でのHSRP対策【通信断を防ぐ実践設計】
HSRP切替後にActiveは切り替わっているのに通信が復旧しない―― この原因の多くは Gratuitous ARP(GARP)が届いていない ことです。 本記事では、GARPが届かない環境の…
