HSRP/VRRP切替時に通信断を最小化する設計ポイント【ARP・タイマー・STP完全対策】

  • URLをコピーしました!

HSRP や VRRP はネットワーク冗長化の基本技術ですが、
切替時に数秒〜数十秒の通信断が発生するケースは非常に多く見られます。

本記事では、
なぜHSRP/VRRP切替時に通信断が起きるのか を内部動作から解説し、 通信断を最小化するための設計・設定ポイント を現場目線で整理します。

目次

HSRP/VRRP切替時に何が起きているのか

切替時、ネットワーク内部では以下が同時に発生します。

  • Active(Master)ルータの変更
  • 仮想IPの引き継ぎ
  • 仮想MACアドレスの移動
  • ARPキャッシュの更新
  • STPトポロジ変化(場合による)

この中で最も遅延要因になるのが、
ARPキャッシュとL2学習の遅延です。

通信断を引き起こす主な原因

① ARPキャッシュが更新されない

端末やサーバは、
仮想IPに対するMACアドレスを一定時間キャッシュしています。

切替後も旧Active機器のMACを使い続けるため、
パケットがブラックホール化します。

② Gratuitous ARP が届かない

HSRP/VRRP では切替時に
Gratuitous ARP(GARP) を送信し、 端末に新しいMACを通知します。

以下の場合、GARPが機能しません。

  • L2でフィルタされている
  • VLANまたぎ
  • 無線LANや一部FW配下

③ STP再計算と重なる

Active機器が変わることで、
トラフィックの流れが変化しSTP再計算が発生します。

結果、切替+STPで通信断が増幅します。

通信断を最小化する設計原則(最重要)

原則①:L3冗長とL2設計を必ずセットで考える

HSRP/VRRP だけ正しくても、
L2が追従しなければ意味がありません

  • Root Bridge を Active側に固定
  • 切替後もSTP再計算を起こさない

原則②:プリエンプトを安易に有効化しない

preempt を有効にすると、
障害復旧時に再度切替が発生します。

結果、短時間で2回通信断が起きます。

安定性重視なら preempt 無効が基本です。

即効性が高い設定ポイント

① HSRP / VRRP のタイマー調整

HSRP例

standby 1 timers 1 3
  • Hello: 1秒
  • Hold: 3秒

※ 過度に短くすると誤検知に注意

② track 機能で実際の障害に連動

回線や上位ルート障害時に
即座に切替が行われるようにします。

track 1 interface GigabitEthernet0/0 line-protocol
standby 1 track 1 decrement 50

これにより「生きているが通信不能」状態を防げます。

③ Gratuitous ARP の送信確認

確認方法

debug standby events
debug vrrp events

切替時にGARP送信ログが出ているかを確認します。

④ STP設計の固定化

  • Active機器を Root Primary に設定
  • Standby機器を Root Secondary に設定
spanning-tree vlan 10 root primary
spanning-tree vlan 10 root secondary

設計時によくある失敗例

  • HSRPは冗長だがSTPが非対称
  • preempt有効で切替ループ
  • track設定なしで障害検知が遅い
  • 無線LAN配下でGARPが効かない

切替後の確認チェックリスト

  1. Active状態の確認
  2. ARPテーブルが更新されているか
  3. MACテーブルが新ポートを指しているか
  4. STP状態が安定しているか
  5. ping/業務通信が安定しているか

まとめ

  • 通信断の正体はARPとL2遅延
  • HSRP/VRRP単体設計は不十分
  • L2・STP・ARPを含めて初めて冗長化が成立

「切替は起きるもの」ではなく 「切替してもユーザが気づかない設計」 を目指すことが、実務ネットワーク設計のゴールです。

目次