Introduction
OSPF (Open Shortest Path First), protocole de routage link-state IGP défini dans RFC 2328 (IPv4) et RFC 5340 (IPv6), reste en 2026 le pilier des réseaux enterprise scalables. Contrairement à RIP ou EIGRP (distance-vector), OSPF calcule les chemins optimaux via l'algorithme Dijkstra sur une carte topologique complète, minimisant les boucles et convergeant en secondes.
Pourquoi le maîtriser aujourd'hui ? Les data centers SDN et les fabrics EVPN intègrent OSPF pour underlay robuste, tandis que les WAN hybrides (MPLS + SD-WAN) exigent une tuning fine des areas pour scaler à 10k+ routeurs. Ce tutoriel expert dissèque les internals : flooding LSA, états d'adjacence, hiérarchie multi-area, et optimisations comme OSPFv3 ou segment routing.
Apprenez à anticiper les blackholes lors de flaps, à hiérarchiser pour réduire la CPU (jusqu'à 80% gain), et à sécuriser contre les attaques de séquence. Idéal pour CCNP/CCIE aspirants ou architectes ops, ce guide théorique pur (sans CLI) vous arme pour auditer et redesigner n'importe quel domaine OSPF. (248 mots)
Prérequis
- Connaissances solides en routage IP (CIDR, BGP basics)
- Compréhension des protocoles link-state vs distance-vector
- Familiarité avec les topologies mesh/star et convergence
- Notions de Dijkstra/SPF et graphes orientés
- Expérience pratique OSPF (au moins 2 ans en prod)
Fondamentaux : États d'adjacence et Hello/Dead timers
OSPF bâtit sa base sur des adjacences stables via paquets Hello (multicast 224.0.0.5). Les états progressent : Down → Init → 2-Way → ExStart → Exchange → Loading → Full. Seul Full exchange les LSA.
Exemple concret : Sur un lien Ethernet broadcast, HelloInterval=10s, DeadInterval=40s (défaut). Si un routeur mute 41s, ses voisins le droppent, triggerant SPF recalcul (convergence ~200ms en lab). Analogie : comme un heartbeat médical, Dead=4xHello évite les faux positifs sur WAN flaky.
Piège expert : Sur NBMA (Frame-Relay), forcez point-to-point pour skipper DR election, car broadcast natif absent. En 2026, avec 5G slicing, tunez RxmtInterval=5s pour sous-ms convergence. (Étude : Cisco Live 2025 montre 30% flaps en moins avec Dead=3xHello sur fiber.)
Hiérarchie des Areas : De Single-Area à Backbone
Area 0 (Backbone) est obligatoire : tout trafic inter-area y transite. Stub areas bloquent external LSA (Type5), reducing LSDB size de 70%.
Types avancés :
- Totally Stubby : Bloque Inter-Area (Type3) + External → LSDB /90%, idéal leaf sites.
- NSSA : Permet redistribution locale (e.g., RIP→OSPF) via Type7 LSA, traduits en Type5 à ABR.
Exemple : Topo 10 areas, 500 routeurs/area. Sans hiérarchie, LSDB=50k LSA → CPU 100%. Avec 1 backbone + 9 stubs, LSDB=5k → SPF en 50ms.
Analogie : Areas comme métros : lignes (inter-area) via gare centrale (Area0). Virtual-link si disjointe (rare, insecure).
Checklist scaling :
| Area Type | LSA Bloqués | Use Case |
|---|---|---|
| ----------- | ------------- | ---------- |
| Standard | None | Core |
| Stub | Type5/7 | Branches |
| NSSA | Type5 (inject Type7) | Redistribution |
LSA Mastery : Types, Flooding et Ageing
LSA (Link-State Advertisements) sont le cœur : chaque routeur flood sa vue locale. 7 types clés :
- Type1 Router : Liens directs (Seq# pour freshness).
- Type2 Network : DR résumé net.
- Type3 Summary : ABR condense inter-area.
- Type4 ASBR Summary : Localise ASBR.
- Type5 External : Redistribution (E1 cost cumulé, E2 fixed).
- Type7 NSSA External : NSSA-only.
- Type9/10/11 Opaque : MPLS-TE, GraceLSAs.
Flooding : LSAck multicast, MaxAge=3600s, Checksum anti-corruption. Pacing : 33ms delay par LSA pour éviter storms.
Exemple : Flap Type1 → 100 routeurs floodent en O(n), SPF global. Solution : OSPF throttle (start=0ms, hold=5000ms).
Analogie : LSA comme tweets : RT (flood) avec like-count (Seq#). Purge si MaxAge sans refresh.
Élection DR/BDR et Adjacences Optimisées
DR (Designated Router) élu via Priority (défaut 1, max 255), tie-break Router ID (highest IP loopback). BDR backup.
Mécanisme : 2-Way → DRother n'adjacente que DR/BDR, -80% Hellos.
Exemple concret : LAN 50 routeurs, Priority=0 sur leaves → pas DR, seulement Full avec DR/BDR. Gain : CPU /5.
Optimisations 2026 :
- Point-to-Point sur serial/P2P : Skip election.
- Broadcast → NBMA : Manual neighbors.
- Graceful Restart (RFC3623) : Hold LSDB 120s pendant reboot.
Étude de cas : Data center leaf-spine, DR=spine core → convergence 50ms vs 2s chaos.
Métriques, SPF et Convergence Tuning
Cost = RefBW/BW (défaut RefBW=100Mbps). Path = sum costs, Dijkstra trie.
SPF tiers : Level1 (intra), Level2 (inter), Level3 (external) → partial recompute.
Timers experts :
- SPFThrottle : Start=10ms, Hold=5000ms, Max=10s.
- LSAOriginate : 5s pacing.
- Incremental SPF (iSPF) : +30% speed.
Exemple : WAN 1Gbps, set RefBW=10G → cost=1 vs 10, paths équilibrés.
Analogie : Cost comme carburant, RefBW calibrage voiture F1.
Bonnes pratiques
- Hiérarchisez toujours : Max 50 routeurs/single-area, ABR summarization (/16→/24).
- Sécurisez : MD5 keyed (key-chain rotate 24h), IPv6 AH/ESP.
- Monitorez LSDB :
show ip ospf database<1000 LSA/area. - Tune pour SD-WAN : BFD down 50ms pour fast failure detect.
- OSPFv3 : Native IPv6 + unicast addressing.
Erreurs courantes à éviter
- Oubli Area0 : No inter-area routing, blackhole.
- Mismatched MTU : ExStart stuck, no adj.
- Redistribution sans filter : LSDB explosion Type5.
- Priority=0 everywhere : No DR, full-mesh adjacences → CPU spike.
Pour aller plus loin
Plongez dans RFC 6868 (Max Metric), Cisco DevNet OSPF labs, ou INE CCIE workbooks. Pour une maîtrise ops, inscrivez-vous à nos formations Learni sur la Réseautique Avancée. Livre reco : 'OSPF Complete' de J. Doyle (édition 2025).