· MAJ

Détecter les pannes FAI et EDF en temps réel à La Réunion

Comment 974.live identifie les coupures de courant et les incidents fournisseurs d'accès grâce à RIPE Atlas, avec quelle précision, et quelles sont les limites.

Sonde RIPE Atlas, boîtier USB noir avec LED teal, posée sur une carte topographique sombre.

L’essentiel

À La Réunion, les pannes EDF Réunion sont annoncées sur X (ex-Twitter) avec souvent plusieurs dizaines de minutes de retard sur le début d’incident (observation empirique). Les pannes des fournisseurs d’accès internet fixe (Orange AS3215, SFR Réunion, Zeop / Reunicable AS37002, Canalbox) ou mobile (Free Réunion, Telco-OI) arrivent généralement plus tard encore, voire jamais publiquement. 974.live propose une détection indépendante basée sur le réseau de sondes RIPE Atlas opéré par le RIPE NCC, avec une latence cible de 10 à 15 minutes le temps que la grappe se forme et soit qualifiée. La méthodologie est cohérente avec celle d’outils comme Cloudflare Radar et IODA pour la détection de pannes réseau.

Le problème actuel

Quand le courant coupe à Saint-Denis ou que le backbone Orange saute, voici les sources d’information disponibles aujourd’hui :

Trois lacunes :

  1. Latence d’information. Une coupure annoncée à T+45 min, c’est trop tard pour les services qui en ont besoin (médias, secours, exploitants).
  2. Couverture géographique floue. Une annonce “panne dans le Sud” peut concerner Saint-Pierre, Saint-Joseph, Saint-Philippe, ou les trois.
  3. Pas de capteur indépendant. Les sources publiques dépendent toutes de la communication EDF ou opérateur. Si l’institution ne communique pas, ou communique mal, personne ne corrige.

Approche : RIPE Atlas comme capteur

Le réseau RIPE Atlas (cf. pillar technique) compte environ 41 sondes connectées à La Réunion au 10 mai 2026 (snapshot RIPE Atlas API, country_code=RE), réparties principalement sur Zeop, Orange Réunion, SFR/SRR et quelques autres AS. Chaque sonde matérielle est branchée sur la box internet d’un foyer ou d’une institution, alimentée en USB ; quelques sondes logicielles (containers) tournent aussi sur des serveurs locaux. Ces chiffres évoluent, à recroiser en interrogeant l’API publique pour un bilan à jour.

Quand le courant tombe :

Quand le courant revient, la sonde se rallume et émet un événement “connect”.

L’idée centrale : si plusieurs sondes voisines tombent en même temps, c’est qu’un événement réel local s’est produit, pas du bruit.

La doctrine, en cinq principes

Codifiée et révisée par des conseillers extérieurs, la doctrine de 974.live repose sur cinq principes :

1. Burst detection (Disco, Shah et al., 2017)

L’algorithme identifie des grappes synchrones de déconnexions qui s’écartent statistiquement du bruit de fond habituel. La méthode est inspirée de l’algorithme Disco publié au TMA 2017 par Shah et al., et validé sur plusieurs blackouts internationaux.

Une grappe prouve qu’un événement partagé s’est produit. Elle ne prouve pas sa cause. C’est la première étape, pas la conclusion.

2. Indépendance physique

Deux sondes derrière la même box ne comptent pas pour deux. L’algorithme groupe les sondes en sites physiques uniques (mêmes coordonnées, même IPv4, lien administratif), et compte ces sites, pas les sondes brutes.

Sans cette précaution, un foyer avec 3 sondes ferait un faux signal “cluster de 3 pannes” à chaque redémarrage de sa box.

3. Multi-AS

Si toutes les sondes touchées sont sur le même opérateur (par exemple toutes Zeop), c’est probablement une panne Zeop, pas EDF. EDF affecte transversalement tous les opérateurs.

L’algorithme exige donc, pour qualifier une coupure de courant, au moins deux opérateurs distincts dans le même cluster géographique. C’est un seuil dur.

4. Contre-signaux UPS

Certaines sondes sont protégées par un onduleur (UPS) ou hébergées dans un datacenter avec autonomie électrique. Ces sondes survivent à une coupure EDF.

Leur survie n’invalide pas une coupure : elle est notée comme “compatible avec UPS local” dans le rapport. Le détecteur classe les sondes en quatre catégories : ups_confirmed, ups_suspected, residential_primary, unknown. Une sonde qui survit n’est pas un signal “pas de panne”, c’est juste un signal supplémentaire à interpréter.

5. Validation humaine

Tout incident détecté est marqué unlabelled candidate jusqu’à confirmation externe (presse, EDF Twitter, partenaire opérateur). Les candidats non labellisés alimentent la calibration de l’algorithme et n’apparaissent pas dans les métriques publiques de fiabilité.

Différencier EDF, FAI, câble sous-marin

Les trois types d’incidents laissent des signatures différentes :

Type Signature attendue
Coupure EDF Cluster local (<5 km à <15 km), sondes de plusieurs opérateurs (≥2 AS) tombent en même temps, recovery groupé quand le courant revient.
Panne FAI Cluster potentiellement large géographiquement (peut toucher toute l’île), sondes d’un seul opérateur affectées, latence élevée ou perte de paquets sur les survivantes du même AS.
Coupure câble sous-marin Pas de déconnexion massive locale, mais latence vers le continent qui explose, route BGP qui change, perte de paquets sur les ping outre-mer. Les sondes restent visibles, c’est le chemin qui se dégrade.

L’algorithme regarde ces signatures conjointement. Une seule signature isolée donne un signal faible. Plusieurs signatures convergentes donnent un signal fort.

Valeur ajoutée

L’objectif de cette détection est d’être un capteur indépendant, pas redondant avec EDF Twitter ou Imazpress, capable de qualifier en temps réel des grappes de déconnexions de sondes en hypothèses (panne EDF locale, panne FAI ciblée, dégradation de câble sous-marin) avec un niveau de confiance explicité, et de potentiellement repérer des incidents que les communications officielles ne couvrent pas. Méthodologie complète sur la page Méthodologie.

Limites honnêtes

Le détecteur n’est pas parfait. Plusieurs limites sont structurelles, à connaître :

Comment améliorer la détection

La précision du détecteur est directement proportionnelle à la densité et la répartition des sondes RIPE Atlas. Aujourd’hui :

Densifier la couverture est la voie d’amélioration la plus directe. Les profils prioritaires :

Si tu habites une zone non couverte, héberger une sonde RIPE Atlas chez toi (gratuit, 5 minutes d’install, sans configuration) débloque directement notre capacité à détecter ce qui se passe chez toi. Voir le guide d’installation, ou demander une sonde via le formulaire dans le pillar RIPE Atlas.

Sources externes