TCAM

Das Internet hat(te) Schluckauf: Alte Cisco-Router stoßen an ihre Grenzen

Am vergangenen Dienstag beklagten sich viele Internet-Nutzer über schlechte Verbindungen. Schuld waren aber weder Provider noch Server. Man könnte sagen, "das Internet war kaputt" - genauer: zentrale Router.
Von Thorsten Neuhetzki

Überlaufende Routing-Tabellen verursachten Internetfehler (Symbolbild) Überlaufende Routing-Tabellen verursachten Internetfehler (Symbolbild)
Foto: dpa
Eines der wesentlichen Merkmale des Internets ist, dass jeder Teilnehmer und Server technisch von jedem Teilnehmer erreichbar ist. Damit das funktioniert, muss aber nicht jeder Router jeden Server kennen. Wichtig ist wie auch so oft im wahren Leben nur, dass man jemanden kennt, der jemanden kennt, der helfen kann. So funktioniert auch das Internet: Der erste Router muss nicht den Ziel-Server kennen, er muss nur wissen, über welchen Weg er erreichbar ist, welcher andere Router also im Kontakt zu dem Internet-Teilnetz (Autonomes System, kurz AS) steht, in dem sich der Zielserver befindet. Genau das hat aber diese Woche zum Teil nicht funktioniert, scheinbar langsame Internetverbindungen waren die Folge.

Unklar ist, welche Provider in Deutschland von dem Problem betroffen waren. Bekannt ist lediglich, das Anschlüsse der Deutschen Telekom am Dienstag Vormittag nicht so schnell schienen wie üblich. Das lag jedoch eben nicht an der DSL-Anbindung, sondern den Router-Problemen, auf die ein Kunde keinerlei Einfluss hat. Andere Anschlüsse, etwa von Kabel Deutschland, waren zum gleichen Zeitpunkt in gewohnter Manier verfügbar, wie Erfahrungen unserer Redaktion zeigten.

Tausende neue Einträge in kurzer Zeit bringen Routing-Tabellen zum "überlaufen"

Überlaufende Routing-Tabellen verursachten Internetfehler (Symbolbild) Überlaufende Routing-Tabellen verursachten Internetfehler (Symbolbild)
Foto: dpa
Dass es zu Einschränkungen kam, geht auf alte Cisco-Router zurück, deren Routingtabellen keine Kapazität mehr hatten. 512 000 Einträge (Ternary Content-Addressable Memory, kurz TCAM) kann ein solcher Router fassen. Vor den Problemen am Dienstag waren es in den Routern bedeutender weltweiter Backbone-Betreiber zwischen 497 470 und 501 061 eingetragene IPv4-Routen, wie die Network-Managing-Firma BGPmon in ihrem Blog berichtet. Am Dienstag wurden dann jedoch tausende neue autonome Systeme eingetragen. Das geschah offenbar durch Verizon. Durch diese neuen Einträge, die sich automatisch auf alle anderen Router verteilen, stieg die Zahl der Routing-Einträge auf 515 000 - zu viel für die alten Router. Sie begannen, überzählige Einträge zu löschen und konnten so nicht mehr alle Server erreichen - Datenpakete von Usern verschwanden im Nirvana. Für die Nutzer schien es, als sei die eigene Leitung gestört oder der Server nicht verfügbar - dabei funktionierten diese Bestandteile der Verbindung einwandfrei.

Fehler könnte wieder auftreten, Router können jedoch angepasst werden

Nach Angaben von BGPmon bemerkte Verizon den Fehler schnell und löschte die Einträge wieder. Dadurch sank die Zahl wieder unter die magische Grenze für die alten Router und das Internet funktionierte wieder wie gewohnt. Doch auch ohne diese Verizon-Einträge wächst das Internet immer weiter. Jedes Autonome System erfordert einen zusätzlichen Eintrag in die Tabellen, sind diese voll, kann es wieder zu Ausfällen kommen. Doch es gibt einen Workaround für die alten Cisco-Router: Sie haben offenbar von Haus aus nur die Hälfte der möglichen Tabelleneinträge freigegeben. Techniker können die Zahl der möglichen Tabelleneinträge auf eine Million erhöhen.

Mehr zum Thema Netz