Wie in jeder IT-Firma haben auch bei uns einige Kollegen Bereitschaftsdienst. Das heißt, wenn irgendwas schief läuft, werden sie alarmiert (bei uns immer per SMS). Ich bin einer dieser Kollegen, und auf „meinem“ Handy landen in der Regel Probleme der Telefonie. Also zum Beispiel, wenn eine Komponente in unserem Netz ausgefallen ist oder wenn einer unserer Partner keine Gespräche mehr zustellen kann.
ASR – Answer Seizure Ratio
Bei Telefonaten fallen auf unseren Systemen bestimmte Daten an. Wir sehen, welche Gespräche in den letzten Minuten zu welchem Partner oder in welches Netz vermittelt worden sind und ob diese Gespräche zustande gekommen sind oder nicht. Daraus bilden wir eine Quote aus zustande gekommenen Gesprächen und insgesamt versuchten Rufaufbauten. (Diese Quote nennt man Answer Seizure Ratio – siehe Wikipedia.) In der Regel gilt bei uns, dass Quoten von über 50% als okay gelten. Auch wenn man beim ersten Lesen denkt, dass die doch viel höher sein müsste. Man muss aber nur an sein eigenes Telefonier-Verhalten denken. Wie oft lege ich wieder auf weil der andere nicht rangeht? Wie oft ist der angerufene Teilnehmer besetzt? Oder das Handy aus?
Diese Zahlen ermitteln wir für einzelne Ziele, für Partner oder aus Produktsicht. Sie helfen uns, schnell Fehler festzustellen und darauf zu reagieren (falls das System sich nicht selbst helfen kann). Und sie sind zuverlässig. Im Normalfall.
BVB Dortmund – Real Madrid
Gestern Morgen wurde ich von dem sonst meist ruhigen Handy aufgeschreckt. Ich bekam eine SMS mit der Info, dass mehrere unserer Interconnection-Partner angeblich nur noch einen Bruchteil der Gespräche vermitteln würden. Und die Zahlen waren alarmierend hoch. So sieht beispielhaft der Inhalt einer solchen SMS aus:
ASR: 35.76 - AvgDur: 113 sec (ANSWER:1624, BUSY:127, CANCEL:471, CHANUNAVAIL:70, CONGESTION:2081, NOANS:5, SIGALRM:5, SIGHUP/CANCEL:3)
Das sind zugegeben recht rohe Zahlen, die man interpretieren können muss, aber uns sagt das in dem Moment, dass 1624 angenommenen Anrufen ganze 2081 gegenüberstehen, die aus einem ungewöhnlichen Grund nicht durchgestellt wurden. Zeit also, das genauer zu analysieren.
01805-309000
Das ist die BVB-Tickethotline. Da startete gestern der Vorverkauf für das Champions League Heimspiel gegen Real Madrid. Und anscheinend wollten einige Kunden ziemlich dringend Tickets für diese interessante Begegnung ergattern.
Als VoIP-Anbieter sind wir natürlich der Computerwelt viel näher als ein „alter“ analoger Anschluss der Telekom, und dank freigegebener Zugangsdaten kann man einen sipgate-Anschluss in jeglichem Endgerät benutzen, mit meist viel mehr „Leitungen“ als bei einem herkömmlichen Anschluss. Ob das nun ein Telefon oder doch ein Computer ist, ist uns erstmal egal. Diese Tatsache bietet natürlich viel „Spielpotenzial“.
Das dachten sich auch einige findige Kunden. Und haben zur Erhöhung der Chancen auf ein Stadionticket einen Automaten wählen lassen. So kam ein einzelner Kunde gestern Morgen innerhalb einer Stunde auf über 1700 Anrufe. Ein anderer Kunde „schaffte“ mit jeder seiner drei SIP-IDs immerhin über 700 Anrufe. Ob die Methode zum Erfolg führte und die Kunden demnächst im Dortmunder Stadion sitzen, wissen wir nicht. (Insgesamt wurden in der Stunde zwischen 8:30 Uhr und 9:30 Uhr knapp 12.000 Anrufe an die Hotline geschickt, davon kamen ganze 39 zustande.)
Was wir aber wissen: Solche Anomalien im Telefonie-Verhalten fallen definitiv auf. Laut unseren AGB verbieten wir Anrufe über Dialer (siehe die Leistungsbeschreibungen von sipgate team). Solch einer ist hier allerdings ohne Zweifel im Einsatz gewesen. Schon jetzt schränken wir die Anzahl der ausgehenden Anrufe ein. Zum einen um Missbrauch zu verhindern, aber auch um unsere Telefonie-Plattform vor fehlerhaften oder falsch eingerichteten Endgeräten zu schützen. Diese Logik werden wir in den nächsten Tagen erweitern, um automatisiertes Anwählen einzelner Rufnummern besser zu erkennen.
Jeder Fan wünscht sich eine spannende Meisterschaft bis zum letzten Spieltag, um beim Fußball zu bleiben. Und genauso wie die Mannschaften um jeden Punkt kämpfen, sollten jedem Fan die gleichen Mittel zur Verfügung stehen, seine Mannschaft live im Stadion anzufeuern. Ein automatischer Dialer ist allerdings Doping und deshalb aus gutem Grund bei uns nicht gestattet. Wer also einen Platz auf der Stadiontribüne bekommen möchte, der darf von Hand die Nummer der Hotline anrufen, gern auch so oft bis er durchkommt oder alle Plätze vergeben sind. Es gibt immer ein nächstes Spiel. :) In diesem Sinne: Bleibt sportlich fair!
4 Kommentare
Thomas:
Hallo,
monitored ihr eure Systeme eigentlich alle so vollauomatisiert – oder habe ihr sowas wie eine 24/7 Netzüberwachung ?
Welche Tools nutzt ihr den dafür ?
Grüsse
Thomas
Dominik:
Danke – so Blogposts über technischen Hintergrund sind sehr interessant!
Sebastian:
Hallo Thomas,
wir versuchen, für alle Systeme sinnvolle Kennzahlen zu finden, die uns sagen, ob der Dienst noch so funktioniert wie wir es wünschen oder nicht. Und damit wir das auch mitbekommen, haben wir einen Icinga, der diese Werte mit meist handgeschriebenen Skripten abfragt und uns ggf. SMS schickt.
Und damit man das ganze auch mit Historie anschauen kann, visualisiert uns ein Cacti diese Werte. Das hilft oft bei der Analyse von Problemen um einzuordnen, ob das ein normaler Peak ist, ein Schwellwert überschritten wurde oder doch ein System gar nichts mehr tut.
Gruß
Sebastian
Thomas:
Hallo Sebastian,
Danke für die Infos.
Mit Icinga beschäftige ich mich ( aber eher privat ) gerade selber etwas, sehr interessantes Tool.
Cacti nutzen wir in der Firma ebenfalls zur Visualisierung wichiger Daten des ganzen Server und Netzwerk-Komponenten für Analysen, zudem aber noch ein Monitoringsystem auf Basis von SNMP bzw. auch Agenten auf den Systemen selber.
Das ganze wird dann bei einem 24/7 Netzmanagement-Center konzentriert und die Leute dort reagieren dann bei kritischen Alarmen oder Daten direkt selber oder aktivieren in Extremfällen auch die Rufbereitschaften.
Grüsse
Thomas