TOM SCHIMMECKs ARCHIV
2003

Benford's Law oder: Die Poesie der falschen Zahlen

Die 1 ist die Königin der Ziffern. Doch dieses Wissen macht uns nicht reicher – im Gegenteil.

von Tom Schimmeck

A
m Anfang war die 1. Und die Beobachtung, daß Logarithmentabellen in Bibliotheken auf den ersten Seiten viel schmutziger sind als auf den letzten. Bei einem schlechten Buch ließe sich dieser Umstand leicht erklären: Die meisten haben schnell aufgegeben. Aber eine Logarithmentabelle ist keine Geschichte. Man schlägt in ihr nach wie in einem Telefonbuch oder Lexikon. Man sucht etwas konkretes, findet es und klappt das Buch wieder zu.

Also, folgerte einst Frank Benford, ein Physiker bei General Electric, den die Sache stutzig machte, müssen Leser jene Zahlen, die mit 1 oder 2 beginnen, wesentlich häufiger nachschlagen als solche, die vorne eine 8 oder 9 stehen haben. Unfug, möchte man als Demokrat spontan sagen: Warum verteilen sie sich nicht gleichmäßig? Warum soll die 1 beliebter sein als die 9?

Benford, der es genau wissen wollte, vertiefte sich in die unterschiedlichsten Zahlenwerke. Er analysierte die Flächen von 353 Flüssen, die Anschriften von 342 bedeutenden amerikanischen Wissenschaftlern. Er prüfte die Ergebnisse der amerikanischen Baseball-Liga, studierte das Molekulargewicht tausender chemischer Verbindungen und zählte die Anfangsziffern aller Zahlen in bestimmten Zeitschriften. Insgesamt trug der Hobbyforscher so 20229 Beobachtungen zusammen.

Als er genug gerechnet hatte, veröffentlichte Benford 1938 sein “law of anomalous numbers”: f(i) = log (i + 1 /i). f - die Wahrscheinlichkeit, welche Anfangsziffer wie oft vorkommt – variiert beträchtlich: Für die 1 kommt die Formel auf eine Wahrscheinlichkeit von 0,306, die 9 dagegen landet bei kläglichen 0,047. Demoskopischer ausgedrückt: Die 1 erobert bei den Anfangsziffern einen Anteil von 30,1 Prozent und wird stärkste Partei. Danach geht es stetig abwärts. Die 2 kommt auf 17,6 Prozent, die 3 nur auf 12,5 Prozent. Die 9 schließlich schafft gerade noch einen Wert, den manche der FDP wünschen: 4,58 Prozent.

Eigentlich war auch Benford nicht erste. Zuvor hatte schon der Astronom und Mathematiker Simon Newcomb das Problem der ersten Ziffer gesehen und eine Gesetzmäßigkeit erkannt. Sein kleiner Artikel “Notiz über die Häufigkeit der Nutzung verschiedenener Ziffern in natürlichen Zahlen” von 1881 wurde von jener Beobachtung ausgelöst, die auch Benford 57 Jahre später auf die Spur brachte: Daß die Logarithmentafel in der Bibliothek auf den vorderen Seite viel schmutziger und zerfledderter waren als hinten. Doch dem armen Newcomb war kein Ruhm vergönnt.

Seit Benfords Veröffentlichung vor 60 Jahren aber machen Mathematiker immer wieder gerne die Probe aufs verblüffende Exempel: Sie zählen die Ziffern auf den Titelseiten von Tageszeitungen und in wissenschaftlichen Kalkulationen. Sie werten Tennisturniere und radioaktive Halbwertzeiten aus, Todesraten und die Stromrechnungen auf den Solomon Islands. Einige haben auch die Veränderungen beim Dow Jones-Aktienindex untersucht – im Zeitraum von 1900 bis 1993. Ergebnis: Alles Material hält sich fast sklavisch an Benfords Gesetz.

Doch wo liegt die Erklärung? Forscher fingen an, die Daten umzurechnen. Sie sagten: Wenn die Regel wirklich gilt, muß es doch gleichgültig sein, ob in Mark oder Yen, in Meter oder Yard gemessen wird. Einer multiplizierte all seine Zahlen mit einer festen Größe – Benford blieb gültig. Ein anderer rechnete Unmengen Aktienkurse von Dollar in Pesos um – und fand auch nur, daß sich das Verhältnis der ersten Ziffern kaum änderte, obwohl die Zahlen nun ganz andere waren. Die Skala ist Benford Wurst.

Stehen auch Zahlen unter einem gewissen Druck, die Ersten zu sein? Unfug, brummen die Forscher und führen statt dessen Fraktale und die Chaostheorie ins Feld. Je zusammenhangloser, desto besser, sagen sie. Besonders gut funktioniere das Benford-Gesetz, wenn Zahlen in keiner erkennbaren Beziehung zueinander stehen. Ihr zweiter Hinweis: Es gehe hier und den logarithmischen Charakter natürlicher Phänomene. Selbst unser Empfinden von Lautstärke und Helligkeit, sagen sie, sei logarithmisch aufgebaut.

Auf der Suche nach dem finalen Beweis, der wirklich schlüssigen Erklärung, geht es zuweilen recht poetisch zu. Am nähesten komme der Benford-Regel eine Art “Gesamttabelle”, fand der Mathematiker Ralph Raimi heraus – ein Ozean der Zahlen, in dem sich alle Baseballergebnisse mit allen Molekulargewichten und allen Aktienkursen mischen. Auch Kollege Theodore P. Hill blickt suchend auf ein großes Zahlenmeer. Sein Beispiel: Man denke sich eine Zeitung, die von lauter Zahlen strotzt, auf die Benfords Regelwerk nicht so recht passen will: Körpergrößen, Autonummern und die neuen Lottozahlen. Zähle man alle Anfangsziffern, werde selbst dieser Mix von unverträglichem Material am Ende doch wieder Benford nahekommen.

Apropos Lotterie: Weist Benford uns endlich den Weg zum Reichtum? Nein, enttäuscht uns Mark Nigrini von Southern Methodist University in Texas, “Lottozahlen sind keine wirklich natürlichen Zahlen” – nur Kugeln, denen man mit Zahlen einen Namen gegeben hat. Genauso könnten sie nach Tieren oder Bäumen benannt sein oder 710 bis 759 durchnumeriert werden. Genauso wenig funktioniert Benford's Law mit Autokennzeichen, Kreditkartennummern oder Supermarktpreisen.

Einen Tip immerhin hat Nigrini für die Freunde des Glücksspiels: Die Menschen wählten ihre Lieblingszahlen “eher im unteren Bereich der Skala” – weil die Zahlen nach Geburtstagen, einem bestimmten Datum oder dem Alter der Kinder ausgesucht sind. Überhaupt, sagt Nigrini, “gibt es mehr kleine als große Dinge auf der Welt. Und daraus resultiert auch Benford's Law.” Wer also Jackpot mit möglich wenig Konkurrenten teilen will, sollte eher auf höhere Zahlen setzen.

Kein Glück also mit Benford. Wohl aber läßt sich die Formel benutzen, um Leuten, die sich bereichern wollen, auf die Schliche zu kommen. Inzwischen nämlich scheinen sich die Mathematiker ihres Benfords so sicher, daß sie sagen: Was nicht hinein paßt, ist falsch. So unterzog der US-Wissenschaftler Eric Helland diverse Wirtschaftsdaten dem Ziffern-Test. Und siehe da: Die Daten der Weltbank folgten Benford artig, Europas historische Statistiken hingegen nicht. “Wenn Daten nicht mit Benfords Gesetz übereinstimmen, entstehen Fragen über den Vorgang, der diese Zahlen hervorgebracht hat”, schrieb Helland 1996.

Auch neue Rechenmodelle für die Vorhersage künftiger Aktienkurse oder Zensusdaten werden heute gerne einem “Benford-in-Benford-out-Test” unterzogen. Sprich: Wenn das Ursprungsmaterial den Ziffern-TÜV besteht, das berechnete aber nicht mehr, empfehlen Benford-Fans, das getestete Modell schleunigst wegzuwerfen.

Eklatantere Folgen für die Menschheit allerdings haben jene Anwendungen, die sich Mark Nigrini ausgedacht hat. Anfang der 90er Jahre war er über eine kleine Anmerkung zu Benford in einem Statistiklehrbuch gestolpert. “Da dachte ich: Ich glaube das nicht, aber wenn es wahr ist, dann könnte man so feststellen, was ob Zahlen echt sind oder fabriziert wurden.”

Er besorgte sich Benfords Manuskript. Er studierte und rechnete wohl zweieinhalb Jahre lang. Heute ist seine auf der Basis von Benford entwickelte Software eine Geldquelle. Auf seiner Kundenliste stehen eine Fülle von US-Konzernen – Fluggesellschaften, Banken und Versicherungen, Telekomfirmen und Ölmultis. Auch Behörden interessieren sich zusehends für die Möglichkeiten. Staatsanwälte in Brooklyn, New York, prüften eingestandene Fälle von Steuerhinterziehung mit Nigrinis Methode nach. Ergebnis: Mit Benford wären sie alle entdeckt worden. Auch Kalifornien nutzt das System, und Delaware hat gerade angefragt.

Die ersten Kontakte aber knüpfte der Neutexaner Nigrini in Europa. Schon 1993 kam das holländische Finanzministerium auf ihn zu. Sein erster Firmenkunde war die schwedische Buchprüfungsfirma Trelleborg AB. “Wir haben es benutzt, um Fälschungen in großen Datenmengen zu finden”, sagt Hans Nyberg, Chef der dortigen Buchprüfung, vor allem in Buchhaltungsdaten. Bei einer großen Datenfülle sei die Methode sehr brauchbar. “Es ist ein Weg, unser Leben einfacher zu machen. Aber man kann nicht sagen: Statt alles zu untersuchen, nehmen wir einfach Benford's Law.”

Nein, es ist nicht die Wunderwaffe des Revisors. Aber doch ein mächtiges Geschütz. Durch Analysen der Ziffernfolgen werden Manager entdeckt, die immer knapp unter ihrem Limit bleiben. Buchungstricks und Scheckfälschungen im großen Stil fliegen auf, vor allem, wenn die Fälscher faul sind und nur ein paar Beträge variieren. Die weiteren Ziffern untersucht, wo der Unterschied langsam zu schwinden scheint. Nigrinis Programm wertet neben der ersten Ziffer auch Kombinationen mit Folgeziffern aus. Denn selbst die fünfte Ziffer ist immer noch wahrscheinlicher eine kleinere als eine größere.

Oft ist es nur ein Verdacht: Wenn man sich etwa die Meldungen über Zinserträge angucke, die US-Banken bei den Steuerbehörden abliefern, sagt Nigrini, ergebe die Analyse ein hübsche Bestätigung von Benfords Gesetz. Füttere man aber die dafür tatsächlich geleisteten Steuerzahlungen in sein System, ergäbe sich eine “totales Durcheinander”. Für Nigrini ein sicheres Zeichen, das hier kräftig geschummelt wird. Nach einer gründlichen Analyse der Steuerdaten, sagt der Wissenschaftler, könne er genau sagen, wo und wann bei den Steuerklärungen einer am heftigsten manipuliert wurde.

Doch es geht nicht nur um Betrug. Die Ziffernprüfung deckt auch überflüssige Buchungsvorgänge auf - etwa, wenn Unmengen kleiner Paketgebühren die Buchhaltung verstopfen. “Oft ist es einfach mangelnde Effizienz”, meint der Buchprüfer Jack Lous von Moret, Ernst & Young. Der Holländer erzählt, er konnte die Gültigkeit von Benford erst glauben, nachdem Er sein eigenes Bankkonto geprüft hatte. Und siehe da: Das Gesetz stimmte.

Zusammen mit Nigrini hat Lous einen “Digital Analyser” entwickelt, der die erste Ziffer und Ziffernfolgen untersucht und zugleich auch auf Doppelungen, Rundungen und andere Auffälligkeiten achtet. Das Programm wird von Ernst & Young seit einem Jahr benutzt - derzeit in etwa 30 Ländern, bald sollen es 130 sein. Lous Kollege Gary Jesson, Senior Manager bei Ernst & Young in Großbritannien, erinnert sich an einen Fall bei einer Kreditkartenfirma in den USA, wo Prüfer einen File mit faulen Krediten durchforsteten und eine auffällige Häufung der Ziffernfolge 74 bemerkten. Bei der Nachprüfung fanden sie eine Fülle von Beträgen zwischen 7400 und 7499 Dollar - und einen peinlich berührten Mann, der autorisiert war, alle nicht eintreibbaren Forderungen bis zu 7500 Dollar abzuschreiben.

Noch vor ein paar Jahren waren solche praktischen Anwendungen undenkbar, weil die Rechenleistung nicht vorhanden war. Heute läßt Nigrini mal eben eine Million Zahlen auf seinem Laptop durchrauschen. “Das hätte vor ein paar Jahren nicht einmal ein Großrechner geschafft.” Nun träumt er davon, seine Software könne bald ein selbstverständlicher Bestandteil großer Systeme werden. Auch will er das Jahr-2000-Problem lösen helfen – die Gefahr des weltweiten Massenwahnsinns von Computer, die viele Experten befürchten, wenn die inneren Uhren der Maschinen vom Jahr 99 auf 00 springen.

Kann man mit Benford denn wenigstens besser fälschen? Wieder nein, meinen die Mathematiker. Menschen könnten nicht “wirklich zufällig handeln”, sagt der Theoretiker Hill. Er beweist es neuen Studenten gerne mit einer Hausaufgabe: Beginnt der Mädchenname ihrer Mutter mit den Buchstaben A bis L, dann sollen sie 200 Mal eine Münze werfen und die Ergebnisse notieren. Der Rest dagegen soll sich eine Ergebnisfolge ausdenken. Am nächsten Tag sammelt Hill die Zettel ein und trennt zielsicher Original von Fälschung ­– mit 95prozentiger Sicherheit. Wie er das macht? Wirklich zufällige Ergebnisse, sagt er, enthielten mit großer Wahrscheinlichkeit eine Abfolge von sechs Zahlen oder Köpfen. Ein Fälscher aber schreibe selten so eine lange Serie auf.

Aber es muß doch möglich sein, bei der Steuererklärung die Zahlen so zu suchen, daß ihre Anfangsziffern in etwa Benfords Gesetz entsprechen? “Nein, das schafft man nicht”, behauptet der Prüfer Jesson. “Man hat Lieblingszifffern im Unterbewußtsein. Ich fordere Sie heraus: In 99 von 100 Fällen finde ich die Fälschung.”

Einen Rat immerhin haben die gnadenlosen Buchprüfer: Wer betrügt, sollte niedrige Ziffern verwenden: ein Betrag von 101 Mark etwa sei viel weniger auffällig als 99 Mark. Außerdem vernachlässigten Fälscher die Einsen und hätten eine verräterische Vorliebe für Sechsen. Und dann heißt es wieder: Setzen, sechs!


HomepageLeitseite

Mind your step Copyright: Tom Schimmeck
Jede Weiterverwendung von Texten und Bildern auf dieser Website bedarf der Genehmigung