Direkt zum Inhalt

News: Web und Wurm verlinkt

Das World Wide Web wächst und gedeiht schon längst nicht mehr - es wuchert. Erstaunlich also, bedenkt man den ständigen, nahezu unkontrollierten und unregulierten Input neuer Webseiten in das Gesamtnetz, dass darin dennoch übergeordnete Strukturen erkennbar bleiben - und sich sogar selbständig organisieren. Mit ein wenig Rechenarbeit, sagen jetzt Forscher, ließen sich diese ungeschriebenen Organisationsgesetze sogar dazu benutzten, Rückschlüsse auf den Inhalt von Seiten zu ziehen - ohne diese erst mühsam einzeln anschauen zu müssen.
Ein Beispiel für übergeordnete, selbstorganisierende Strukturen im Web sind die Communities – thematisch abgegrenzte, miteinander vielfältig verknüpfte Netzregionen, deren Seiten sich inhaltlich den verschiedenen Aspekten eines gemeinsamen Themas widmen. Hinter der Organisation dieser Communities steht kein übergeordneter Plan. Vielmehr bilden sich diese Themenkreis-Teilwebs weitgehend selbstständig dadurch, dass ihre Mitglieder häufiger auf die Seiten der Co-Mitglieder verlinken als auf externe Seiten anderen Inhalts: In der Folge verdichtet sich das Netzwerk selbständig lokal.

Bildlich gesprochen erschaffen solche stellenweise ungleichmäßig ausgebildeten Verknüpfungen demnach ein übergeordnetes Muster im Gesamtnetz – ein Muster mit Informationsgehalt, sogar eine den Informationen der einzelnen Webseiten übergeordnete "Meta-Information", sagen Jean-Pierre Eckmann von der Université de Genève und Elisha Moses vom israelischen Weizmann Institute of Science. Die Wissenschaftler sind sich sicher: Diese Informationen können sinnvoll verwendet werden, um aus der Struktur des Netzes Rückschlüsse auf den Inhalt der darin abgelegten Seiten zu ziehen.

Um ihre Theorie zu belegen entwickelten die Forscher zunächst eine mathematische Definition der Verlinkungs-Informationen. Als Keimzelle von thematisch verwandten Webregionen definierten sie dabei "reziprok verlinkte" Webseiten. Bei solchen Seiten führt jeweils mindestens ein Link auf eine andere, unabhängige Seite, während diese Webpage ihrerseits auch auf die ursprüngliche Seite verlinkt: ein so genannter Co-Link. Ordnen sich gleich drei solcher wechselseitig verlinkten Webpages zu einem Dreieck, oder gar mehrere solcher Dreiecke zu übergeorneten Netzwerken, dann deutet dies, so die Wissenschaftler, auf gegenseitige Anerkennung der Seitenbetreiber hin – und damit mit jeweils zunehmender Wahrscheinlichkeit auch auf thematische Zusammenhänge der Seiteninhalte.

Aus der Menge derartiger Co-verlinkter Dreiecke in bestimmten, räumlich begrenzten Webbereichen können geometrische Größen errechnet werden. Mit diesen Daten, mathematisch gesprochen lokalen Krümmungen der Netzwerk-Darstellung, ist es dann beispielsweise möglich eine dreidimensionale, grafische Web-Landkarte zu erstellen: An Hügeln sind darauf die thematisch einheitlichen Bereiche mit den vielen Co-Link-Dreiecken deutlich zu erkennen.

Grau ist alle Theorie – ihre eigene unterzogen die Forscher daher einem realen Belastungstest. Sie ermittelten mit Hilfe von Web-Robots, kleinen Suchprogrammen, wie sie auch von Internet-Suchmaschinen benutzt werden, die Vernetzungsdaten verschiedener Communities und stellten sie mit ihrem Verfahren grafisch dar.

Und tatsächlich: thematisch einheitliche Seitenansammlungen heben sich in den errechneten Weblandkarten erkennbar ab. Sehr stark vernetzte Communities ähnelten, bildlich gesprochen, sogar abgeschlossenen sphärischen Formen – als ein Beispiel dafür hatten die Forscher die Webseiten zum Thema Tangomusik abgebildet. Grenzbereiche zwischen einzelnen Interessengruppen sind dagegen als scharfe Trennlinien zwischen den stark co-verlinkten Bereichen erkennbar. Meist gibt es zwischen den einzelnen Regionen nur vereinzelte Zufallslinks: etwa die Verknüpfung über die Webseite eines passionierten Liebhabers der Tangos von Astor Piazolla, der sich zudem zufällig gleichzeitig für argentinischen Fußball interessiert und in die entsprechenden Gruppen verlinkt.

Die Forscher wagten zuletzt einen Schritt über den Informatik-Tellerrand hinaus und testeten ihr Modell an völlig anderen komplexen Netzwerken – jedesmal erfolgreich. Egal ob es sich um das Geflecht biochemischer Interaktionen aller Eiweiße der Hefezelle, eine Datenbank-Aufstellung wechselseitiger Zitate von Kollegen in den Publikationen von Mathematikern oder dem neuronalen Netzwerk des Wurms Caenorhabditis elegans handelte, stets korellierten die geometrischen Hügel der Netzlandkarte mit einer thematischen Einheitlichkeit der Netzbausteine.

Netzwerk-Metainformationen geometrisch darzustellen, so Eckmann und Moses abschließend, könnte sich demnach in den verschiedensten Wissenschaftsbereichen als hilfreich erweisen – auch wenn praktische Anwendungen der Forschungsergebnisse wohl vielleicht zunächst im Internet denkbar sind. Die Methode hebt sich beispielsweise von der Strategie der beliebten Internetsuchmaschine google ab, die die Relevanz einzelner Webseiten letztlich nach Häufigkeit der empfangenen Links ermittelt. Eine Bewertung von Co-Links führt zu völlig anderen Wertigkeiten: Statt allgemeinem Bekanntheitsgrad oder "Autorität" wird hier gewichtet, welche Bedeutung die Seite für die themennahen "Co-Experten" hat.

Schreiben Sie uns!

Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.

Partnerinhalte

Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.