tag cloud
Hier eine spontane „Tag-Blase“ zum Thema Boden. Ist weder alphabetisch sortiert noch habe ich die Fontgröße anhand statistischen Methoden berechnet. Wikipedia dazu:
Eine tag cloud ist die Methode zur Informationsvisualisierung, bei der eine Liste aus Schlagworten zweidimensional alphabetisch sortiert angezeigt wird, wobei einzelne unterschiedlich gewichtete Worte größer oder auf andere Weise hervorgehoben dargestellt werden. Wortwolken werden zunehmend beim gemeinschaftlichen Indexieren und in Weblogs eingesetzt. Bekannte Anwendungen sind die Darstellung populärer Stichwörter bei Flickr, Technorati und Del.icio.us. Tag clouds wurden vermutlich zuerst 2002 von Jim Flanagan eingesetzt[1] und zunächst als weighted list (engl. gewichtete Liste) bezeichnet.[2] Um einige Zeit früher im Jahr 1992 kam allerdings schon das philosophische Werk „Tausend Plateaus. Kapitalismus und Schizophrenie“ von Gilles Deleuze und Felix Guattari heraus[3], auf dessen Einband bereits eine „Begriffswolke“ abgebildet ist, in welchem auch eine „Rhizomatische“ Verweisstruktur von Begriffen behandelt wird[4], wie sie das Internet erst praktikabel ermöglichte.
Prinzipiell wird die Schriftgröße eines Deskriptors in einer tag cloud durch dessen Benutzungshäufigkeit bestimmt. Für eine Wortwolke der Kategorien eines Weblogs entspricht die Benutzungshäufigkeit beispielsweise der Anzahl von Weblog-Einträgen, die einer Kategorie zugeordnet sind. Bei kleinen Häufigkeiten genügt es, für jede Anzahl von eins bis zu einem Maximalwert die Schriftgröße direkt anzugeben.[5] Für größere Werte sollte eine Normierung vorgenommen werden. Bei einer linearen Normierung wird das Gewicht ti eines Deskriptors auf eine Größenskala von 1 bis f abgebildet, wobei tmin und tmax den Wertebereich der vorhandenen Gewichte angeben.
für ti > tmin sonst si = 1
- si = Anzuzeigende Fontgröße
- f = maximale Fontgröße
- ti = tag count für den zu gewählten Begriff
- tmin = minimaler Tag Count
- tmax = maximaler Tag Count
Da die Anzahl indexierter Objekte pro Deskriptor üblicherweise nach einem Potenzgesetz verteilt ist,[6] ist für größere Wertebereiche eine Logarithmierung sinnvoll.[7]