ArticlePDF Available

Folksonomies in knowledge representation and information retrieval

Authors:

Abstract

In Web 2.0 services "prosumers" - producers and consumers - collaborate not only for the purpose of creating content, but to index these pieces of information as well. Folksonomies permit actors to describe documents with subject headings, "tags", without regarding any rules. Apart from a lot of benefits folksonomies have many shortcomings (e.g., lack of precision). In order to solve some of the problems we propose interpreting tags as natural language terms. Accordingly, we can introduce methods of NLP to solve the tags' linguistic problems. Additionally, we present criteria for tagged documents to create a ranking by relevance (tag distribution, collaboration and actor-based aspects). Besides recommending similar documents ("more like this!") folksonomies can be used for the recommendation of similar users and communities ("more like me!").
Düsseldorfer Informationswissenschaft


In den frühen Jahren des World Wide
Web sind einige wenige Experten in der
Lage, Wissen über dieses Medium zu ver-
teilen. Die Mehrzahl all derjenigen, die
mit dem WWW zu tun haben, beschränkt
Die populären Web 2.0-Dienste werden von Prosumern – Produzenten und gleich-
sam Konsumenten – nicht nur dazu genutzt, Inhalte zu produzieren, sondern
auch, um sie inhaltlich zu erschließen. Folksonomies erlauben es dem Nutzer, Do-
kumente mit eigenen Schlagworten, sog. Tags, zu beschreiben, ohne dabei auf
gewisse Regeln oder Vorgaben achten zu müssen. Neben einigen Vorteilen zeigen
Folksonomies aber auch zahlreiche Schwächen (u. a. einen Mangel an Präzision).
Um diesen Nachteilen größtenteils entgegenzuwirken, schlagen wir eine Interpre-
tation der Tags als natürlichsprachige Wörter vor. Dadurch ist es uns möglich,
Methoden des Natural Language Processing (NLP) auf die Tags anzuwenden und
so linguistische Probleme der Tags zu beseitigen. Darüber hinaus diskutieren wir
Ansätze und weitere Vorschläge (Tagverteilungen, Kollaboration und akteurspezi-
fische Aspekte) hinsichtlich eines Relevance Rankings von getaggten Dokumenten.
Neben Vorschlägen auf ähnliche Dokumente („more like this!“) erlauben Folkso-
nomies auch Hinweise auf verwandte Nutzer und damit auf Communities („more
like me!“).
Folksonomies in Knowledge Representation and Information Retrieval
In Web 2.0 services “prosumers” – producers and consumers – collaborate not only
for the purpose of creating content, but to index these pieces of information as
well. Folksonomies permit actors to describe documents with subject headings,
“tags“, without regarding any rules. Apart from a lot of benefits folksonomies
have many shortcomings (e.g., lack of precision). In order to solve some of the pro-
blems we propose interpreting tags as natural language terms. Accordingly, we
can introduce methods of NLP to solve the tags’ linguistic problems. Additionally,
we present criteria for tagged documents to create a ranking by relevance (tag dis-
tribution, collaboration and actor-based aspects). Besides recommending similar
documents („more like this!“) folksonomies can be used for the recommendation
of similar users and communities („more like me!“).
FolksonomiesinWissensrepräsentation
undInformationRetrieval
Isabella Peters und Wolfgang G. Stock, Düsseldorf
Der Artikel ist eine übersetzte und überarbei-
tete Fassung eines Vortrags der Verfasser
bei der 70. Jahrestagung der American Soci-
ety for Information Science and Technology
in Milwaukee, Wisconsin, am 24. Oktober
2007. Isabella Peters trug eine Version des
Vortrags am 29.Oktober 2007 beim Center for
Intelligent Information Retrieval (University
of Massachusetts, Amherst) vor. Der Studien-
aufenthalt von Isabella Peters wurde durch
eine anteilige Finanzierung der Deutschen
Forschungsgemeinschaft (DFG) ermöglicht.
Wir danken der DFG für das gewährte Reise-
stipendium.
ihren Umgang mit dem Web ausschließ-
lich auf die passive Nutzung des Medi-
ums. Mit dem Beginn des 21. Jahrhun-
derts kommen Dienste auf, die sehr leicht
zu bedienen sind und
die damit Nutzern
gestatten, Content
problemlos zu publi-
zieren. Aus dem (pas-
siven) Nutzer wird
nunmehr zusätzlich
ein (aktiver) Webau-
tor. Der Konsument
von Wissen ist gleich-
sam auch sein Produ-
zent geworden, ein
„Prosumer“ im Sinne
Tofflers (1980). Da die
Autoren (zumindest
manchmal) ihre Doku-
mente wechselseitig
korrigieren und fort-
schreiben, kann man
in diesem Zusammenhang durchaus von
„kollektiver Intelligenz“ sprechen: „With
content derived primarily by community
contribution, popular and influential ser-
vices like Flickr and Wikipedia represent
the emergence of ‚collective intelligence‘
as the new driving force behind the evo-
lution of the Internet“ (Weiss, 2005, 16).
„Kollektive Intelligenz“ entsteht dank
der Zusammenarbeit von Autoren und
Nutzern in „kollaborativen Diensten“,
die zusammengefasst als „Web 2.0“
(O’Reilly, 2005) etikettiert werden kön-
nen. Solche Dienste widmen sich bei-
spielsweise dem Führen von „Tagebü-
chern“ (Weblogs) und deren Suche (z.B.
Technorati), dem Aufbau einer Enzyklo-
pädie (z.B. Wikipedia), der Ordnung von
Lesezeichen zu Webseiten (Del.icio.us),
von Bildern (Flickr) oder von Videos (You-
Tube). Die Inhalte von Diensten, insofern
diese sich komplementär ergänzen, wer-
den gelegentlich als „mash-ups“ (Weiss,
2005, 23) zusammengeführt (beispiels-
weise Housingmaps.com als „mash-up“
aus Immobilieninformationen aus Craigs-
list mit Landkarten und Satellitenbildern
aus Google Maps). Die Kooperation endet
nicht beim Bereitstellen von Content,
sondern schließt bei einigen Web-2.0-Ser-
vices auch die inhaltliche Erschließung
des bereitgestellten Wissens mit ein. In
Abbildung 1 sehen wir eine „tag cloud“
(Sinclair & Cardew-Hall, 2008) aus den
Dingen, die die Nutzer in ihrem Leben
noch tun oder erreichen wollen. Die Häu-
Abbildung 1: Tag Cloud der Homepage „43 Things“.
Quelle: http://www.43things.com.
59(2008)2, 77-90 
figkeit der Worte, der Tags, wird durch
die Schriftgröße angedeutet. Am häufigs-
ten wurde be happy, am zweithäufigsten
take more pictures und weniger oft get a
new job als Lebensziel genannt.
Diese Art der freien Schlagwortvergabe
durch jedermann bezeichnen wir als
„Folksonomy“, wobei die freien Schlag-
worte hier „Tags“ genannt werden. Die
Indexierung mithilfe von Folksonomies
ist demnach „Tagging“. Peter Merholz
(2004) bezeichnet das Verfahren als
„metadata for the masses“, der Schrift-
steller James Surowiecki (2004) nennt
es „the wisdom of crowds“ (McFedries,
2006, 80). Folksonomies sind eine Form
der Inhaltserschließung im Sinne einer
freien Verschlagwortung von Dokumen-
ten im Internet (Furnas et al., 2006). Die
Produzenten oder auch die Nutzer der
Dokumente werden selbst zu Indexern.
Es gibt keine zentrale Kontrolle, die die
Tags und die Arbeit der Prosumer prüft.
Der Begriff „Folksonomy“ als Kunstwort
aus „Folk“ und „Taxonomy“ geht auf
einen Beitrag in einem Blog zur Infor-
mationsarchitektur zurück, in dem Gene
Smith (2004) Thomas Vander Wal zitiert:
„Last week I asked the AIfIA (i.e. the
„Asilomar Institute for Information
Architecture“, d. A.) member‘s list what
they thought about the social classifica-
tion happening at Furl, Flickr and
Del.icio.us each of these systems people
classify their pictures/bookmarks/web
pages with tags …, and then the most
popular tags float on the top …
Thomas Vander Wal, in his reply, coined
the great name for these informal social
categories: a folksonomy.
Still, the idea of socially constructed
classification schemes (with no input
from an information architect) is interes-
ting. Maybe one of these services will
manage to build a social thesaurus“.
Smith gebraucht das Wort „classifica-
tion“ zur Umschreibung von Folksono-
mies. Dies weist – genau wie Taxonomie
– in eine falsche Richtung. Folksonomies
sind gerade keine Klassifikationen, denn
sie arbeiten weder mit Notationen noch
mit Relationen. Wichtig erscheint uns
der Hinweis Smith‘, dass man, aufbau-
end auf Folksonomies, Thesauri koopera-
tiv erstellen kann.
Weite Verbreitung finden Folksonomies
bei den Web 2.0-Diensten, sie können
aber genauso in firmeneigenen Intra-
nets angewendet werden (Fichter, 2006),
z.B. um Corporate Blogs, Podcasts oder
Vodcasts (Peters, 2006a; Peters, 2006b;
Peters & Stock, 2006), Corporate Book-
marking-Dienste (Millen, Feinberg, &
Kerr, 2006) oder Schwarze Bretter (Mu-
rison, 2005) zu erschließen. In Spiteri
(2006 und 2007) wird der Gebrauch von
Folksonomies bei Katalogen öffentlicher
Bibliotheken diskutiert. Smith (2006) und
Trant (2006a, 2006b) berichten über den
Einsatz dieser Indexierungsmethode in
Museen. Heller (2007) stellt die Nutzung
von Folksonomies beim Aufbau gemein-
schaftlich erstellter Bibliographien dar,
ähnlich Hänger und Krätzsch (2007) bei
der Erschließung ansonsten uninde-
xierter Dokumente. Stock (2007b) ist ein
Plädoyer für ein Mash-up von bewährten
„traditionellen“ Indexierungsmethoden
und Folksonomies bei kommerziellen In-
formationsdiensten (siehe auch Peters,
2007)

Mit Thomas Vander Wal (2005) lassen
sich zwei Formen von Folksonomies un-
terscheiden: broad, weite, und narrow,
enge, Folksonomies (siehe auch Dye,
2006). In der Broad Folksonomy (Abbil-
dung 2) können viele verschiedene Nut-
zer (A bis F in der Abbildung) ein Doku-
ment mit Tags versehen. So wird der Do-
kumentinhalt aus zahlreichen Ansichten
mit gleichen, ähnlichen oder völlig ver-
schiedenen Schlagworten beschrieben
(1 bis 5). Das bekannteste Web 2.0-An-
gebot, das diese Art der multiplen Ver-
schlagwortung nutzt, ist der Social Book-
marking-Dienst Del.icio.us. Auch für den
Wissenschaftsbereich existieren mit Ci-
teULike, Connotea (Hammond, Hannay,
Lund, & Scott, 2005; Lund, Hammond,
Flack, & Hannay, 2005) und BibSonomy
(Hotho, Jäschke, Schmitz, & Stumme,
2006c) entsprechende Systeme.
In Narrow Folksonomies werden Tags
nur einmal pro Dokument vergeben und
auch nur einmal erfasst. Deswegen kön-
nen nur neue Tags zugeordnet werden.
Daher besteht keine Möglichkeit, Tag-
häufigkeiten zu zählen und Verteilungen
zu beobachten. Häufig vergibt der Autor
(oder der Content Creator) die ersten
Tags; manchmal ist es auch anderen
Usern erlaubt, weitere Tags hinzuzufü-
gen. Dieses Vorgehen erinnert an die In-
haltserschließung mit den kontrollierten
Vokabularien aus Nomenklaturen, The-
sauri oder Klassifikationssystemen (Stock
& Stock, 2008, Kap. 11 bis 13) durch pro-
fessionelle Indexer; abgesehen davon,
dass in Folksonomies nur unkontrollierte
Terme zum Einsatz kommen. Web 2.0-
Dienste, die mit Narrow Folksonomies
arbeiten, sind u. a. Flickr (Fotos; Beau-
doin, 2007), Technorati (Blogeinträge)
und YouTube (Videos).
Narrow Folksonomies können keine be-
stimmten Häufigkeitsverteilungen der
Indexierungs-Tags zeigen, da bei ihnen
alle Tags gleichwertig sind (alle kommen
genau einmal vor). Allerdings ist es mög-
lich, Tagverteilungen aus den Such-Tags
zu gewinnen. Die Frage ist hier: Welches
Dokument wird mit welchen Tags gefun-
den? Jedem (angezeigten und angeklick-
Abbildung 3: Folksonomy mit singulärer Ver-
gabe von Tags („Narrow Folksonomy“).
Quelle: Vander Wal (2005).
Abbildung 2: Folksonomy mit Mehrfachvergabe
gleicher Tags („Broad Folksonomy“).
Quelle: Vander Wal (2005).
Folksonomies
 59(2008)2, 77-90
ten) Dokument werden diejenigen Terme
als Such-Tags zugeordnet, mit denen
der jeweiligen User erfolgreich das Do-
kument recherchiert hat. Solche Unter-
suchungsoptionen bestanden eigentlich
schon immer; u. W. fanden sie jedoch
noch nie Einsatz.
Im Vergleich zu den Broad Folksonomies
werden Narrow Folksonomies i. d. R.
mit weniger Tags indexiert. Das ist ein
Grund, warum hier kein besonders lan-
ger Long Tail wird entstehen können.
Die Häufigkeitsverteilungen der Such-
Tags können aber durchaus gewisse Re-
gelmäßigkeiten aufweisen.

Vander Wal (2005), Shirky (2005), Munk
& Mork (2007) u. a. stellen bei Broad
Folksonomies fest, dass die Verteilung
der indexierten Tags einer Power Law-
Kurve nach Lotka’s Gesetz (Egghe &
Rousseau, 1990; Egghe, 2005) gleicht.
Diese Verteilung folgt der Gleichung
f(x)= C / xa ,
bei der C eine Konstante, x der Rang des
gegebenen Tags und a ein konstanter
Wert (normalerweise zwischen 1 und 2)
ist. Sollte diese Annahme richtig sein,
wären am linken Anfang der Kurve nur
wenige Tags mit hohen Werten platziert,
das rechte Ende der Kurve würde aller-
dings aus zahlreichen nahezu gleichhäu-
figen Tags bestehen und den sog. „Lan-
gen Schwanz“, den „Long Tail“, bilden.
Wie sieht dies konkret aus?
In Abbildung 4 wird deutlich, dass sich
bestimmte Tags durch ihre Häufigkeit
von anderen Tags deutlich abgrenzen.
Die Tags politik und bundestag auf der
linken Seite der Kurve vereinen fast 80
Prozent der gesamten Taghäufigkeit auf
sich, während die rechte Seite der Kurve
mit Tags wie culture, institutionen und
news zwar eine größere Vielfalt der Con-
tent-Beschreibung aufweist, die aber
jeweils nicht so häufig genannt wer-
den. Diese Menge an niedrigfrequenten
nahezu gleichhäufigen Tags bildet den
Long Tail. Nach dem Aufrufen der Web-
seite kann man erkennen, dass die Tags
am Beginn der Kurve (politik, bundestag)
den Website-Content in einem hohen
Maße adäquat und allgemein, die Long
Tail-Tags ihn jedoch sehr speziell be-
schreiben. Die Kurve zur Webseite www.
bundestag.de und somit die Tagvertei-
lung folgt hier dem Power Law mit einem
Exponenten von ungefähr a = 1. Eine ide-
altypische Power Law-Verteilung zeigt
Abbildung 5.
In einer Untersuchung gemeinsamen
Auftretens von Tags („co-tags“ in Ana-
logie zu den „co-citations“ der Zitati-
onsanalyse) können Lux, Granitzer und
Kern (2007) zeigen, dass rund 80% der
Folksonomies
Tags derart mit an-
deren Tags vorkom-
men, dass diese an-
deren Terme einem
Po wer Law folgen.
Wie lässt sich dies
erklären? Einen sehr
interessanten theore-
tischen Ansatz legen
Cattuto (2006) sowie
Cattuto, Loreta und
Pietronero (2007)
vor. Auch hier geht
es – wie bei Lux et
al. – um das Auftre-
ten der Tags auf einer Makroebene (der
gesamten Datenbank oder experimen-
tell abgetrennter Teile davon) und nicht
– wie in unserem Beispiel (Abbildung 4)
– um die Mikroebene, der Zuordnung ge-
wisser Tags zu konkreten Dokumenten.
Cattuto et al. wenden den Ansatz der
„Semiotics Dynamics“ auf die Kreation
neuer bzw. dem Verwenden alter Tags
in einer Folksonomy an. “Folksonomies
… do exhibit dynamical aspects also ob-
served in human language, such as the
emergence of naming conventions, com-
petition between terms, takeovers by
neologisms, and more” (Cattuto, 2006,
33). Das Erklärungsmodell hat seinen Ur-
seine Wahrscheinlichkeit, dass er auch
erneut zur Indexierung herangezogen
wird. Cattuto et al. verfeinern den Yule-
Simon-Ansatz um eine Zeitkomponente
derart, dass neuere Tags eine größere In-
dexierungswahrscheinlichkeit haben als
alte. „It seems more realistic to assume
that users tend to apply recently added
tags more frequently than old ones, ac-
cording to a skewed memory kernel“
(Cattuto, 2006, 35). Abbildung 6 zeigt
das Erklärungsmodell im Überblick. Die
Wahrscheinlichkeit p drückt aus, dass
ein völlig neuer Tag zur Indexierung
herangezogen wird, 1 – p entsprechend,
dass ein alter gewählt wird. Letztere
Wahrscheinlichkeit hängt von der Zeit
ab, zu der der (alte) Tag genutzt worden
ist. Die Zeitangaben sind im Gedächtnis
Q gespeichert und steuern eine Gewich-
tung nach der Regel „je neuer, desto
wahrscheinlicher“.
Abbildung 6: Ein Yule-Simon-Prozess der
Auswahl von Indexierungs-Tags mit Berück-
sichtigung des Alters der Tags. Quelle: Cattuto,
Loreto, & Pietronero (2007, Fig. 5).
Für die Makroebene erscheint der Ansatz
von Cattuto und des Yule-Simon-Modells
vielversprechend. Offen ist, ob sich diese
Theorie auch auf die Mikroebene über-
tragen lässt. Wenn ja, müssten sich die
Tags auf der Dokumentebene auch nach
dem Power Law verteilen. Dies scheint
aber nicht – oder zumindest nicht immer
– zuzutreffen. Lux et al. (2007) konnten
(auf der Makroebene) nur 80% der Co-
Tag-Verteilungen als Power Law aus-
zeichnen. 20% folgen offenbar anderen
Regeln. Betrachten wir ein zweites Bei-
spiel einer dokumentspezifischen Tag-
Verteilung (Abbildung 7)!
Wie man sieht, folgt die Tagverteilung
hier nicht dem Power Law. Es scheint,
als würden sich hier zwei „Lange
sprung im Yule-Simon-Ansatz, der Wahr-
scheinlichkeiten für das Auftreten von
Worten in Texten thematisiert. An jeder
Stelle eines Textes gilt: Ein bestimmtes
Wort hat die Wahrscheinlichkeit p, ein
neues Wort zu sein (d.h., noch nicht im
bisherigen Text vorzukommen), oder es
hat die Wahrscheinlichkeit 1 – p, eine
Kopie eines bereits vorhandenen Wortes
zu sein. Die Größe von 1 – p hängt davon
ab, wie häufig das gegebene Wort schon
im Text vorgekommen ist, wobei ein ein-
facher Zusammenhang hergestellt wird:
Je häufiger das Wort bereits vorkommt,
desto wahrscheinlicher ist es, dass es
erneut Anwendung findet. Der Yule-
Simon-Ansatz ist damit eine auf Texte
angewandte Variante des altbekannten
„Erfolg gebiert Erfolg“ oder des „Wer
hat, dem wird gegeben“. Um dieses Mo-
dell auf Folksonomies anzuwenden, muss
man nur statt von „Worten in Texten“
von „Tags in Datenbanken“ sprechen. Je
häufiger ein Tag bereits in einem Infor-
mationsdienst auftritt, desto höher wird
Abbildung 5: Power Law.
Abbildung 4: Tagverteilung zur Webseite www.bundestag.de.
Quelle: http://del.icio.us (Stand: November 2007;
Anzahl indexierender User: 60).
Anzahl
59(2008)2, 77-90 
Einige Untersuchungen
scheinen von der still-
schweigenden Vorausset-
zung auszugehen, es gäbe
ausschließlich die Power
Law-Verteilung. Da bei
beiden Verteilungskur-
ven ein langer Schwanz
auftritt, ist in der Tat eine
Verwechslungsmöglich-
keit gegeben. Man muss
demnach besonderes Au-
genmerk auf den Anfang
der Verteilung legen. Das
entscheidende Kriterium,
das ein Power Law aus-
schließt, ist das Vorliegen des langen
Rüssels. Approximiert man eine Kurve
unter Auslassen der ersten Rangplätze
(besonders eklatant beispielsweise bei
Capocci und Caldarelli (2007, Fig. 3) oder
bei Cattuto (2006, Fig. 5)), so sind Fehl-
zuschreibungen nicht auszuschließen.
Bei der Beobachtung von Tags sollten
beide Verteilungen im Auge behalten
werden, da diese bei der Entwicklung
und Erstellung von Information Retrie-
val-Werkzeugen für getaggte Dokumente
wieder zur Sprache kommen müssen. Es
haben nämlich die Tags im langen Rüs-
sel bei der invers-logistischen sowie die
ersten n Tags beim Power Law eine Son-
derstellung, die wir sowohl für eine spe-
zifische Rechercheoption als auch für das
Relevance Ranking ausnutzen wollen.
Abbildung 8: Invers-logistische Verteilung.
Quelle: Stock (2006), S. 1127 (modifiziert).
Nicht unerwähnt bleiben sollen Dienste,
die informetrische Analysen von Tags
anb i eten . So zeigt
beispielsweise Tech-
norati Zeitreihen
von Blogbeiträgen in
Bezug auf Themen
(für ein Beispiel siehe
Stock & Weber, 2006),
während Cloudali-
cious Zeitreihen von
Tags zu bestimmten
URLs in Del.icio.us
generiert (Russell,
2006). Hiermit öffnet
sich ein Forschungs-
feld für die Analyse
von Regelmäßig-
keiten zeitlicher Tag-
verteilungen.
Schwänze“ bilden: rechts der bekannte
„Long Tail“ und links ein „Long Trunk“,
der „Lange Rüssel“ Die Tags grenzen
sich in ihren Häufigkeitsverteilungen
nicht stark genug voneinander ab; es
werden also viele Tags ähnlich häufig
genannt. Der lange Rüssel nimmt bei
www.asis.org die Tags associations,
library, information, ia, technology und
professional auf. Hiernach hat die Ver-
teilung einen Wendepunkt, an den sich
der lange Schwanz anschließt. Die Tags
im langen Rüssel beschreiben den Inhalt
der Webseite – anderes als im Fall der
ersten zwei, drei Tags bei einer Power
Law-Verteilung – nur wenig treffend. Die
Tags associations und technology sind
äußerst allgemein, und auch die restli-
chen Terme geben nur vage Hinweise
auf den Content. Hier hat die kollektive
Intelligenz offenbar Schwierigkeiten, ein
„wahres“ Bild des Dokuments zu zeich-
nen. Es scheint jedoch auch invers-logis-
tische Verteilungen zu geben, bei denen
die Tags links vom Wendepunkt eine
Webseite adäquat beschreiben. Margaret
Kipp (zitiert in Peters, 2008) kann sogar
demonstrieren, dass bei ihrem Beispiel
die Tags im langen Rüssel im Zeitverlauf
konstant bleiben. Für Kipp haben diese
Power Tags den Charakter von kontrol-
liertem Vokabular – lediglich durch die
Community der Prosumer „geprüft“.
Stock (2006) konnte in einer theore-
tischen Studie zeigen, dass es mindes-
tens zwei verschiedene Verteilungen von
Relevanz gibt: die bekannte Power Law-
Verteilung und die invers-logistische Ver-
teilung (siehe Abbildung 8). Die invers-lo-
gistische Verteilung hat viele mehr oder
minder relevante Tags im „Long Trunk“
und zusätzlich ebenfalls einen Long Tail.
Dabei folgt sie der Formel
f(x) = e - C'(x-1)b
bei der e die Euler’sche Zahl und x der
Rang des Tags ist. C’ (im Beispiel von
Abbildung 8 ist es 0,1) ist eine Konstante
und der Exponent b ist stets ungefähr 3.
In vielen Fällen ist der „Long Trunk“ kür-
zer als der „Long Tail“.
Abbildung 7: Tagverteilung zur Webseite www.asis.org.
Quelle: http://del.icio.us (Stand: November 2007;
Anzahl indexierender User: 293).
Folksonomies
Abbildung 9: Getaggtes Foto in Flickr. Quelle: Flickr.com.

Wir kommen zu einem nicht unerheb-
lichen Problem bestimmter Anwen-
dungen von Folksonomies, nämlich zur
kollaborativen Erschließung nicht-tex-
tueller Dokumente. Manche Web 2.0-
Dienste verzeichnen und sammeln Fotos
(z.B. Flickr) oder Videos (z.B. YouTube).
Nicht-textuelle Dokumente (und auch
einige fiktionale Texte) haben nicht nur
eine Ebene des jeweils Thematisierten,
im Gegensatz etwa zu wissenschaft-
lichen Zeitschriftenartikeln. Fachliche
textuelle Dokumente tragen auf einer
einzigen semantischen Ebene Content,
gewöhnlich mit „Aboutness“ beschrie-
ben (Stock & Stock, 2008, 31-36). Nach
Panofsky (2006) gibt es für Kunstwerke
drei verschiedene semantische Stufen
der Interpretationsmöglichkeiten (Smith,
2006). Wir wollen Panofskys Theorie an
einem Beispiel aus Flickr erklären (siehe
Abbildung 9). Das Foto zeigt eine Gruppe
von Skulpturen („Mönch – Arzt – Händ-
ler“), die von der deutschen Künstlerin
Katharina Fritsch erstellt wurden und im
Düsseldorfer Museum K21 ausgestellt
werden. Auch die zu dem Foto anno-
tierten Tags sind aufgeführt.
Panofskys grundlegendes semantisches
Level wird prä-ikonographisch genannt
und beschreibt die Welt der primären
bzw. natürlichen Objekte. Auf dem Foto
sind drei Figuren zu sehen: eine rote
Figur mit einem Pferdefuss, eine weiße
mit einem Totenkopf und eine schwarze
bekleidet mit einer Kutte. Für dieses
Level der Interpretation benötigt der
Interpret keine weiteren Kenntnisse als
die aus alltäglicher Erfahrung. In der In-
formationswissenschaft nennt man das
Ergebnis der prä-ikonographischen In-
terpretation die Ofness eines Dokuments
(Lancaster, 2003; Layne, 2002; Markey,
1986; Shatfort, 1986; Turner, 1995). Die
Ofness-Tags in diesem Beispiel sind (in-
teressanterweise nur in englischen Ter-
men ausgedrückt) black, white und red.
Das ikonographische Level umfasst die
sekundären Objekte; dies ist die Welt
 59(2008)2, 77-90
der Bilder, Anekdoten und Allegorien
(Panofsky, 1975, 50). Der Interpret muss
hier einiges an Erfahrung und Wissen im
soziokulturellen sowie thematischen Um-
feld des Kunstwerkes für die Interpreta-
tion mitbringen. Dieses Level bezeichnet
man als die Aboutness des Dokuments.
Aboutness-Tags sind monk, doctor und
dealer sowie die deutschen Überset-
zungen davon. (Nunmehr arbeitet unser
Tagger mit englischen und mit deutsch-
sprachigen Worten.)
Das dritte Level bezeichnet Panofsky
als ikonologisch; es besteht aus dem
„wahren“ Inhalt, aus der Welt der sym-
bolischen Werte (Panofsky, 1975, 50).
Umfassende Kenntnisse des thema-
tischen Gebiets sind hier für eine adä-
quate Interpretation notwendig. Infor-
mationswissenschaftler berücksichtigen
normalerweise dieses Level nicht in der
Inhaltserschließung; User der Web 2.0-
Dienste können aber den semantischen
Gehalt ihrer Tags selbst bestimmen. In
dem Beispiel ist nur ein, allerdings sehr
schwacher, ikonologischer Tag zu finden:
art (bzw. Kunst). Eine stärkere ikonolo-
gische Beschreibung könnte z.B. unhei-
lige Dreifaltigkeit sein.
Darüber hinaus werden auch nicht-in-
haltliche Informationen vom Nutzer
zum Dokument hinzugefügt, wie z.B.
der Name des Museums, K21, oder der
Name der Künstlerin, KatharinaFritsch.
Diese Arten von Tags beschreiben in der
Diktion von Peter Ingwersen (2002) die
Isness des Dokuments. Katharin Fritsch
ist (is) die Künstlerin des Objekts; K21
ist (is) das ausstellende Museum. Folk-
sonomies machen keinen Unterschied
zwischen den verschiedenen Beschrei-
bungs- und Interpretationsebenen; sie
fließen zu einem einzigen semantischen
Level zusammen.
Nach Ingwersen (2002) werden vier As-
pekte von Aboutness unterschieden: a)
die Autor-Aboutness beschreibt den Con-
tent, wie er ist, b) die Indexer-Aboutness
die zweckgebundene Interpretation des
Contents, c) die Anfrage-Aboutness den
Content als Ausdruck der Suchanfrage
und letztlich d) die User-Aboutness, die
Interpretation des Contents durch den
Nutzer. Das Taggen von Fotos, Videos
usw. ist als nutzerzentriert zu klassifi-
zieren, d.h. beim Level 1 handelt es sich
um die User-Ofness, Level 2 umfasst die
User-Aboutness und Level 3 die User-
Ikonologien; hinzu tritt als vierte Ebene
die Isness aus Nutzersicht. All diese ver-
schiedenen Stufen von Interpretationen
werden in einer Tag Cloud zusammen-
gefasst und nicht unterschieden. Trotz
dieser Problematik stellt Smith in Bezug
auf das Taggen von Museumsobjekten
durch die Nutzer fest: “Tagging has the
potential of increasing access to art-
work images and records dramatically
for searchers of all levels of expertise”
(Smith, 2006, 13). Studien über den Ein-
satz neuer nutzerzentrierter Dokumenta-
tionsmethoden in Museen zeigen, dass
die meisten der vom Nutzer kreierten
Schlagworte nicht in der bisher verwen-
deten Wissensordnung vorkommen,
sondern neu sind (Trant, 2006b, 21) und
dass der Einsatz von Folksonomies neue
Möglichkeiten schafft, ein Kunstwerk zu
finden (Trant, 2006a).
In zahlreichen informationswissenschaft-
lichen Veröffentlichungen wird das
Thema Inhaltserschließung von Fotos und
Bildern behandelt (z.B. Rasmussen, 1997),
allerdings nicht mit Bezug auf Folksono-
mies und Web-2.0-Dienste, sondern bei-
spielsweise auf Pressebilder.
Ornager (1995, 214) hat dazu
herausgefunden, dass sich
die Inhaltsanalyse von Fotos
und Bildern auf hauptsäch-
lich fünf Kategorien stützt:
„named person (who), back-
round information about the
photo (when, where), spe-
cific events (what), moods
and emotions (shown or
expressed), size of photo.“
Markkula und Sormunen
(2000, 270 f.) stellen fest,
dass “(t)he most often used
index terms referred to speci-
fics, i.e. to individual objects,
places, events and linear
time, and to the theme of the
photo”. Zur Inhaltserschlie-
ßung und zur Beschreibung
der abgebildeten Objekte
verwenden die Indexer häu-
fig Nomen, jedoch werden
Handlungen und Ereignisse
auch mit Verben beschrieben
(„Czechs celebrate the vic-
tory...“; Markkula & Sornumen, 2000, 271).
Eine wichtige Beobachtung ist: “(T)he
output of the indexing process seemed to
be quite inconsistent” (Markkula & Sor-
numen, 2000, 273). Diese Indexierungs-
inkonsistenz dürfte in der doch stark
subjektiven Färbung der Bildbetrachtung
und -auswertung begründet liegen (Neal,
2007).


Folksonomies sind eine neue Methode,
um den Inhalt von Dokumenten zu erfas-
sen. Die Prosumer – oder die „Akteure“
im Sinne der Analyse kognitiver Arbeit
(Fidel, 2006) – indexieren selbst das Do-
kument. Dabei spiegelt die Folksonomy
die Sprache und das Wissen der Pro-
sumer authentisch wider (Quintarelli,
2005). Diese Art der Inhalterschließung
führt zu einer Vielzahl an „multiple in-
terpretations“, unterschiedlichen (und
manchmal unvereinbaren) Meinungen
und „multicultural views“ von ein und
derselben Information (Peterson, 2006).
Diese “shared intersubjectivities” er-
möglichen es dem Nutzer “to benefit, not
just from their own discoveries, but from
those of others” (Campbell, 2006, 10).
Folksonomies komplettieren die Werk-
zeuge und Methoden der Wissensreprä-
sentation, wie dies in Abbildung 10 skiz-
ziert ist. Wir unterscheiden drei Gruppen
von Akteuren, die Dokumente indexie-
ren: Autoren, professionelle Indexer und
Nutzer (Kipp, 2006b). Hierbei werden
unterschiedliche Wege der Indexierung
beschritten, die wahrscheinlich auch un-
terschiedliche Merkmale der Dokumente
jeweils in den Vordergrund rücken. Text-
orientierte Methoden machen in einem
großen Maße Gebrauch von der Sprache
des Autors, z.B. bei der Textwortme-
thode oder bei der Zitationsindexierung.
Im Gegensatz zu diesen Methoden be-
rücksichtigen Folksonomies nicht nur die
Sprache des Autors, sondern auch die
Sprache der Nutzer. Wissensordnungen
wie Nomenklaturen, Thesauri oder Klas-
sifikationssysteme benötigen für ihren
Gebrauch Interpreten oder Übersetzer.
Zum einen sind dies die Experten, die
das Vokabular erstellen, und zum ande-
ren die, die das Vokabular zur Inhalts-
erschließung benutzen. Die Entwickler
von kontrollierten Vokabularien müssen
zunächst die „literature, needs, actors,
tasks, domains, activities, etc.“ (Mai,
2006, 17) analysieren, um daraus das
kontrollierte Vokabular zu erstellen. Dies
ist ohne Zweifel eine zeitaufwändige
und teure Prozedur. Dagegen sind Folk-
sonomies günstig im Unterhalt, denn die
Pflege und Indexierung geschieht durch
die freiwillige und kostenlose Zusam-
menarbeit vieler Nutzer. “Tagging has
dramatically lower costs because there is
Folksonomies
Abbildung 10: Methoden der Wissensrepräsentation und deren
Akteure. Quelle: Stock & Stock (2008, S. 41).
59(2008)2, 77-90 
no complicated, hierarchically organized
nomenclature to learn. User simply cre-
ate and apply tags on the fly” (Wu, Zu-
bair, & Maly, 2006, 111). Darüber hinaus
gibt es eine hohe Bereitschaft seitens
der User, selbst zu taggen und so den
Taggingprozess in der Community anzu-
regen und zu verstärken (Fichter, 2006).
Aus praktischen Gründen ist es wohl un-
möglich, alle URLs, Blogeinträge, Fotos
und Videos im World Wide Web intel-
lektuell mit kontrollierten Vokabularien
zu erschließen. Algorithmische Suchma-
schinen wie Google oder Yahoo! können
textuelle Dokumente automatisch inde-
xieren. Für Dokumente wie Fotos oder
Videos gestaltet sich eine rein automa-
tische, content-basierte Erschließung je-
doch schwierig, da sie keine Metadaten
enthalten.
Welchen Nutzen bewirken Folksono-
mies? Wir wollen an dieser Stelle einige
kurze Überlegungen anstellen.
1) Die Entwicklung und die Pflege von
bestehenden kontrollierten Vokabularien
kann von Folksonomies profitieren (Aurn-
hammer, Hanappe, & Steels, 2006; Chris-
tiaens, 2006; Gendarmi & Lanubile, 2006;
Macgregor & McCulloch, 2006; Mika, 2005;
Zhang, Wu, & Yu, 2006). Die Tags, ihre
Häufigkeit und ihre Verteilungen können
als Quelle für neue kontrollierte Terme,
für Term-Modifikationen und Term-Lö-
schungen dienen. Diese „bottom-up cate-
gorization“ (Vander Wal, 2004) garantiert
schnelle Reaktionszeiten bezüglich neuer
Themen und Innovationen in der Wis-
sensdomäne und ist damit ein wichtiges
Instrument sowohl zum Neuaufbau als
auch zur Pflege von Nomenklaturen, Klas-
sifikationssystemen und Thesauri. Doch
inwieweit können Folksonomies praktisch
zur Entwicklung von kontrollierten Vo-
kabularien, von Ontologien bis hin zum
Semantischen Web beitragen (Al-Khalifa,
2007; Specia & Motta, 2007)? Die bis jetzt
entwickelten Modelle arbeiten haupt-
sächlich mit Co-Occurences (Schmitz,
2006), einfachen Cluster-Algorithmen
(Grahl, Hotho, & Stumme, 2007) oder dem
Vektorraum-Modell (Dimensionen: Doku-
mente, Vektoren: Tags, Tagähnlichkeit:
Cosinus) (H ey ma nn &
Garcia-Molina, 2006).
Die entstandenen Ähn-
lichkeitswerte können
als Grundlage für einen
Ähnlichkeitsgraphen
dienen, bei dem die
Position des Tags Aus-
kunft über die hierar-
chische Lokalisierung in
einer „latent hierarchical
taxonomy“ (Heymann &
Garcia-Molina, 2006, 4)
geben kann.
2) Folksonomies ergän-
zen kontrollierte Voka-
bularien in der Recher-
chepraxis. Kann man bei
Folksonomies und Onto-
logien überhaupt von
Rivalen sprechen? Für
Tom Gruber (2006, 994)
ist dies “nonsense, and
it is time to embrace a
unified view”. Die Grundidee hierbei ist
es, Tags in ihrem semantischen Umfeld
darzustellen, aus dem der Nutzer zusätz-
liche Suchargumente gewinnen kann.
Da Folksonomies nie explizit paradig-
matische Umfeldterme nennen, müssen
diese aus anderen Wissensordnungen
gewonnen werden. Infrage kommen alle
fachlichen wie linguistischen Begriffsord-
nungen. WordNet (Miller, 1998) konnte
bereits erfolgreich bei Daten aus Del.icio.
us (Laniado, Eynard, & Colombetti, 2007)
sowie bei Flickr (Kolbitsch, 2007b) zum
Einsatz kommen. Abbildung 11 zeigt die
experimentelle Oberfläche von Word-
Flickr, einem Mash-up aus WordNet und
Flickr.
3) Journalisten oder Wissenschaftler müs-
sen an der Hürde der Gatekeeper und
ihrer Qualitätskontrolle vorbei, wollen
sie ihre Werke veröffentlichen. Es stellt
sich die Frage, ob es solche Gatekeeper
auch im Internet gibt. Clay Shirky (2005)
sagt dazu: “The Web has an editor, it’s
everybody”. Eine Qualitätskontrolle des
Contents findet statt – jedoch erst nach
seiner Veröffentlichung. Je mehr Nutzer
ein Dokument taggen, desto mehr Re-
levanz scheint dieses Dokument für sie
zu haben. Ist dies aber eine ernstzuneh-
mende Qualitätskontrolle? Wird etwas
zu „geprüfter“ Qualität, nur weil viele
Leute dies so sehen? (Wenn viele Stu-
denten bei einer Mathematikklausur die
gleiche – falsche – Lösung bringen, wird
diese nicht dadurch qualitativ wertvoll,
sondern bleibt falsch.1) Quantität bedeu-
tet nicht Qualität. Andererseits weist es
in eine bestimmte Richtung, wenn viele
Nutzer ein Stück Information mit stupid
und ein anderes mit cool taggen. Dieser
Content könnte für das Relevance Ran-
king verwertet werden.
4) Das Retrieval mit Folksonomies kann
auf zweifache Weise erfolgen: a) der
Nutzer gibt einfach mögliche Tags in
die Suche ein oder b) er nutzt die Tags,
um sich zum gewünschten Dokument
„durchzuhangeln“. Dieser letzte Punkt
ist für Adam Mathes (2004) die zentrale
Eigenschaft und Stärke von Recherchen
mit Folksonomies – Serendipity. “The
long tail paradigm is also about discovery
of information, not just about finding it”
(Quintarelli, 2005). Das Suchen mit Tags
ist für Laien viel einfacher und schneller
als die Recherche mit elaborierten Infor-
mation Retrieval-Werkzeugen, wie z.B.
der Internationalen Patentklassifikation
(IPC). Einige Nutzer verzichten sogar völ-
lig auf die Eingabe von Suchargumenten
und klicken sich durch die Tag Clouds
zur gewünschten Information durch
(Sinclair & Cardew-Hall, 2008).
5) Es gibt Tags, die in Folksonomies
zum ersten Mal auftauchen, sog. Neo-
logismen. In Mathes (2004) werden die
Beispiele sometaithurts (für „so meta
it hurts“) und flicktion diskutiert. „Alt-
hough small, there is a quick formation
of new terms to describe what is going
on, and others adopting that term and
the activity it describes“ (Mathes, 2004).
Dieser unerwartete und unvorherseh-
bare Gebrauch von Sprache und Tags
reflektiert deutlich die „communication
and ad-hoc group formation facilitated
through metadata“ (Mathes, 2004).
6) Betrachtet man alle Dokumente, Tags
und Nutzer als Knoten in einem Netz-
werk, so kann man leicht die Communi-
ties identifizieren, die ein Thema oder ein
Interessensgebiet teilen: „Collaborative
tagging systems have the potential of
becoming a technological infrastructure
for harvesting social knowledge“ (Wu,
Zubair, & Maly, 2006, 114).
7) Auf der Basis gemeinsam verwende-
ter Tags oder gemeinsam indexierter Do-
kumente wird es möglich, Folksonomies
für Zwecke von impliziten kollaborativen
Recommendersystemen zu nutzen (Die-
derich & Iofciu, 2006; Niwa, Doi, & Honi-
den, 2006).
8) Ein weiterer Vorteil von Folksonomies
ist (auch wenn es dafür noch keine wis-
senschaftliche Evidenz gibt), dass sie
dem Nutzer die Schwierigkeiten, aber
1 Dieses illustrative Beispiel verdanken wir un-
serem Studenten Peter Bücker.
Folksonomies
Abbildung 11: WordFlickr: Synthese aus Web-2.0-Dienst und Thesau-
rus. Quelle: Kolbitsch (2007a, S. 85).
 59(2008)2, 77-90
auch Nützlichkeit von Inhaltserschlie-
ßung und Indexierungsmethoden näher
bringen und ihn dafür sensibilisieren.
Wir wollen die Vorteile der Folksonomies
noch mal zusammenfassen. Folksono-
mies:
n spiegeln die Sprache der Nutzer au-
thentisch wider,
n erlauben verschiedene Interpretati-
onen,
n sind eine günstige Form der Inhaltser-
schließung,
n sind die einzige Möglichkeit, Massen-
Information im Web zu erschließen,
n sind Termquellen für die Entwicklung
und Pflege von Ontologien und kon-
trollierten Vokabularien,
n geben die Qualitätskontrolle an die
Nutzer weiter,
n erlauben konkretes Suchen und Brow-
sing,
n berücksichtigen Neologismen,
n tragen dazu bei, Communities zu iden-
tifizieren,
n geben eine Basis für Recommender-
systeme,
n sensibilisieren Nutzer für die Inhalts-
erschließung.

Es resultieren zahlreiche Probleme aus
dem Fehlen eines kontrollierten Voka-
bulars. „Lack of precision is a function
of user behaviour, not the tags them-
selves“, wiegelt Shirky (2004) ab. Nichts-
destotrotz findet man in Folksonomies
oftmals Uneindeutigkeiten, wie ver-
schiedene Wortformen, Nomen in Plural,
Nomen in Singular oder Abkürzungen,
die das Suchen und Finden von Doku-
menten erschweren. Weitere Beispiele
präsentiert der Web 2.0-Dienst Del.icio.
us (siehe oben Abbildung 7). Da hier je-
weils nur ein Wort als Tag eingegeben
werden kann, werden Phrasen (infor-
mationarchitecture) aus zwei oder mehr
Wörtern kreiert oder einzelne Wörter mit
einen Unterstrich (information_architec-
ture) verbunden. Abkürzungen (ia) fin-
den Verwendung; Singular- (library) wie
Pluralformen (libraries) kommen neben-
einander vor. Es fehlt die Zusammenfas-
sung von Synonymen, auch über Sprach-
grenzen hinweg, und die Trennung von
Homonymen. Daneben finden sich viele
Rechtschreib- oder Tippfehler und unter-
schiedliche Schreibweisen. Daher lassen
sich Folksonomies auch als unstruktu-
rierte Liste von Schlagwörtern bezeich-
nen (Reamy, 2006). „Currently most users
don’t give much thought to the way they
tag resources, and bad or ‚sloppy’ tags
are ten-a-penny in Folksonomies” (Guy
& Tonkin, 2006). Das Tagging-Verhal-
ten der User ist also unberechenbar und
nicht vorhersehbar, was das Information
Retrieval drastisch erschwert. Ein paar
Zahlen sollen dies verdeutlichen: Nach
Guy und Tonkin (2006) sind fast 40 Pro-
zent der Flickr-Tags und 28 Prozent der
Del.icio.us-Tags „either misspelt, from a
language not available via the software
used, encoded in a manner that was not
understood by the dictionary software, or
compound words consisting of more than
two words or a mixture of languages“.
Die Prosumer, die ein Dokument er-
schließen, handeln in unterschiedlichen
Kontexten und aus verschiedenen Moti-
vationen: Ein Nutzer annotiert Tags zu
einem Dokument aus beruflichen Hinter-
gründen, ein anderer hat sein Freizeit-
vergnügen im Hinterkopf. Es fehlt daher
ein einheitliches, grundlegendes Level
der Inhaltserschließung. “There is [...]
systematic variation across individuals in
what constitutes a basic level” (Golder
& Huberman, 2006, 200). Erfahrungen,
sprachliche Ausdrucksstärke, kognitive
Fähigkeiten und Motivationen sind alles
Faktoren, die den Grad der Inhaltser-
schließung bestimmen und beeinflus-
sen. Darüber hinaus muss berücksichtigt
werden, dass “a significant amount of
tagging, if not all, is done for personal
use rather than public benefit” (Golder &
Huberman, 2006, 207).
Web 2.0-Services finden weite Verbrei-
tung und erfreuen sich wachsender Po-
pularität – und das auf der ganzen Welt.
Die Problematik, die hier auftaucht,
betrifft die Vielsprachigkeit unter den
Usern. Das „merging of languages“ (Gor-
don-Murnane, 2006) führt zu Problemen
in der intersprachlichen Synonymie oder
Homonymie (z.B. deutsch: Gift und eng-
lisch: gift) und schwächt die Präzision
der Suchresultate bzw. zeigt u. U. falsche
Ergebnisse. Darüber hinaus gibt jeder
Nutzer seine Tags vornehmlich (auch)
in seiner Muttersprache ein und kann
wahrscheinlich nur einen begrenzten Teil
anderssprachiger Tags verstehen – und
somit auch nur nach einem begrenzten
Teil in der gesamten Datenbank suchen
und darauf zugreifen.
Folksonomies machen im Gegensatz zu
Thesauri und Klassifikationssystemen
keinen Gebrauch von Relationen zwi-
schen den Begriffen, sog. para-
digmatischen Relationen, wie
z.B. Äquivalenzrelation, Hier-
archierelation oder Assoziati-
onsrelation. Jedoch bestehen
in der aktuellen Co-Occurrence
von mehreren Tags zu einem
Dokument zwischen diesen
syntagmatische Relationen
(Stock, 2007a, 451). Wir wollen
dies an einem Beispiel verdeut-
lichen (Abbildung 12).
Die Tags UK und england sind
durch eine geographische Me-
ronymie verbunden, während
die Tags seat und stadium
durch eine Komplex-Kompo-
nenten-Relation gekennzeich-
net sind. Diese syntagmatischen Relati-
onen sind eigentlich paradigmatisch und
könnten zur Suchfrageerweiterung oder
-einschränkung genutzt werden (Weller
& Peters, 2007; Peters & Weller, 2008).
Jedoch sind diese nützlichen Relationen
in der Tagliste verborgen und werden
nicht von Folksonomies eingesetzt.
Professionell erstellte Metadaten wer-
den in verschiedene Felder segmentiert,
z.B. in Dokumenttyp, in Autor oder in die
Notationen eines Klassifikationssystems.
Die Inhaltserschließung berücksichtigt
hier die formalen Aspekte eines Doku-
ments und die Aspekte der Aboutness
und unterscheidet sie voneinander. Folk-
sonomies vernachlässigen diese strikte
Trennung von unterschiedlichen Meta-
daten, machen aber sehr wohl Gebrauch
von Tags, die nicht nur den Inhalt des
Dokuments beschreiben, wie z.B. einen
Namen für den Besitzer des Dokuments
oder den Hinweis, dass es sich um ein
Buch handelt. Daneben werden auch
Wertungen vorgenommen (stupid). Diese
user-spezifischen Tags beschreiben oder
evaluieren ein Dokument nur aus der
Sicht des einen Users, sodass diese Tags
„are virtually meaningless to anybody
except their creators“ (Pluzhenskaia,
2006, 23). Zahlreiche andere Tags können
performativ genannt werden, d.h. dass
sie als Ausdruck einer geplanten oder
erledigten Aktivität annotiert werden,
z.B. toread oder todo (Kipp, 2006). Auch
synkategorematische Tags kommen vor,
d.h. sie können nur im Kontext verstan-
den werden. Ein typisches Beispiel für
einen synkategorematischen Tag ist me
bzw. ich, wenn er zur Beschreibung der
Eigenaufnahme des Fotografen anno-
tiert wird. Es ist auch nicht auszuschlie-
ßen, dass einige der Tags absichtlich als
Spam-Tags von Nutzern verwendet wer-
den. “(I)t involves an unethical user who
propagates [...] tags in order to corrupt
a system” (Kroski, 2005). Beim Tagging
von Fotos und Videos kommt die Schwie-
rigkeit hinzu, dass sich unterschiedliche
Levels der Indexierung bezüglich Ofness,
Aboutness, Ikonologie und Isness mitein-
ander vermischen, sich nicht unterschei-
Folksonomies
Abbildung 12: Syntagmatische und paradigmatische
Relationen zwischen Tags. Quelle: Flickr.com.
59(2008)2, 77-90 
den lassen und in ihrer Inter- und Intra-
indexerkonsistenz erheblich schwanken.
Wir wollen die Nachteile der Folksono-
mies noch einmal kurz festhalten:
n fehlendes kontrolliertes Vokabular,
n verschiedene Levels der Indexierung,
n Vermischung von Sprachen,
n versteckte paradigmatische Relationen
bleiben ungenutzt,
n fehlende Trennung von formalen bzw.
bibliographischen Tags und About-
ness-Tags,
n Spam-Tags, nutzer-spezifische Tags
und andere uneindeutige Schlag-
worte,
n Verschmelzung von Ofness, About-
ness, Ikonologie und Isness.


Um die oben genannten Probleme zu
lösen, könnten sich zwei Vorgehens-
weisen etablieren, die sich gegenseitig
ergänzen. Zum einen kann man sich auf
die Indexer bzw. Prosumer konzentrieren
und versuchen, diese zu einer besseren
„tag literacy“ (Guy & Tonkin, 2006) zu
erziehen. Dazu muss man zunächst das
Nutzerverhalten bezüglich Tagging be-
obachten (siehe z.B. Bar Ilan et al.; 2006;
Lin et al., 2006; Morrison, 2007; Veres ,
2006a oder Winget, 2006). Die Nutzer-
forschung steht hinsichtlich der Folkso-
nomies allerdings erst am Anfang ihrer
Bemühungen.
Um die Nutzer bei der Auswahl „rich-
tiger“ Tags zu unterstützen und sie in
der Tagvergabe zu trainieren, bietet es
sich an, Tags durch das System vorzu-
schlagen (MacLauri, 2005; Xu, Fu, Mao,
& Su, 2006). Dieses Vorschlagssystem
kann auf zwei Ebenen arbeiten. Wir un-
terscheiden zwischen syntaktischen Vor-
schlägen (z.B. den Tag Bild durch den
Tag Bilder ergänzen) und relationalen
Hinweisen (z.B. der Nutzer annotiert den
Tag Bild, und das System schlägt Grafik
vor, weil unser Nutzer bereits den Tag
Grafik verwendet hat). Der Einsatz von
weitergehender Tag-Recommendation
bei der Indexierung ist nicht frei von
Problemen – im Gegensatz zu Vorschlä-
gen von Such-Tags im Retrieval (s. u.!).
Schlägt ein System nämlich dem Indexer
die jeweils bereits am häufigsten verge-
benen Tags eines Dokuments vor und
orientieren sich die indexierenden Nutzer
tatsächlich daran, so entsteht – in einer
Art self-fulfilling prophecy – stets eine
Tag-Verteilung nach dem Power Law.
Zum anderen kann man die Tags als Ele-
mente der natürlichen Sprache ansehen
und sie mit den etablierten Methoden
des Natural Language Processing (NLP)
bearbeiten (Stock, 2007a, Kap. 14 bis 18).
Studien zeigen, dass circa 90 Prozent der
Tags Nomen sind (Guy & Tonkin, 2006).
Ob auch andere Wortarten, vor allem
Verben, einmal häufig genutzt werden,
bleibt abzuwarten. Da Adjektive an
Nomen gebunden sind, müssen wir diese
stets mitbeachten. Aus Gründen der Ein-
fachheit nehmen wir an, dass der größte
Teil der Tags Nomen (einschließlich Ad-
jektiven) sind. Deswegen können wir
während der Tag-Bearbeitung mittels
NLP-Verfahren alle anderen Wortformen
vernachlässigen.
Für die NLP-Verarbeitung der Tags bevor-
zugen wir einen wort-basierten Ansatz,
da dieser bessere Möglichkeiten zur Be-
arbeitung bietet (siehe Abbildung 13 die
drei untersten Ebenen). Eine (hier nicht
weiter verfolgte) alternative Möglichkeit
bietet die Implementierung von n-Gramm-
Verfahren (Stock, 2007a, Kap. 13).
Problematisch ist, dass wir nicht davon
ausgehen können, dass alle Dokumente
getaggt sind. Für textuelle Dokumente
können wir jedoch einen Ersatz generie-
ren: Bei Blogs haben wir den gesamten
Text als Basis, bei Fotos und Videos zu-
mindest die Titel, Beschreibungen und
Kommentare. Die wichtigsten Terme be-
stimmen wir automatisch (Brooks & Mon-
tanez, 2006a; 2006b). Mit dem Ergebnis
aus WDF*IDF lässt sich ein Ranking er-
stellen; die ersten n (etwa n = 3) Terme
werden als Tags bestimmt. Dieses Ver-
fahren darf nicht zu häufig Anwendung
finden, da die automatische Indexierung
dem Grundgedanken des intellektuellen
Taggings zuwiderläuft. Eine Studie von
Al-Khalifa und Davis (2007) zeigt im
Trend, dass die von den Prosumern inde-
xierten Tags nur wenig mit Termen kor-
relieren, die auf der Basis automatischer
Verfahren gewonnen werden.
Nach der Spracherkennung und dem Par-
sing müssen wir die kontextspezifischen
synkategorematischen Tags, wie me und
ich, bearbeiten. Für diese Problemfälle
schlagen wir vor, sie automatisch durch
den Nutzernamen des angemeldeten
Users zu ersetzen. Sucht dieser spezielle
Nutzer nach sich selbst, indem er den
Tag me nutzt, erhält er die passenden
Resultate. Alle nicht angemeldeten User
erhalten für eine Suchanfrage mit me
keine Ergebnisse. Nur die Suche nach
dem Benutzernamen zeigt ein Resultat.
Der Bearbeitungsalgorithmus folgt den
typischen NLP-Aufgaben (Fehlererken-
nung, Wortformzusammenfassung, Iden-
tifikation von Eigennamen, Phrasener-
kennung und Dekomposition), wie in
Abbildung 13 dargestellt. „Höhere“ Be-
arbeitungsschritte verlangen nach einem
Mash-up aus Folksonomy und kontrollier-
tem Vokabular. Während der Erkennung
von Homonymen und Synonymen muss
man Wissensordnungen wie beispiels-
weise WordNet (Miller, 1998) zur Hilfe
nehmen. Außerdem könnte es hilfreich
sein, bei der Homonymunterscheidung
auch Co-Occurrence-Statistiken der Tags
einzubeziehen (Butterfield et al., 2006).
Man stelle sich ein Tag Cluster vor, dass
die Tags Java, Perl und Programmie-
rung enthält, und ein weiteres Cluster,
welches Java, Sumatra und Indonesien
als Tags aufweist. Das System könnte
beide Tag-Cluster anzeigen und den
User, der nach Java gesucht hat, selbst
auswählen und entscheiden lassen, wel-
che Bedeutung des Tags er tatsächlich
gesucht hat. Ein Merging von Thesauri,
Klassifikationssystemen oder Ontologien
mit Folksonomies kann die Nutzung von
Relationen (wie Hierarchie oder Asso-
ziationsrelation) ermöglichen (Gruber,
2007) und so die Suchanfrage erweitern
bzw. eingrenzen. Im Sinne des multilin-
gualen Retrievals erleichtert der Einsatz
von mehrsprachigen maschinenlesbaren
Wörterbüchern den Zugriff auf fremd-
sprachige Dokumente.
Abbildung 13: Der Aufgaben-Algorithmus der
Tag-NLP.

Wir wollen kurz einen Blick zurück auf
die Abbildungen 5 und 8 werfen. Hier
gibt es zwei Möglichkeiten, den Einfluss
der Power Tags im Retrieval zu verstär-
ken: a) Im Fall einer Power Law-Vertei-
lung werden die ersten n Tags genutzt.
n wird hier – in Abhängigkeit von dem
Exponenten a – eher klein gehalten; bei
a = 1 bietet sich beispielsweise n = 4,
bei a = 2 etwa n = 2 an. b) Im Fall der
invers-logistischen Verteilung wählen
wir alle Tags des linken „Long Trunk“
bis zum Wendepunkt der Kurve aus.
Es wäre wünschenswert, eine zusätz-
liche, optionale Retrievalfunktionalität
zu installieren, die nur Ergebnisse aus
Übereinstimmungen von Suchargument
Folksonomies
 59(2008)2, 77-90
und Power Tag erzielt („Power Tags
only“). Demnach würde das Beispiel in
Abbildung 4 nur mit den Tags politik
und bundestag gefunden werden. Alle
anderen Terme und Tags blieben un-
berücksichtigt. Wir erhoffen uns durch
das Angebot von Power Tags als Such-
option eine Verbesserung der Präzision
der Suchergebnisse. Begründen können
wir diese Vermutung durch das gegen-
läufige Verhältnis von Recall und Preci-
sion. Steigt das eine, fällt das andere. Im
Falle der Recherche ausschließlich nach
Power T ag s wird der R ecall da d er
gesamte dokumentspezifische „Lange
Schwanz“ abgeschnitten wird – dras-
tisch verkleinert.


Ein bislang noch weitgehend ungelöstes
Problem ist das Ranking von getaggten
Dokumenten, die man als Antwort auf
seine Suchanfrage erhält. Die Menge der
Dokumente, die man nach der NLP-Bear-
beitung bekommt, ist nämlich noch un-
sortiert.
Es gibt eine Patentanmeldung von
Yahoo! für Flickr, die sich mit diesem
Problem auseinandersetzt (Butterfield
et al., 2006). Für ein Ranking nach „In-
terestingness“ in Narrow Folksonomies
wurden fünf generelle Kriterien definiert:
1) die Zahl der Tags zu einem Dokument,
2) die Zahl der Nutzer, die ein Dokument
taggen, 3) die Zahl der Nutzer, die das
Dokument nach einer Suche erhalten, 4)
die Zeit (je älter desto weniger relevant)
und 5) die Relevanz der Tags. Zusätzlich
gibt es zwei weitere Rankingkriterien
f,,ür den „personalized interestingness
rank“, 6) Nutzerpräferenzen (z.B. Favo-
ritenlisten) und 7) der Wohnort des Nut-
zers. Beim Faktor der Zeit melden wir Be-
denken an. Es ist nicht notwendig, dass
ein Dokument im Laufe der Zeit stets
an Relevanz verliert. Dann wäre die Re-
levanz von, sagen wir, der „Mona Lisa“
heutzutage nahe Null, was Kunsthistori-
ker sehr wahrscheinlich bestreiten wür-
den. Butterfield et al. berücksichtigen u.
E. zu Recht die kollaborativen Aspekte,
die wir bei Web 2.0-Diensten vorfinden;
sie vernachlässigen jedoch insbesondere
altbekannte Retrievalmodelle wie bei-
spielsweise das Vektorraummodell oder
die Linktopologie. Auch sollte man kon-
krete Aktionen der Prosumer nicht außer
Acht lassen.
Für das Relevance Ranking der ge-
taggten Dokumente gibt es nämlich drei
Mengen von Faktoren:
n die (informationslinguistisch „gereinig-
ten“) Tags selbst,
n die Kollaboration in Web 2.0-Diensten,
n nutzer-spezifische Rankingkriterien
(siehe Abbildung 14).
Jede Faktorenmenge und auch jeder ein-
zelne Faktor kann zudem gewichtet wer-
den. Jeder einzelne der Faktoren führt
entweder zu einem Ansteigen (bei posi-
tiven Faktoren) oder zu einem Abfallen
(bei negativen Faktoren) des Retrieval-
statuswertes der Dokumente.
Set eins berücksichtigt die konkreten
Tags und bearbeitet sie für das Rele-
vance Ranking. Das Vektorraummodel
kann genutzt werden, um die Ähnlich-
keit zwischen Dokumenten zu bestim-
men (Stock, 2007a, Kap. 20). Die Dimensi-
onen sind dabei die verschiedenen Tags
in der Datenbank, der Wert der Dimen-
sion wird durch WDF*IDF bestimmt (1a).
Der WDF-Wert errechnet sich aus der
dokumentspezifischen Häufigkeit (freq)
eines bestimmten Tags t in Relation zur
Gesamthäufigkeit L aller Tags, die dem
jeweiligen Dokument d (auch u. U. mehr-
fach) zugeordnet worden sind:
WDF(t,d) = [ld (freq(d,t) + 1] / ld L.
Der IDF-Wert bezieht die Gewichtung
eines Tags t auf sein Vorkommen in der
gesamten Datenbank. Sei N die Mächtig-
keit der Menge aller Datensätze in der
Datenbank und n die Anzahl derjenigen
Dokumente, die mittels t indexiert wor-
den sind, so gilt:
IDF(t) = ld (N/n).
Die Dokumente werden durch Vektoren
abgebildet, und die Ähnlichkeit zwischen
Dokument und Suchfrage wird letztlich
durch den Cosinus (1b) bestimmt. Der
Wert des WDF hängt in Broad Folksono-
mies von der Anzahl der Index-Tags ab;
bei Narrow Folksonomies wird der WDF-
Wert dagegen durch die Zahl der Such-
Tags determiniert.
Es gibt Ansätze, die für
das Ranking einen modifi-
zierten PageRank einset-
zen. Das Motto heißt hier:
“The basic notion is that a
resource which is tagged
with important tags by im-
portant users becomes im-
portant itself” (Hotho, A.,
Jäschke, R., Schmitz, C., &
Stumme, G., 2006a, 417).
Jedoch ist diese Schlussfol-
gerung problematisch und
kann zu unbefriedigenden
Ergebnissen führen. Die
gleiche Studie stellt den
(bei BibSonomy eingesetz-
ten) FolkRank-Algorith-
mus vor, mit dem Ziel „to
focus the ranking around
the topics defined in the
preference vector“ (419).
Der FolkRank verfolgt die
Idee eines „Super-Posters“
oder „Super-Autors“, der
eine große Menge an Con-
tent veröffentlicht und damit ein Experte
(in einem bestimmten Bereich) zu sein
scheint (1c). Daher sollten Inhalte dieser
User beim Ranking von Suchergebnis-
sen höher gewertet werden (Hotho, A.,
Jäschke, R., Schmitz, C., & Stumme, G.,
2006a, 2006b). Abhängig von ihrer Häu-
figkeitsverteilung werden manche Tags
als Power Tags markiert (1d). Der WDF-
IDF-Gewichtungswert von Power Tags
kann mittels eines festzulegenden Fak-
tors f (f > 1) justiert werden.
Set zwei bezieht die aktive Zusammen-
arbeit der User als positive Faktoren
mit in das Ranking ein. So können die
Klick-Raten (2a) bezogen auf einzelne
Dokumente zum Ranking herangezogen
werden (Culliss, 1997). Für Jung, Herlo-
cker und Webster (2007) sind die Klick-
Raten ein implizites Relevance Feedback
in der Internetsuche; sie sind im hohen
Maße ein kollaborationsorientiertes Ran-
king-Kriterium im Sinne des Web 2.0.
Möglicherweise ist auch die Anzahl der
unterschiedlichen Nutzer, die ein Doku-
ment indexieren, ein sinnvoller Ranking-
Faktor (2b). Hoch frequentierte Diskussi-
onen auf der Basis gewisser Dokumente
verweisen auf Dokumente von hoher Be-
deutung für die Community. Die Zahl der
Kommentare zu einem Dokument (2c)
kann die Stellung im Ranking bestim-
men. Insbesondere Blogpostings, aber
auch andere Dokumente wie Bilder und
Videos, insofern auf diese Links verwei-
sen, bieten Potentiale für einen quanti-
tativen Ausdruck ihrer linktopologischen
Stellung entweder mittels des Kleinberg-
Algorithmus‘ (Kleinberg, 1999) oder des
PageRank (Brin & Page, 1998). Authori-
ties (Dokumente mit vielen In-Links) be-
finden sich im Zentrum des Interesses
von bestimmten Themen und sollten
daher höher gerankt werden.
Folksonomies
Abbildung 14: Kriterien für das Relevance Ranking von
getaggten Dokumenten.
59(2008)2, 77-90 
Das dritte Set der Rankingkriterien be-
zieht sich auf den Nutzer selbst. Doku-
mente, die mit todo oder toread getaggt
sind, scheinen sehr wichtig für den Nut-
zer zu sein und sollten daher ihre Stel-
lung im Ranking erhöhen (3a). Negative
Werturteile (wie z.B. stupid) führen – ab-
hängig von der Häufigkeit ihres doku-
mentspezifischen Vorkommens – zu einer
Senkung des Retrievalstatuswertes. Man
kann auch den Nutzer aktiv am Ranking
beteiligen und ihm die Gelegenheit zum
Feedback geben. Das kann auf zweifache
Weise geschehen: (3b) das Relevance
Feedback geschieht nach der Anzeige
und Bewertung der Suchergebnisse (z.B.
Rocchio, 1971) oder (3c) mittels eines for-
malen Recommendersystems, wie es z.B.
in einer Sternchen-Bewertung oder mit-
tels eines Frage-Dialogs nach dem Stil
„Hat Ihnen dieses Dokument geholfen?“
gegeben ist. Der User bekommt die Gele-
genheit, das Dokument zu bewerten und
so aktiv an der Bestimmung des jewei-
ligen Retrievalstatuswertes mitzuwirken
– ein demokratischer Weg des Relevance
Ranking. Beide Faktoren (3b und 3c) kön-
nen in das Ranking einfließen; einmal
implizit als Gewichtungsfaktor für den
Retrievalstatuswert und einmal explizit
(„Andere Nutzer fanden dieses Doku-
ment sehr hilfreich“ oder „Das Dokument
erhält 5 von 6 Relevanzpunkten“). Beide
Möglichkeiten haben u. W. bis jetzt noch
keinen Eingang in die Web 2.0-Dienste
gefunden.
Aus Nutzersicht wichtig ist bei solch aus-
gefeilten Rankingalgorithmen, dass er
sie ganz oder teilweise abschalten kann.
Ein Drop-Down-Menü scheint eine opti-
male Vorgehensweise, um die Nutzer in
die Einstellung der Rankingfaktoren der
Suchresultate einzubeziehen. Er selbst
kann entscheiden, nach welchen Krite-
rien er die Ergebnisse sortieren möchte.
Vielleicht möchte ein User lieber nach
formalen Kriterien (Veröffentlichungs-
zeitpunkt, Autor usw.) sortieren oder er
bevorzugt aus unserem Werkzeugkas-
ten für Relevance Ranking nur ganz be-
stimmte Kriterien.



Innerhalb einer Folksonomy sind wir mit
drei unterschiedlichen Aspekten konfron-
tiert (Marlow, Naaman, Boyd, & Davis,
2006; Yeung, Gibbins, & Shadbolt, 2008):
n die zu beschreibenden Dokumente,
n die Tags (Worte), die zur Beschreibung
gewählt werden,
n die Nutzer (Prosumer), die die Indexie-
rung ausführen.
Nutzer untereinander sowie Dokumente
untereinander sind in einem sozialen
Netzwerk miteinander verknüpft, wobei
als Pfade jeweils die Tags fungieren.
Dokumente sind erstens thematisch mit-
einander verbunden, wenn sie durch die-
selben Tags indexiert worden sind. Die
Dokumente 1 und 2 sowie 3 und 4 aus
Abbildung 15 sind jeweils thematisch
verknüpft (Dokumente 1 und 2 über Tag
2; Dokumente 3
und 4 über Tag
4). Zusätzlich
sind Dokumente
zweitens über
gemeinsame Nut-
zer verknüpft. So
sind die Doku-
mente 1 und 2, 3
und 4, aber auch
2 und 4 über
ihre Nutzer ver-
knüpft.
Nutzer sind mit-
einander ver-
knüpft, wenn
sie entweder
dieselben Tags
verwenden oder
dieselben Dokumente indexieren. Nut-
zer sind thematisch verbunden, wenn sie
dieselben Tags verwenden (im Beispiel
die Nutzer 1 und 2 über Tags 1 und 2);
sie sind über gemeinsame Dokumente ge-
koppelt, wenn sie diese jeweils inhaltlich
beschreiben (Nutzer 1, 2 und 3 über Do-
kument 2).
Wir wollen diese Zusammenhänge aus-
nutzen, um auf der Basis der Stellung
eines Tags, eines Nutzers und eines Do-
kuments im Netzwerk automatisch Vor-
schläge zu generieren (Diederich & Iof-
ciu, 2006; Höhfeld & Kwiatkowski, 2007,
272 f.). Unsere Ausführungen konzen-
trieren sich auf Empfehlungen ähnlicher
Dokumente (ausgehend von einem Mus-
terdokument: „More like this!“) sowie
von ähnlichen Nutzern (ausgehend von
einem bestimmten Nutzer, beispielweise
sich selbst: „More like me!“), da beide
Vorschläge über recht einfache Algorith-
men auf der Basis von Co-Occurences ar-
beiten.
Möchte man durch die Empfehlungen
weiterer Tags dem Nutzer Synonyme und
Quasi-Synonyme an die Hand geben, so
eignen sich Co-Occurences nicht, denn
Synonyme kommen selten gemeinsam
syntagmatisch verbunden als Tags vor
(ein User, der sein Bild mit Hochzeit in-
dexiert hat, wird dieses kaum zusätzlich
mit Eheschließung und Heirat beschrei-
ben). Hier sind andere Algorithmen ge-
fordert. Der Fall wird genau dann leicht,
wenn wir auf eine Begriffsordnung (wie
beispielsweise WordNet) zurückgreifen
können, da dann die Empfehlungen aus
den dort eingetragenen Synonymen ge-
bildet werden.
Der erste Schritt bei Empfehlungen
von Dokumenten und Nutzern besteht
darin, Ähnlichkeiten zwischen dem Aus-
gangsdokument bzw. -nutzer und allen
anderen Dokumenten (Nutzern) der Da-
tenbank zu berechnen. Dazu kommen
einschlägige Algorithmen wie Jaccard-
Sneath, Dice oder Cosinus infrage (Stock
& Stock, 2008, Kap. 20). Möchte man eine
Community (also ähnliche Nutzer), aus-
gehend von Nutzer 1, identifizieren, so
errechnet man nach Jaccard-Sneath
Ähnlichkeit (Nutzer 1, Nutzer i) =
g / (a + b – g).
Die Formel findet zweifach Anwendung:
1) a ist die Anzahl der Tags, die Nutzer 1
vergeben hat, b die Anzahl der Tags, die
Nutzer i zum Indexieren heranzog und g
ist die Anzahl derjenigen Tags, die die
beiden Nutzer gemeinsam verwenden;
2) a ist nunmehr die Anzahl der Doku-
mente, die Nutzer 1 ausgewertet hat, b
die Anzahl der von Nutzer i indexierten
Dokumente und g die Zahl der von bei-
den beschriebenen Dokumente.
Der zweite Schritt besteht entweder
in einer einfachen oder in einer elabo-
rierteren Vorgehensweise. Der einfache
Weg fasst – in der Reihenfolge der bei-
den errechneten Ähnlichkeiten – die je-
weils ersten k Dokumente bzw. Nutzer
(k kann auf etwa 20 eingestellt werden)
zu einer Quasiklasse zusammen (Me-
thode der k-nearest neighbors). Ein auf-
wändigerer zweiter Weg arbeitet mit der
Clusteranalyse (z.B. Single Linkage oder
Complete Linkage) oder vergleichbaren
Verfahren. Auch hier erhalten wir Qua-
siklassen – nun jedoch möglicherweise
mehrere und diese ggf. in einer hierar-
chischen Ordnung. Dem Nutzer werden
die Quasiklassen als ähnliche Doku-
mente bzw. als ähnliche Nutzer (oder als
„seine“ Community) vorgeschlagen.
Es gibt bisher nur sehr wenige empirische
Studien zum Einsatz von Recommenta-
tion bei Folksonomies. Erwähnenswert ist
die Untersuchung von Jäschke, Marinho,
Hotho, Schmidt-Thieme und Stumme
(2007), die die Wirkung von vorgeschla-
genen Suchtags auf die Retrievalleistung
(anhand von BibSonomy und dem Mu-
Abbildung 15: Dokumente, Tags und Nutzer in einer Folksonomy.
Folksonomies
 59(2008)2, 77-90
sikdienst Last.fm) untersuchten. Der Re-
call-Precision-Graph zeigt durchgehend
Steigerungen der Retrievalqualität beim
Einsatz von Recommendation-Methoden.

Folksonomies haben in informationswis-
senschaftlicher Sicht sowohl Vorteile
(authentische Sprache der Nutzer, Ver-
einigung unterschiedlicher Sichtweisen
auf ein Dokument, Quelle für die Ent-
wicklung kontrollierter Vokabularien,
Ermöglichung von Suchen und Browsen,
Identifikation von Communities usw.)
als auch Nachteile (Mangel an Präzision,
unterschiedliche Indexierungsebenen,
Vermischung von Sprachen, versteckte
paradigmatische Relationen, Spam-Tags,
nutzerspezifische Tags und andere un-
brauchbare Terme, Verschmelzung der
semantischen Ebenen bei Bildern und
Videos). Da die Vorteile überwiegen,
müssen wir dafür Sorge tragen, dass die
Nachteile möglichst minimiert werden.
Ein erster Schritt der Problemlösung ist
die Behandlung der Tags als natürlich-
sprachige Eingaben, auf die (bekannte
wie neue) Methoden der Informations-
linguistik (Natural Language Processing)
angewandt werden. Damit sollten sich
zumindest Tags unterschiedlicher Spra-
chen trennen, die Tags auf Grund- oder
Stammformen bringen sowie Eingabe-
fehler korrigieren lassen. Über die Kopp-
lung der Folksonomies mit kontrollierten
Vokabularien sollten – in einem gewissen
Maße – Homonyme getrennt und Syno-
nyme zusammengeführt werden; ebenso
können die semantischen Relationen der
eingesetzten Wissensordnungen (z.B. die
Hierarchien) bei der Recherche nutzbar
werden. Liegen maschinenlesbare Wör-
terbücher vor, wird auch multilinguales
Retrieval möglich.
Eine große Herausforderung ist die Kre-
ation passender Algorithmen des Rele-
vance Ranking. Hier sehen wir drei Kri-
terienbündel, die Berücksichtigung fin-
den müssen: die (via NLP „gereinigten“)
Tags selbst (WDF*IDF, Vektorraummo-
dell, Berücksichtigung von Super-Pos-
tern sowie von Power Tags), Merkmale
der Kollaboration (Klickraten, Anzahl der
indexierenden Nutzer, Anzahl der Kom-
mentare und linktopologische Ansätze
bei verlinkten Dokumenten) sowie As-
pekte der Prosumer (Performative, Rele-
vance Feedback, formale Bewertungen).
Ein neues Suchfeld nach Nur Power Tags
verringert den Ballast und steigert somit
die Präzision der Suchresultate.
Über Ähnlichkeitsberechnungen und
den Einsatz von Clusteranalyse oder
verwandter Verfahren erhalten wir Algo-
rithmen, um sowohl ähnliche Dokumente
(„More like this!“) zu finden als auch um
ähnliche Nutzer („More like me!“) und
damit Communities zu identifizieren.
Das Forschungsgebiet der Folksonomies
ist noch sehr jung. Teilweise haben wir
außer Ansätzen noch nicht viel Kon-
kretes an brauchbaren (d.h. in Informa-
tionsdiensten praktisch anwendbaren)
Resultaten vorzuweisen. Wir sehen fol-
gende offenen Forschungsfragen:
n Bisher nicht untersucht sind die Such-
Tags. Insbesondere bei Narrow Folk-
sonomies brauchen wir diese jedoch,
um Tagverteilungen herzustellen und
– soweit dort auch vorhanden – Power
Tags zu identifizieren.
n Wir wissen, dass viele Tagvertei-
lungen bei Broad Folksonomies dem
Power Law folgen; wir wissen aber
auch, dass dies nicht auf alle doku-
mentspezifischen Tagverteilungen
zutrifft. Wie groß sind die Anteile der
Tagverteilungen auf der Mikroebene,
die dem Power Law und die der in-
vers-logistischen Kurve folgen? Gibt
es darüber hinaus weitere Vertei-
lungsformen?
n Das Entstehen einer Power-Law-Ver-
teilung ist durch den Yule-Simon-An-
satz theoretisch zu fassen. Wie erklä-
ren wir aber die Entwicklung einer
invers-logistischen Verteilung?
n In Web 2.0-Diensten werden häufig
Bilder und Videos indexiert. Wir haben
als Problem die Verschmelzung der
semantischen Ebenen bei der Indexie-
rung durch Tags (Ofness, Aboutness,
Ikonologie, Isness) markiert. Des Wei-
teren kennen wir die Inter-Indexer-In-
konsistenz bei der Indexierung solcher
Dokumente. Eine Lösung können wir
nicht bieten.
Folksonomies
59(2008)2, 77-90 
Helfen Sie anderen, die
bedeutendsten digitalen
Sammlungen der Welt zu
entdecken – Ihre eigenen
CONTENTdm—Digital Collection Management Software
Werden Sie Teil einer aktiven Anwendergemeinschaft mit einem gemeinsamen Ziel:
wichtige Bestände, Sammlungen und Kulturschätze zu digitalisieren und einem
breiten Publikum zugänglich zu machen.
CONTENTdm bietet die vollständige Lösung zur Speicherung, Verwaltung, Selektion
und Internet-Präsentation Ihrer digitalen Sammlungen.
Mit CONTENTdm generieren Sie aus Ihren Spezialsammlungen vollständig suchbare
Online-Ressourcen, auf die von jedem Browser aus zugegriffen werden kann.
CONTENTdm—digital collection management software
Grünwalder Weg 28g
82041 Oberhaching, Deutschland
T+49-(0)89-613 08 300
F+49-(0)89-613 08 399
E deutschland@oclc.org
www.oclc.org
n Unsere Lösungsoptionen für die Män-
gel bei Tags beruhen auf informati-
onslinguistischen Ansätzen. Können
wir uns in der Tat auf die Behandlung
von Substantiven und Adjektiven be-
schränken und Verben außer acht las-
sen? Wie häufig kommen Verben über-
haupt als Tags vor?
n In den dokumentspezifischen Inde-
xaten sind paradigmatische Relati-
onen „versteckt“. Wie lassen sich die
versteckten semantischen Relationen
aufdecken?
n Bislang setzt kein System durchge-
hend NLP zur Bearbeitung von Tags
ein. Entsprechend fehlen Erfahrungen
mit informationslinguistisch bearbeite-
ten Tags.
n Wir behaupteten, dass die Retrieval-
option „Power Tags only“ Verbesse-
rungen der Retrievalqualität in Form
einer Steigerung der Precision mit sich
bringt. Hier fehlt noch jede empirische
Bestätigung.
n Der vorgestellte Werkzeugkasten für
Kriterien des Relevance Ranking für
getaggte Dokumente ist ein erster
Vorschlag, Algorithmen klassischer
Retrievalmodelle mit den Gegeben-
heiten der Web 2.0-Dienste (Kollabo-
ration, Prosumer) zu verbinden. Hier
fehlt nicht nur die technische Umset-
zung, sondern auch – im Anschluss
daran – deren Evaluation.
n Nach welchen Algorithmen kann man
Nutzern ähnliche Tags (vor allem Syn-
onyme und Quasi-Synonyme ihrer ur-
sprünglichen Suchterme) vorschlagen,
wenn keine Begriffsordnung einsetz-
bar ist?
n Eignen sich Verfahren nach k-nearest
neighbors oder nach der Clustera-
nalyse für die Identifikation von ähn-
lichen Dokumenten und von Commu-
nities? Werden sie von den Nutzern
angenommen?

Al-Khalifa, H.S. (2007). Automatic Documet-Level
Semantic Metadata Annotation Using Folksono-
mies and Domain Ontologies. PhD-Thesis. Uni-
versity of Southampton / School of Electronics
and Computer Science.
Al-Khalifa, H.S., & Davis, H.C. (2007). Exploring
the value of folksonomies for creating semantic
metadata. International Journal on Semantic Web
and Information Systems 3(2007)1, 12-38.
Aurnhammer, M., Hanappe, P., & Steels, L. (2006).
Augmenting navigation for collaborative tagging
with emergent semantics. Lecture Notes in Com-
puter Science 4273, 58-71.
Bar-Ilan, J., Shoham, S., Idan, A., Miller, Y, &
Shachak, A. (2006). Structured vs. unstructured
tagging – A case study. In: Proceedings of the
15th International WWW Conference. Collabora-
tive Web Tagging Workshop.
Beaudoin, J. (2007). Flickr image tagging: Pat-
terns made visible. Bulletin of the American
Society for Information Science and Technology
34(2007)1, 26-29.
Brin, S., & Page, L. (1998). The anatomy of a large-
scale hypertextual Web search engine. Computer
Networks and ISDN Systems, 30, 107-117.
Brooks, C.H., & Montanez, N. (2006a). An analysis
of the effectiveness of tagging in blogs. In: Nico-
lov, N., Salvetti, F., Liberman, M., & Martin, J.H.
(eds.): Computation Approaches to Analyzing
Weblogs. Papers from the 2006 AAAI Spring Sym-
posium (S. 9-15). Menlo Park, Cal: AAAI Press.
(Technical Report SS-06-03. American Association
for Artificial Intelligence).
Brooks, C.H., & Montanez, N. (2006b). Improved
annotation of the blogosphere via autotagging
and hierarchical clustering. In: Proceedings of the
15th International World Wide Web Conference
(S. 625-632). New York: ACM.
Butterfield, D.S., Costello, E., Fake, C., Henderson-
Begg, C.J., & Mourachow, S. (2006). Interesting-
ness ranking of media objects. Patentanmeldung
Nr. US 2006/0242139 A1. Eingereicht: 8.2.2006.
Publiziert: 26.10.2006.
Butterfield, D.S., Costello, E., Fake, C., Hender-
son-Begg, C.J., Mourachow, S., & Schachter, J.E.
(2006). Media object metadata association and
ranking. Patentanmeldung Nr. US 2006/0242178
A1. Eingereicht: 8.2.2006. Publiziert: 26.10.2006.
Campbell, D.G. (2006). A phenomenological fra-
mework for the relationship between the se-
mantic Web and user-centered tagging systems.
In: 17th ASIS&T SIG/CR Classification Research
Workshop.
Capocci, A., & Caldarelli (2007). Folksonomies and
clustering in the collaborative system CiteULike.
(arXiv:0710.2835v2).
Carlin, S.A. (2007): Social Tagging. Schlagwort-
vergabe durch User als Hilfsmittel zur Suche im
Web. Ansatz, Modelle, Realisierungen. – Boizen-
burg: vwh.
Cattuto, C (2006). Semiotic dynamics in online
social communities. European Physical Journal C
46(2006)Suppl. 2, 33-37.
Cattuto, C., Loreto, V., & Pietronero, L. (2007).
Semiotic dynamics and collaborative tagging.
Proceedings of the National Academy of Sciences
of the United States of America 104(2007)5, 1461-
1464.
Christiaens, S. (2006). Metadata mechanisms:
From ontology to folksonomy … and back. Lec-
ture Notes in Computer Science 4277, 199-207.
Culliss, G.A. (1997). Method for organizing infor-
mation. Patent-No. US 6.006.222. Granted: Dec.
21, 1999. Applied: Jan. 8, 1997.
Diederich, J., & Iofciu, T. (2006). Finding com-
munities of practice from user profiles based on
folksonomies. In Proceedings of the 1st Internatio-
nal Workshop on Building Technology Enhanced
Learning Solutions for Communities of Practice
(TEL-CoPs‘06).
Dye, J. (2006). Folksonomy: A game of high-tech
(and high-stakes) tag. E-Content 29(2006)3, 38-
43.
Egghe, L. (2005). Power Laws in the Information
Production Process: Lotkaian Informetrics. Ams-
terdam: Elsevier Academic Press.
Egghe, L., & Rousseau, R. (1990). Introduction to
Informetrics. Amsterdam: Elsevier.
Fichter, D. (2006). Intranet applications for tag-
ging and folksonomies. Online 30(2006)3, 43-45.
Fidel, R. (2006). An ecological approach to the de-
sign of information systems. Bulletin of the Ame-
rican Society for Information Science and Techno-
logy 33(2006)1, 6-8.
Furnas, G.W., Fake, C., von Ahn, L., Schachter, J.,
Golder, S., Fox, K., Davis, M., Marlow, C., & Naa-
man, M. (2006). Why do tagging systems work?
In: CHI ‚06 Extended Abstracts on Human Fac-
tors in Computing Systems (S. 36-39). New York:
ACM.
Gendarmi, D., & Lanubile, F. (2006). Community-
driven ontology evolution based on folksonomies.
Lecture Notes in Computer Science, 4277, 181-
188.
Golder, S.A., & Huberman, B.A. (2006). Usage pat-
terns of collaborative tagging systems. Journal of
Information Science 32(2006)2, 198-208.
Gordon-Murnane, L. (2006). Social bookmarking,
folksonomies, and Web 2.0 tools. Searcher - The
Magazine for Database Professionals 14(2006)6,
26-38.
Grahl, M., Hotho, A., & Stumme, G. (2007). Con-
ceptual clustering of social bookmarking sites. In:
Proceedings of I-KNOW ‚07, Graz, Austria, Sep-
tember 5-7, 2007 (S. 356-264).
Gruber, T. (2006). Where the social Web meets
the semantic Web. Lecture Notes in Computer
Science 4273, 994.
Gruber, T. (2007). Ontology of folksonomy: A
mash-up of apples and oranges. International
Journal on Web Semantics and Information Sys-
tems 3(2007)1, 1-11.
Guy, M., & Tonkin, E. (2006). Folksonomies: Tidy-
ing up tags? D-Lib Magazine 12(2006)1.
Hänger, C., & Krätzsch, C. (2007). Collaborative
Tagging als Service von Hochschulbibliotheken.
In: Ball, R. (Hrsg.): Wissenschaftskommunikation
der Zukunft. 4. Konferenz der Zentralbibliothek
Forschungszentrum Jülich (S. 123-134). Jülich:
Forschungszentrum Jülich GmbH / Zentralbibli-
othek.
Hammond, T., Hannay, T., Lund, B., & Scott, J.
(2005). Social bookmarking tools. A general re-
view. Part 1. D-Lib Magazine, 12(1).
Heller, L. (2007). Bibliographie und Sacherschlie-
ßung in der Hand vernetzter Informationsbenut-
zer. Bibliothek, 31(2), 162-172.
Herget, J., & Hierl, S. (2007). Top down versus
bottom up: Knowledge representation in transi-
tion. From controlled vocabulary to folksonomies.
In: Proceedings of the 2nd International CODATA
Symposium on Generalization of Information (S.
150-157).
Heymann, P., & Garcia-Molina, H. (2006). Collabo-
rative creation of communal hierarchical taxono-
mies in social tagging system. InfoLab Technical
Report; 2006-10. Stanford: Stanford University /
Computer Science Dept.
Höhfeld, S., & Kwiatkowski, M. (2007). Empfeh-
lungssysteme aus informationswissenschaftlicher
Sicht – State of the Art. Information – Wissen-
schaft und Praxis 58(2007)5, 265-276.
Hotho, A., Jäschke, R., Schmitz, C., & Stumme,
G. (2006a). Information retrieval in folksonomies:
Search and ranking. Lecture Notes in Computer
Science 4011, 411-426.
Hotho, A., Jäschke, R., Schmitz, C., & Stumme, G.
(2006b). Trend detection in folksonomies. Lecture
Notes in Computer Science, 4306, 56-70.
Hotho, A., Jäschke, R., Schmitz, C., & Stumme, G.
(2006c). BibSonomy: A social bookmark and publi-
cation system. In: Proceedings of the Conceptual
Structure Tool Interoperability Workshop at the
14t h International Conference on Conceptual
Structures.
Huang, H. (2006). Tag distribution analysis
using the power law to evaluate social tag-
ging systems: A case study in the Flickr da-
tabase. In 17th ASIS&T SIG/CR Classification
Research Workshop. Abstracts of Posters (S.
14-15).
Ingwersen, P. (2002). Cognitive perspectives of
document representation. In: CoLIS 4: 4th Inter-
national Conference on Conceptions of Library
and Information Science (S. 285-300). Greenwood
Village: Libraries Unlimited.
Jäschke, R., Marinho, L., Hotho, A., Schmidt-
Thieme, L., & Stumme, G. (2007). Tag recommen-
dations in folksonomies. Lecture Notes in Artifi-
cial Intelligence 4702, 506-514.
Jung, S., Herlocker, J.L., & Webster, J. (2007).
Click data as implicit relevance feedback in web
Folksonomies
 59(2008)2, 77-90
search. Information Processing & Management,
43, 791-807.
Kim, H.G., Hwang, S.H., Kang, Y.K., Kim, H.L.,
& Yang, H.S. (2007). An agent environment for
contextualizing folksonomies in a triadic context.
Lecture Notes in Computer Science 4496, 728-
737.
Kim, H.L., Hwang, S.H., & Kim, H.G. (2007). FCA-
based approach for mining contextualized folkso-
nomy. In: Proceedings of the 2007 ACM Sympo-
sium on Applied Computing (S. 1340-1345). New
York: ACM.
Kipp, M.E.I. (2006a). @toread and cool: Tagging
for time, task and emotion. In: 17th ASIS&T SIG/
CR Classification Research Workshop. Abstracts
of Posters (S. 16-17).
Kipp, M.E.I. (2006b). Complementary or discrete
contexts in online indexing: A comparison of
user, creator and intermediary keywords. Cana-
dian Journal of Information and Library Science
30(2006)3, in prep.
Kipp, M.E.I. (2007). Tagging for health informa-
tion organisation and retrieval. In: Proceedings of
the North American Symposium on Knowledge
Organization, vol. 1 (S. 63-74).
Kipp, M.E.I., & Campbell, D.G. (2006). Patterns
and inconsistencies in collaborative tagging sys-
tems: An examination of tagging practices. In:
Proceedings of the 69th Annual Meeting of the
American Society for Information Science & Tech-
nology (Vol. 43), Austin, TX (CD-ROM).
Kleinberg, J. (1999). Authoritative sources in a
hyperlinked environment. Journal of the ACM
46(1999)5, 604-632.
Kolbitsch, J. (2007a). Aspects of Digital Libraries.
Diss. TU Graz.
Kolbitsch, J. (2007b). WordFlickr: A solution to the
vocabulary problem in social tagging systems. In:
Proceedings of I-MEDIA ‚07 and I-SEMANTICS
‚07. Graz, Austria, September 5-7, 2007 (S. 77-84).
Kroski, E. (2005). The Hive Mind: Folksono-
mies and user-based tagging. [Blog post; 2005-
12-07]. Online: http://infotangle.blogsome.
com/2005/12/07/the-hive-mind-folksonomies-and-
user-based-tagging.
Lancaster, F.W. (2003). Indexing and Abstracting
in Theory and Practice. Champaign: University of
Illinois. 3rd ed.
Laniado, D., Eynard, D., & Colombetti, M. (2007).
A semantic tool to support navigation in a folk-
sonomy. In: Proceedings of the 18th Conference
on Hypertext and Hypermedia (S. 153-154). New
York: ACM.
Layne, S. (2002). Subject access to art images. In:
Baca, M. (ed.): Introduction to Art Image Access
(S. 1-19). Los Angeles: Getty Research Institute.
Lin, X., Beaudoin, J.E., Bui, Y., & Desai, K. (2006).
Exploring characteristics of social classification.
In: 17th ASIS&T SIG/CR Classification Research
Workshop.
Lüth, J. (2007). Inhaltserschließung durch Nut-
zerinnen und Nutzer. Ergebnisse eines Tests
mit Internetquellen der virtuellen Fachbib-
liothek EconBiz. In: Ockenfeld, M. (Hrsg.): In-
formation in Wissenschaft, Bildung und Wirt-
schaft. 29. Online-Tagung der DGI. 59. Jah-
restagung der DGI (S. 113-120). Frankfurt am
Main: DGI.
Lund, B., Hammond, T., Flack, M., & Hannay, T.
(2005). Social bookmarking tools (II). A case study
– Connotea. D-Lib Magazine, 11(2005)4.
Lux, M., Granitzer, M. & Kern, R. (2007). Aspects
of broad folksonomies. In: Proceedings of the 18th
International Conference on Database and Expert
Systems Applications (DEXA 2007) (S. 283-287).
Washington, DC: IEEE Computer Society.
Macgregor, G., & McCulloch, E. (2006). Collabora-
tive tagging as a knowledge organisation and re-
source discovery tool. Library Review 55(2006)5,
291-300.
MacLaurin, M.B. (2005). Selection-based item tag-
ging. Patentanmeldung Nr. US 2007/0028171 A1.
Eingereicht: 29.7.2005. Publiziert: 1.2.2007.
Mai, J.M. (2006). Contextual analysis for the de-
sign of controlled vocabularies. Bulletin of the
American Society for Information Science and
Technology 33(2006)1, 17-19.
Markey, K. (1986). Subject Access to Visual Re-
source Collections. Westport: Greenwood.
Markkula, M., & Sormunen, E. (2000). End-user
searching challenges indexing practices in the
digital newspaper photo archive. Information Re-
trieval 1(2000), 259-285.
Marlow, C., Naaman, M., Boyd, D., & Davis, M.
(2006). HT06, tagging paper, taxonomy, Flickr,
academic article, to read. In: Proceedings of the
17th Conference on Hypertext and Hypermedia
(S. 31-40). New York: ACM.
Mathes, A. (2004). Folksonomies Coopera-
tive Classification and Communication Through
Shared Metadata. Urbana, Ill.: University of Illi-
nois Urbana-Campaign / Graduate School of Lib-
rary and Information Science.
McFedries, P. (2006). Folk wisdom. IEEE Spec-
trum, 43(2006)Febr., 80.
Merholz, P. (2004). Metadata for the masses. [Blog
post, 2004-10-19]. Online: www.adaptivepath.
com/publications/essays/archives/000361.php.
Mika, P. (2005). Ontologies are us: A unified
model of social networks and semantics. Lecture
Notes in Computer Science 3729, 522-536.
Millen, D.R., Feinberg, J., & Kerr, B. (2006). DO-
GEAR. Social bookmarking in the enterprise. In:
Proceedings of the SIGCHI Conference on Human
Factors in Computing Systems (S. 111-120). New
York: ACM.
Miller, G.A. (1998). Nouns in WordNet. In Fell-
baum, C. (ed.), WordNet. An Electronic Lexical
Database (S. 23-46). Cambridge, Mass., London:
MIT Press.
Müller-Prove, M. (2007). Taxonomien und Folk-
sonomien – Tagging als neues HCI-Element. In
i-com, 6(1), 14-18.
Morrison, P.J. (2007). Why are they tagging, and
why do we want them to? Bulletin of the Ameri-
can Society for Information Science and Techno-
logy 34(2007)1, 12-15.
Munk, T.B., & Mork, K. (2007). Folksonomy, the
power law and the significance of the least effort.
Knowledge Organization 34(2007)1, 16-33.
Murison, J. (2005). Messageboard topic tagging:
User tagging of collectively owned community
content. In: Proceedings of the 2005 Conference
on Designing for User eXperience (art. no 5).
New York: American Institute of Graphic Art.
Neal, D. (2007). Folksonomies and image tagging:
Seeing the future? Bulletin of the American So-
ciety for Information Science and Technology
34(2007)1, 7-11.
Niwa, S., Doi, T., & Honiden, S. (2006). Web page
recommender systems based on folksonomy
mining for ITNG ‚06 submissions. In: Third Con-
ference on Information Technology: New Genera-
tion (ITNG‘06) (S. 388-393). Washington, DC: IEEE
Computer Society.
Noruzi, A. (2006). Folksonomies: (un)controlled
vocabulary? Knowledge Organization 33(2006)4,
199-203.
Noruzi, A. (2007). Folksonomies: Why do we need
controlled vocabulary? Webology 4(2), editorial
12.
O‘Reilly, T. (2005). What is Web 2.0. Design pat-
terns and business models for the next genera-
tion of software. Online: www.oreillynet.com/
pub/a/oreilly/tim/news/2005/09/30/what-is-web-
20.html.
Ornager, S. (1995). The newspaper image da-
tabase. Empirical supported analysis of users‘
typology and word association clusters. In: Pro-
ceedings of the 18th Annual International ACM
SIGIR Conference on Research and Development
in Information Retrieval (S. 212-218). New York:
ACM.
Ott, E.S. (2006). Picture tagging. Patentanmel-
dung Nr. US 2007/0079321 A1. Eingereicht:
17.2.2006. Publiziert: 5.4.2007.
Panofsky, E. (1975) Sinn und Deutung in der bil-
denden Kunst. Köln: DuMont.
Panofsky, E. (2006). Ikonographie und Ikonologie.
Köln: DuMont.
Paolillo, J.C., & Penumarty, S. (2007). The social
structure of tagging internet videos on del.icio.
us. In: Proceedings of the 40th Hawaii Internatio-
nal Conference on System Sciences.
Peters, I. (2006a). Inhaltserschließung von Blogs
und Podcasts im betrieblichen Wissensmanage-
ment. In Ockenfeld, M. (Hrsg.): Content. 28. On-
line-Tagung der DGI, 58. Jahrestagung der DGI.
Proceedings (S. 143-151). Frankfurt am Main: DGI.
Peters, I. (2006b). Against folksonomies: Inde-
xing blogs and podcasts for corporate knowledge
management. In: Jezzard, H. (ed.): Preparing for
Information 2.0. Online Information 2006. Procee-
dings (S. 93-97). London: Learned Information
Europe.
Peters, I. (2007). Web 2.0 und Fachinformation.
Folksonomies im Web 2.0. Password 22(2007)5,
10-11.
Peters, I. (2008). ASIS&T Annual Meeting 2007:
Milwaukee, Wisconsin. Joining Research and
Practice: Social Computing and Information Sci-
ence. Password 23(2008)1, 16-19.
Peters, I., & Stock, W.G. (2006). Corporate Blogs
im Wissensmanagement. Wissensmanagement
8(2006)6, 40-41.
Peters, I., & Stock, W.G. (2007a): Web 2.0 im Un-
ternehmen. Wissensmanagement 9(2007)4 22-25.
Peters, I., & Stock, W.G. (2007b): Folksonomy
and information retrieval. In: Proceedings of the
70th Annual Meeting of the American Society for
Information Science and Technology Vol. 45 (S.
1510-1542). (CD-ROM).
Peters, I., & Weller, K. (2008). Paradigmatic and
syntagmatic relations in knowledge organization
systems. Information – Wissenschaft und Praxis,
59(2008)2, 100-107.
Peterson, E. (2006). Beneath the metadata. Some
philosophical problems with folksonomies. D-Lib
Magazine 12(2006)11.
Pluzhenskaia, M. (2006). Folksonomies or faux-
sonomies: How social is social bookmarking?
In: 17th ASIS&T SIG/CR Classification Research
Workshop. Abstracts of Posters (S. 23-24).
Quintarelli, E. (2005). Folksonomies: Power to the
people. Paper presented at the ISKO Italy UniMIB
meeting, Milan, June 24, 2005.
Rasmussen, E.M. (1997): Indexing images. Annual
Review of Information Science and Technology
32, 169-196.
Reamy, T. (2006). Folksonomies and complexity
theory: Evolved information structures. In: Jez-
zard, H. (ed.): Preparing for Information 2.0. On-
line Information 2006. Proceedings (S. 111-113).
London: Learned Information Europe.
Rocchio, J.J. (1971). Relevance feedback in infor-
mation retrieval. In: Salton, G. (ed.): The SMART
Retrieval System – Experiments in Automatic Do-
cument Processing (S. 313-323). Englewood Ciffs,
N.J.: Prentice Hall.
Russell, T. (2006). Cloudalicious: Folksonomy
over time. In: Proceedings of the 6th ACM/IEEE-
CS Joint Conference on Digital Libraries (S. 364).
New York: ACM.
Schmitz, C., Hotho, A., Jäschke, R., & Stumme, G.
(2006). Mining association rules in folksonomies.
In: Batagelj, V., Bock, H.H., Ferligoj, & Žiberna,
A. (eds.): Data Science and Classification (S. 261-
270). Berlin, Heidelberg: Springer.
Folksonomies
59(2008)2, 77-90 
Schmitz, P. (2006). Inducing ontology from Flickr
tags. In: Proceedings of the 15th International
WWW Conference. Collaborative Web Tagging
Workshop.
Shatfort, S. (1986). Analyzing the subject of a pic-
ture. A theoretical approach. Cataloguing and
Classification Quarterly 6(1986)3, 39-62.
Shirky, C. (2004). Folksonomy. [Blog post; 2004-
08-24]. Online: http://many.corante.com/ar-
chives/2004/08/25/folksonomy.php
Shirky, C. (2005). Ontology is overrated: Catego-
ries, Links, and Tags. www.shirky.com/writings/
ontology_overrated.html.
Sinclair, J., & Cardew-Hall, M. (2008). The folk-
sonomy tag cloud: When is it useful? Journal of
Information Science 34(2008)1, 15-29.
Smith, G. (2004). Folksonomy: Social classifica-
tion. [Blog post; 2004-08-03]. http://atomiq.org/
archives/2004/08/folksonomy_social_classifica-
tion.html.
Smith, M.K. (2006). Viewer tagging in art mu-
seum: Comparisons to concepts and vocabularies
of art museum visitors. In: 17th ASIS&T SIG/CR
Classification Research Workshop.
Specia, L., & Motta, E. (2007). Integrating folkso-
nomies with the semantic Web. Lecture Notes in
Computer Science, 4519, 624-639.
Spiteri, L.F. (2006). The use of folksonomies in
public library catalogues. The Serials Librarian
51(2006)2, 75-89.
Spiteri, L.F. (2007). Structure and form of folkso-
nomy tags: The road to the public library cata-
logue. Webology 4(2007)2, art. 41.
Spyns, P., de Moor, A., Vandenbussche, J., &
Meersman, R. (2006). From folksonomies to on-
tologies: How the twain meet. Lecture Notes in
Computer Science 4275, 738-755.
Stock, W.G. (2006). On relevance distributions.
Journal of the American Society for Information
Science and Technology 57(2006)8, 1126-1129.
Stock, W.G. (2007a). Information Retrieval. Infor-
mationen suchen und finden. München, Wien:
Oldenbourg.
Stock, W.G. (2007b). Folksonomies and science
communication. A mash-up of professional sci-
ence databases and web 2.0 services. Information
Services & Use, 27(2007)3, 97-103.
Stock, W.G., & Stock, M. (2008). Wissensrepräsen-
tation. Informationen auswerten und bereitstel-
len. München, Wien: Oldenbourg.
Stock, W.G., & Weber, S. (2006). Facets of infor-
metrics. Information – Wissenschaft und Praxis
57(2006)8, 385-389.
Surowiecki, J. (2004). The Wisdom of Crowds.
New York: Doubleday (dt. Die Weisheit der Vie-
len. München: Bertelsmann, 2005).
Toffler, A. (1980). The Third Wave. New York:
Morrow.
Tonkin, E. (2006a). Folksonomies: The fall and
rise of plain-text tagging. Ariadne, 47.
Tonkin, E. (2006b). Searching the long tail:
Hidden structure in social tagging. In: 17th
ASIS&T SIG/CR Classification Research Work-
shop.
Trant, J. (2006a). Exploring the potential for social
tagging and folksonomy in art museums: Proof of
concept. New Review of Hypermedia and Multi-
media 12(2006)1, 83-105.
Trant, J. (2006b). Social classification and folkso-
nomy in art museums: Early data from the steve.
museum tagger prototype. In: 17th ASIS&T SIG/
CR Classification Research Workshop.
Vander Wal, T. (2004). Feed on this. [Blog post;
2004-10-03]. www.vanderwal.net/random/cate-
gory.php?cat=153.
Vander Wal, T. (2005). Explaining and showing
broad and narrow folksonomies. [Blog post; 2005-
02-21]. www.vanderwal.net/random/category.
php?cat=153.
Veres, C. (2006a). The language of folksonomies:
What tags reveal about user classification. Lec-
ture Notes in Computer Science 3999, 58-69.
Veres, C. (2006b). Concept modeling by the
masses: Folksonomy structure and interopera-
bility. Lecture Notes in Computer Science 4215,
325-338.
Voß, J. (2007). Tagging, folksonomy & co. – Re-
naissance of manual indexing? In: Oßwald, A.,
Stempfhuber, M., & Wolff, C. (Hrsg.): Open Inno-
vation. Neue Perspektiven im Kontext von Infor-
mation und Wissen. ISI 2007 (S. 243-254). Kons-
tanz: Universitätsverlag.
Wang, X., Bai, R., & Liao, J. (2007). Chinese web-
log pages classification based on folksonomy and
support vector machines. Lecture Notes in Com-
puter Science 4476, 309-321.
Weiss, A. (2005). The power of collective intelli-
gence. netWorker, 9(2005)3, 16-23.
Winget, M. (2006). User-defined classification on
the online photo sharing site Flickr … Or, how I
learned to stop worrying and love the million ty-
ping monkeys. In: 17th ASIS&T SIG/CR Classifi-
cation Research Workshop.
Weller, K., & Peters, I. (2007). Reconsidering relati-
onships for knowledge representation. In: Procee-
dings of I-KNOW ‚07. Graz, Austria, September
5-7, 2007 (S. 493-496).
Wu, H., Zubair, M., & Maly, K. (2006). Harvesting
social knowledge from folksonomies. In: Procee-
dings of the 17th Conference on Hypertext and
Hypermedia (S. 111-114). New York: ACM.
Xu, Z., Fu, Y., Mao, J., & Su, D. (2006). Towards
the semantic Web: Collaborative tag suggestions.
In: Proceedings of the 15th International WWW
Conference. Collaborative Web Tagging Work-
shop.
Yeung, C.M.A., Gibbins, N., & Shadbolt, N. (2008).
Mutual contextualization in tripartite graphs of
folksonomies. Lecture Notes in Computer Science
4825, 966-970.
Zhang, L., Wu, X., & Yu, Y. (2006). Emergent se-
mantics from folksonomies: A quantitative study.
Lecture Notes in Computer Science 4090, 168-
186.
Inhaltliche Erschließung, Zusam-
menarbeit, Folksonomy, Wissens-
repräsentation, Information Retrie-
val, Prosumer, Broad Folksonomy,
Narrow Folksonomy, Index-Tag,
Such-Tag, Tag-Verteilung, Long
Tail, Long Trunk, Power Law,
invers-logistische Verteilung,
Yule-Simon-Prozess, Ofness,
Aboutness, Isness, Flickr,
Del.icio.us, YouTube, Natural
Language Processing, Relevance
Ranking, Interestingness Ranking,
ähnliche Dokumente, ähnliche
Nutzer, Community

ist wissenschaftliche
Mitarbeiterin der Ab-
teilung für Informati-
onswissenschaft der
Heinrich-Heine-Uni-
versität Düsseldorf.
Ihre Forschungs-
schwerpunkte liegen
bei Web-2.0-Diensten, Folksonomies,
der Blogo- und Podcastosphäre sowie
im betrieblichen Wissensmanagement.
isabella.peters@uni-düsseldorf.de

ist Leiter der Abtei-
lung für Informati-
onswissenschaft der
Heinrich-Heine-Uni-
versität Düsseldorf.
Seine Forschungen
liegen vor allem in
Gebieten des Information Retrieval,
der Wissensrepräsentation und der In-
formetrie.
stock@phil-fak.uni-duesseldorf.de
Die Autoren
Folksonomies
 59(2008)2, 77-90
... In broad folksonomies, many different users (user A to F in Figure 3) is an index of content creators made available to any document or similar tags. Thus, the document content from a variety of different or the same subject headings is described [29] . Users that use the same keyword are grouped together in groups and find the document on the basis of this keyword again (arrow in both directions). ...
... It is believed that the quality of search in tag based systems can be improved if you tag with inter-subjective meaning (a state of affairs for several viewers equally recognizable) or tags that were used by a larger group, determined automatically. This method of [29] analysis, however, is only suitable for systems in which a term may be given more often. Term frequency within a resource is not allowed in narrow folksonomies. ...
... The one rises, the other falls. In the case of the search only after power tags, the recall -because the entire document-specific "long tail cut off" -is drastically reduced [29]. ...
Chapter
Full-text available
The Web offers autonomous and frequently useful resources in growing manner. User Generated Content (UGC) like Wikis, Weblogs or Webfeeds often do not have one responsible authorship or declared experts who checked the created content for e.g. accuracy, availability, objectivity or reputation. The user is not able easily, to control the quality of the content he receives. If we want to utilize the distributed information flood as a linked knowledge base for higher-layered applications-e.g. for knowledge transfer and learning-information quality (iq) is a very important and complex aspect to analyze, personalize and annotate resources [1]. In general, low information quality is one of the main discriminators of data sources on the Web [2]. Assessing information quality with measurable terms can offer a personalized and smart view on a broad, global knowledge base. We developed the qKAI application framework [3] to utilize available, distributed data sets in a practically manner. In the following we present our adaption of information quality aspects to qualify Web resources based on a three-level assessment model. We deploy knowledge-related iq-criteria as tool to implement iq-mechanisms stepwise into the qKAI framework. Here, we exemplify selected criteria of information quality in qKAI like relevance or accuracy. We derived assessment methods for certain iq-criteria enabling rich, game-based user interaction and semantic resource annotation. Open Content is embedded into knowledge games to increase the users' access and learning motivation. As side effect the resources' quality is enhanced stepwise by ongoing user interaction. By the example of image tag rating in folksonomies we demonstrate a practicable use case for qualifying web resources by keyword-oriented group search and game-based tag ranking in detail. Information quality, folksonomies, open content, semantic annotation, knowledge transfer.
... Since one is usually interested in just a few of these images, a ranking of the images returned by the search is required. There is a patented publication of Yahoo! for Flickr, which deals with this problem [112]. There are five criteria for ranking by interestingness in narrow folksonomies: Most of these criteria are closely related. ...
... The criterion of time is not applicable, because a picture does not lose its relevance over time. The feature "interestingness" is described in Flickr by W. Stock and I. Peters [112] as follows: ...
... Since the components are related, this feature is deliberately not discussed in more depth. Derived from [112], we define three different sets of criteria for the ranking in tagged documents (see Figure 29), which are of importance for our work. ...
Thesis
The Web represents an essential medium in nearly all domains in the area of information and knowledge exchange. Answers to questions on all topics, from general knowledge to specific expert know-how, are contained, either explicitly or implicitly in expert and user-generated resources. In contrast to Web 1.0, where content is explicitly created by experts, with Social Media (Web 2.0) the dividing line between producers and consumers is becoming increasingly indistinguishable. Knowledge is not only generated by recognized experts anymore, but also heavily influenced by collective intelligence. This brings the quality of the content into question, as well as the quality of user interaction generated by user interoperation with distributed web content. The current evolution of Social Media is being described by the term “Web 3.0” or “Social Semantic Web,” whereby standardized, machine interpretable formats, semantic meaning, intelligence and user-oriented interaction complement each other (“hybrid intelligence”). Within the scope of this thesis the service-oriented mashup1 framework, qKAI (qualifying Knowledge Acquisition and Inquiry), is developed for generic reuse of knowledge- oriented, distributed web resources in web applications and for enhanced user interaction scenarios. The combination of standardized web technologies and game design mechanics is used as an expandable concept for interactive web applications – especially in the Social Media area. The challenge lies in simplifying access to distributed web resources to enhance their representation and interconnectivity (“hyperconnectivity”) and to motivate user interoperability with these resources. One requirement for carrying out these processes is utilizing distributed web resources for interactive knowledge-related tasks. Throughout this thesis examples of simplified information access, user interaction and motivation, and ongoing interoperability with freely available resources (“open content”) are presented. Web-based game technologies are deployed as interactive knowledge systems. Distributed web resources are widely regarded as an inherent part of higher-layered applications in information and knowledge management. Knowledge engineering concerns are combined with social interaction strategies and knowledge-oriented collaboration. Based upon semantic interlinking between resources, users and interactive tasks, a comprehensive concept is introduced that integrates distributed web resources into enhanced knowledge representations in an incentive way. A prototypical social web community and stand-alone web applications have been developed during qKAI to implement and illustrate this concept.
... In addition, in the social context, users tend to annotate documents collectively with tags of various semantic forms and granularities (Peters, 2009;Heymann and Garcia-Molina, 2006). One challenging issue is how to exploit the relations among labels (user-generated tags) (Zhang and Zhou, 2014;Gibaja and Ventura, 2015) to improve the learning performance. ...
... Users tend to annotate documents collectively with semantically related tags. Two major semantic relations in user-generated tags are similarity and subsumption (Stock, 2010;Peters, 2009). To deal with this label correlation issue, we propose two loss regularisers jointly learned with the binary cross entropy loss function. ...
Conference Paper
Full-text available
We propose a novel attention network for document annotation with user-generated tags. The network is designed according to the human reading and annotation behaviour. Usually, users try to digest the title and obtain a rough idea about the topic first, and then read the content of the document. Present research shows that the title metadata could largely affect the social annotation. To better utilise this information, we design a framework that separates the title from the content of a document and apply a title-guided attention mechanism over each sentence in the content. We also propose two semanticbased loss regularisers that enforce the output of the network to conform to label semantics, i.e. similarity and subsumption. We analyse each part of the proposed system with two real-world open datasets on publication and question annotation. The integrated approach, Joint Multi-label Attention Network (JMAN), significantly outperformed the Bidirectional Gated Recurrent Unit (Bi-GRU) by around 13%-26% and the Hierarchical Attention Network (HAN) by around 4%-12% on both datasets, with around 10%-30% reduction of training time.
... Folksonomies (Peters, 2009;Smith, 2008;Weller et al., 2010) are either "narrow" (only the author of the document may tag it; example: YouTube), "extended narrow" (apart from the author, his or her friends may give out tags, but only once per tag; example: Flickr) or "broad" (every user of the information service may allocate tags, which can consequently also be used multiple times for a single document; example: Del.icio.us). In narrow and extended narrow folksonomies, the problem of indexing consistency arises -in a particularly pointed manner, even, as it is not information professionals who index but laymen (Peters and Stock, 2007;Peters and Stock, 2008). In broad folksonomies and in case of a sufficiently large number of tagging users, there should be no consistency problems for the most commonly used tags; however, the tags are not from a standardized vocabulary but spring directly from the users' language. ...
... To solve this problem, we draw on the concept of "Power Tags" (Peters, 2009, pp. 363-372;Peters and Stock, 2007;Peters and Stock, 2008;Stock, 2007b;Stock and Stock, 2008, p. 172;Peters and Stock, 2010). "Power tags are tags that best describe the resource's content, or the platform's focal point of interest, according to Collective Intelligence (. . ...
Article
Full-text available
Purpose The object of this empirical research study is emotion, as depicted and aroused in videos. This paper seeks to answer the questions: Are users able to index such emotions consistently? Are the users' votes usable for emotional video retrieval? Design/methodology/approach The authors worked with a controlled vocabulary for nine basic emotions (love, happiness, fun, surprise, desire, sadness, anger, disgust and fear), a slide control for adjusting the emotions' intensity, and the approach of broad folksonomies. Different users tagged the same videos. The test persons had the task of indexing the emotions of 20 videos (reprocessed clips from YouTube). The authors distinguished between emotions which were depicted in the video and those that were evoked in the user. Data were received from 776 participants and a total of 279,360 slide control values were analyzed. Findings The consistency of the users' votes is very high; the tag distributions for the particular videos' emotions are stable. The final shape of the distributions will be reached by the tagging activities of only very few users (less than 100). By applying the approach of power tags it is possible to separate the pivotal emotions of every document – if indeed there is any feeling at all. Originality/value This paper is one of the first steps in the new research area of emotional information retrieval (EmIR). To the authors' knowledge, it is the first research project into the collective indexing of emotions in videos.
Chapter
Full-text available
In Foto-Communitys finden sich vielfältige und komplexe Text-Bild-Relationen, wobei hier zwei kommunikative Praktiken näher betrachtet werden: Das Vergeben von Tags und das Anbringen von Notizen. Tags dienen der Wissensrepräsentation; es stellt sich hier die Frage, wie Bilder möglichst adäquat versprachlicht werden können, es wird also semantische Redundanz angestrebt. Zudem wird in diesem Beitrag dargestellt, wie die Relationen zwischen den verschiedenen Tags geartet sind, die sich gemeinsam auf ein Bild beziehen. Bei Notizen dahingegen stehen pragmatische Relationen im Vordergrund, die aus semantischer Sicht als komplementär zu bezeichnen sind, d. h. die Informationen des Kommunikats sind auf Text und Bild verteilt. Auf der sprachlichen Seite geht es dabei um Ellipsen, die im Bild gefüllt sind, um verbale Deiktika, die auf das Bild verweisen sowie um Passivkonstruktionen, bei denen das Agens im Bild realisiert ist.
Article
This paper will show the meaning of Web 2.0-tools for scientists and it will show why they think they are useful. Therefor a survey with scientists of different faculties will be presented. This survey is about which Web 2.0tools are known and what they are used for. After a short introduction about Web 2.0 and the research-level up to now the results of the survey will be discussed, which will show, that Web 2.0-tools are well known, but mainly used for personal reasons and entertainment, rather than for scientific work.
Article
With a diversity of newly emerging collaborative services (social software) the internet is changing considerably. New competencies and skills are needed to tap the full potential of these new Web 2.0 tools. At the same time, large amounts of user-generated content let problems of information overload become even more serious. More than ever, competencies in using digital information effectively and adequately have to be promoted. This paper discusses chances and challenges for users of social software tools. Furthermore, an online survey was conducted with more than 1000 students: Which Web 2.0 services are widely known? How are they used? Do they compete with web search engines and classical library resources?.
Article
Object of our empirical research study are depicted and provoked emotions in videos. Are users able to index such emotions consistently? Are the users' votes usable for emotional video retrieval? We worked with a controlled vocabulary for nine basic emotions (love, happiness, enjoyment, surprise, desire, sadness, anger, disgust, and fear), a scroll bar for adjusting the emotions' intensities, and the approach of broad folksonomies. Different users tagged the same videos. The test persons had the task to index the emotions of 20 videos (reprocessed movies from You Tube). We got data from 776 participants and could analyze all in all 279,360 scroll bar values. The consistency of the users' votes is very high; there are stable tag distributions for the emotions of the particular videos. The final shape of the distributions will be reached by the tagging activities of only few users (less than 100). Applying the approach of power tags it is possible to separate the pivotal emotions of every document - if there is any feeling at all. Those document-specific emotions establish the basis of an emotional information retrieval (EmIR) system.
Thesis
In der Diplomarbeit wird anhand des Webangebots eines IT-Fachverlags untersucht, wie Metadaten für Textdokumente effizient erstellt werden können. Ziel ist es die Beschreibung und den Zugriff auf Online Beiträge zu verbessern. Es werden grundlegenden Metadatenarten beschrieben und ein Zusammenhang zwischen Auffindbarkeit von Textdokumenten und ihrer Beschreibung hergestellt. Weiterhin werden einige Möglichkeiten der Inhaltlichen Erschließung vorgestellt und einige Methoden erläutert, mit denen ihre Erstellung maschinell unterstützt werden kann. Innerhalb einer Bedarfsanalyse werden die notwendigen Metadaten identifiziert, um daraus einen Entwurf für eine verbesserte Beschreibungsstruktur (Ordnungssystem) abzuleiten. Die Arbeit enthält außerdem Vorschläge für die Erstellung der benötigten Metadaten unter den Gesichtspunkten der Qualität und Effektivität.
Thesis
Full-text available
Article
The views of P. Jason Morrison, on social tagging system and resulting folksonomies, are discussed. Folksonomies are used to organize information and support information retrieval. Folksonomies are often a tag cloud which are usually listed alphabetically and weighted by popularity. Tags are useful for users to navigate the site and suggest weather they are on the right track. Users tagged website to organize their bookmark and find things later or share them with others. Tags can later be searched to organize a large collection into categories in tune with the user's own idiosyncratic mental model. Content producer submitting items to a collection, tag their item, so that user browsing through or searching the folksonomy can ultimately see their content. The items which are not intersected with common search items can never searched and tagged.
Article
The essence of folksonomies is user-created descriptive metadata as opposed to the traditional sender-determined descriptive metadata in taxonomies and faceted classification. We briefly introduce the beginning and principles of folksonomy and discuss the categorizing concept of folksonomies on the basis of the computer program delicious. The selection of the metadata tagged is not accidental, rather tagging follows a pattern that proves to be the pattern for the classic power law, which, in many complex systems is seen to unfold as an imitation-dynamic that creates an asymmetry, where a few descriptive metadata are often reproduced and the majority seldom 'reproduced. In delicious, it is the very broad and basic subject headings that are often reproduced and achieve power in the system - which in cognitive psychology is called cognitive basic categories - while the small, more specific subject headings are seldom reproduced. The law of power's underlying imitation-dynamic in delicious is explained from the perspective of different theoretical paradigms, i.e. network, economy and cognition. The theorectical and speculative conclusion is that the law of power and asymmetry is biased by a cognitive economizing through a simplification principle in the users' construction of descriptive metadata. Free tagging in folksonomies is comparable to empirical experiments in free categorization. Users often choose broad basic categories, because that requires the least cognitive effort. The consequences are that folksonomy is not necessarily a better, more realistic and cheaper method of creating metadata than that which can be generated through taxonomies, faceted classification or search algorithms. Folksonomy as a self-organizing system likely cannot create better and cheaper descriptive metadata.
Article
Classical knowledge representation methods have been successfully working for years with established - but in a way restricted and vague - relations such as synonymy, hierarchy (meronymy, hyponymy) and unspecified associations. Recent developments like ontologies and folksonomies show new forms of collaboration, indexing and knowledge representation and encourage the reconsideration of standard knowledge relationships for practical use. In a summarizing overview we show which relations are currently used in knowledge organization systems (controlled vocabularies, ontologies and folksonomies) and which relations are expressed explicitly or which may be inherently hidden in them.