Hintergrundinformationen zu den neuen automatischen Tagvorschlägen von Lycos iQ

In meinem letzten Beitrag Lycos iQ führt Tagvorschläge für Fragen bei iQ ein habe ich einen kurzen Blick auf die neueste Funktion von Lycos iQ geworfen. Dieser Blick war allerdings etwas oberflächlich, sodass es nun etwas genauere Informationen zur Funktionsweise gibt. Momentan ist das Feature übrigens noch in der Testphase und nicht auf der normalen Frage-stellen-Seite zu sehen.

Nun war Andreas Heß von Lycos Europe so nett und mir einige Hintergrundinformationen zum besseren Verständnis der Funktion gegeben, die ich Euch natürlich nicht vorenthalten möchte. Während ich mich natürlich ebenso für die interessanten Infos bei Andreas bedanke!

Worterkennung?!

Ausschließlich Nomen und Eigennamen werden für die Tagvorschläge benutzt. Bei meinen Beispielen habe ich gleich einen Bug mitbekommen: So wird nämlich das Fragewort „warum“ als Nomen eingeordnet, für die Vorschläge der Tags sollte es eigentlich keine Rolle spielen. Auch zusammengesetzte Worte wie in meinen Beispielen „Musikverwaltung“ bzw. „Musikprogramme“ werden aktuell noch nicht in ihre Bestandteile zerlegt.

Entstehung der Tagvorschläge

Die Vorschläge für einen Tag entstehen nicht, wie ich mich ausdrückte, durch ein Übernehmen der erkannten Worte. Es werden diese Worte erkannt und es wird gesucht, wie frühere Fragen mit diesen Worten getaggt worden sind. So erklären sich auch die Vorschläge von Leid und Menschen für Fragen, die das fälschlicherweise als relevant erkannte „Warum“ enthalten: Eine der „Warum“-Fragen wurde mit eben diesen Tags verschlagwortet.
Die Tagvorschläge entstehen also nicht im luftleeren Raum, sondern werden auf Grundlage der bisherigen Fragen berechnet. Natürlich wäre es auch interessant, wenn die Linkkataloge miteinbezogen werden würden. Ich vermute erstmal, dass in einem relativ sorgfältig geführten Linkkatalog der Titel des Links und die Tags auch einen gewissen Zusammenhang haben. Ob es entsprechend gepflegte Linkkataloge bei Lycos iQ aber gibt, wage ich zu bezweifeln. Der Linkkatalog scheint recht wenig von den Mitgliedern benutzt zu werden.

Homonyme und Synonyme

Ein weiteres Problemfeld sind momentan Homonyme und Synonyme. Homonyme sind Wörter, die unterschiedliche Bedeutungen haben. So z.B. Schloss: Das Schloss kann einerseits ein luxuriöses Gebäude sein und andererseits auch der Bestandteil der Fahrertür meines Autos, das mich eine Zeitlang durch die Beifahrertür einsteigen ließ.
Bei Wikipedia gibt es dann ausführlichere Erklärungen für Homonyme und Synonyme.
So ist bei der Frage Was ist eine Maus? schwer zu unterscheiden für die Software, ob nun das Tier oder das Bedienelement eines Computers gemeint ist. Bislang werden hier aufgrund der bisherigen Fragen nur Tagvorschläge aus dem Computerbereich gemacht.

Zu allgemein? Zu unwissenschaftlich?

Wahrscheinlich wird Andreas auch nach meinem zweiten Erklärungsversuch die Hände über dem Kopf zusammenschlagen müssen. Und neben der Hoffnung auf einen magenschonenden Tee für ihn, bleibt mir nur der Verweis auf weiterführende Informationen, die exaktere und wissenschaftlichere Erläuterungen anbieten.
Direkt von Andreas u.a. kommt diese Erläuterung: From Web 2.0 to Semantic Web: A Semi-Automated Approach (PDF, ~180kb).
Lesenswert ist auch der Wikipedia-Artikel zum Gemeinschaftlichen Indexieren und die Erklärung von Folksonomy im Wiki der Computerwoche. Oder natürlich auch meine Artikel zum Tagging.

Ähnliche Beiträge

Hier schreibt exklusiv für Dich

Marc Pentermann bloggt seit über zehn Jahren, hauptsächlich über technische, politische und netzpolitische Themen. Auch über Gadgets, oftmals aus dem Hause Apple und immer wieder gibt es Fotos aus dem Leben. Immer sonntags gibt es einen Sammelbeitrag von lesenswerten Artikeln. Er arbeitet als Sozialpädagoge in arbeitsmarktpolitischen Maßnahmen. Seit 2010 lebt er in Österreich (mehr).

2 Kommentare

  1. Nö, da brauch ich nicht die Hände über dem Kopf zusammenzuschlagen, das ist einfach, treffend und korrekt erklärt. :)

Kommentare sind geschlossen.