30.06.10

Übersemantifiziert?

HTML ist Semantik, klar. Es scheint aber nicht auszureichen, was herkömmliches HTML oder auch HTML5 an semantischen Beschreibungsmöglichkeiten bieten. RDFa oder Microformats sorgen dafür, dass Semantifizierungswütige etwas zu tun haben. In Wirklichkeit höre ich immer nur, wie jeder über RDFa redet, aber niemanden, der es tatsächlich einsetzt; ein paar Vorstöße hier und da einmal außer Acht gelassen. Ich habe an mir selbst bemerkt, dass es oftmals einfach zu viel ist. Eine Adresse mit dem address-Tag ausstatten? Meinetwegen, aber foaf:dies und foaf:das für jeden Schnipsel einfügen? Euch piept’s wohl! Mich kotzt es ja schon an, dass ich mir für jedes olle Bildchen einen Alternativtext ausdenken muss.

Für das hier und da Rumbloggen sind RDFa und Microformats einfach ein krasser Overkill, da können mir übereifrige Streber nichts erzählen. Bleibt noch das Gebiet Webanwendungen. Sehr gerne dürft ihr meinen Google-Kalender ordentlich versemantifizieren, meine Mails sinnvoll ummanteln oder das Adressbuch mit geriebenem Käse veredeln, da habe ich nichts dagegen. Nur was kommt dabei rum? Semantik wird meiner Meinung nach erst dann wichtig, wenn Maschinen öffentliche Daten lesen sollen. Kalender, Adressbuch, Mail-Ordner sind – bei mir zumindest – nicht öffentlich. Und wenn ich mit den Daten hantieren will, gibt es jeweils eine superduper Export-Funktion, die das alles toll semantisch in einem wirklich sinnvollen Format ausspuckt.

Ich halte diese Über-Semantik also nur bei öffentlichen Daten für sinnvoll. Und bei Daten, die von Webanwendungen erstellt werden. Holla, die Schnittmenge fällt klein aus. Fast so klein, dass man den Aufwand der Spezifizierung vielleicht noch einmal überdenken sollte.

Ich vertraue da lieber auf die Kraft des Kontexts und hoffe auf die Macht der Kontextanalysiermaschinendinger. Jede Information, die von Menschen generiert wird, ist durch ihren Kontext mit Semantik belegt und ich denke, diese Semantik lässt sich mit Maschinen lesen. Vielleicht nicht alles schon heute, aber bald. Bei der Suchmaschine zweifelt ja auch niemand mehr.

Kommentare [1]

Schepp am 22.07.2010 um 14:11

Naja, ein sich selbst erklärender Kontext wäre nett, aber mit KI ist’s ja nunmal nicht so weit her bei unseren stromverbrauchenden Freunden. Sonst würde HTML5 ja auch spezifizieren, dass Prefixe in Links à la mailto:, callto: und javascript: wegfallen dürfen. Ergibt sich ja theoretisch auch aus dem Kontext. Und was eine KI eines HTML-Parsers beim durchforsten einer Seite an CPU-Zeit verbraucht, will ich lieber auch nicht wissen.

Ich denke Mikroformate haben einfach den Sinn, über die offensichtlichste Bedeutungsebene hinaus, auf ein und denselben HTML-Code mehrere weitere Ebenen legen zu können, die von andersartigen Systemen als der Browser+User-Kombination goutiert werden können. Und zwar ohne eine ganz eigene Outputwurst für sie zu braten (à la RSS-Feeds, die sich theoretisch auch per Mikroformate aus einer vorhandenen HTML-Übersichtsseite extrahieren ließen).

Google nutzt Mikroformate beispielweise für diverse Spezialsuchen, der IE erlaubt Verwendung von Webslices als Art Gadgets. Darüberhinaus gibt es viele Browser-Plugins, die einem die versteckten Inhalte erschließen können. Ich geb Dir aber recht, dass dieses Feld für Webworker ein absoluter Nebenschauplatz ist.

Kommentar verfassen

Textile-Hilfe

  • *stark*
  • _betont_
  • "Link":http://url.com/
  • bq. Zitatkasten
  • bc. Code-Block
Der Kommentar kann erst abgeschickt werden, wenn man mindestens einmal die Vorschaufunktion aktiviert hat.

Flattr

Blogrolle

Podroll

Soziale Netzwerke

Twitroll

PromoteJS

JS String .toUpperCase