Mehr als nur Internet
Wenn Computer Inhalte von Webseiten verstehen, heißt das „Semantic Web“.
Semantic Web soll Computern beibringen, Internetseiten zu verstehen und den UserInnen so die Suche zu erleichtern.
Computer, die einen verstehen? Das ist keine Zukunftsmusik, sondern Realität. Mithilfe des Semantic Web sollen Computer lernen, den Anwenderinnen und Anwendern die Suche zu erleichtern. Zum Beispiel durch automatische Spam-Klassifikation und Recommender-Systeme (Empfehlungen) etwa bei Online-Buchhandlungen.
An dem Nachfolgekonzept fürs Internet basteln weltweit Forscherinnen und Forscher. Die Idee des semantischen Web geht zurück auf Tim Berners-Lee, den Erfinder des World Wide Web. Im Zentrum steht die Entwicklung von semantischen Technologien, mit deren Hilfe Computer die Inhalte von Musik, Bildern und Videos besser verarbeiten können sollen.
Ein Lastwagen ist kein PKW
Semantik ist die Lehre von der Bedeutung sprachlicher Zeichen, wobei verschiedene Bedeutungen in Beziehung zueinander stehen können. Diese Beziehungen sind hierarchisch strukturiert. So ist zum Beispiel ein Lastwagen zwar ein Auto, aber weder Pkw noch Geländewagen, die aber ebenfalls zu den Autos zählen.
Das bedeutet: „Auto“ ist der Überbegriff, unter den sich Lastwagen, Pkw und Geländewagen einordnen lassen. Solche semantischen Klassifizierungen werden als Metadaten den Inhalten beigefügt. Dafür sind die Web Ontology Language (OWL) sowie das Resource Description Framework (RDF) entwickelt worden, zwei maschinenlesbare Sprachen zur formalen Beschreibung von Multimedia-Inhalten.
Mit „semantifiziertem“ Informationsbestand können in weiterer Folge beispielsweise intelligentere Suchmaschinen entwickelt werden.
Unstrukturierte Datenberge nutzbar machen
Semantische Technologien können überall eingesetzt werden, wo komplexe Entscheidungsprozesse unterstützt und dabei große Informationsmengen verarbeitet werden müssen. Das meiste Wissen innerhalb von Unternehmen ist im einen oder anderen Textformat gespeichert – als E-Mail, Bericht, Studie oder Präsentation. Das Datenvolumen weltweit ist von 2006 bis 2011 ungefähr um das Zehnfache angestiegen.
Die Frage ist, wie man diese Datenberge durchforsten und relevante Informationen daraus extrahieren kann. Die Antwort liefern Methoden wie Data Mining oder Text Mining. Data Mining untersucht strukturierte Daten, wie sie in Datenbanken vorhanden sind. Mit der schwierigeren Aufgabe, nämlich aus unstrukturierten Texten unter Verwendung von Sprachanalyse Informationen zu gewinnen, befasst sich Text Mining, auch Text Analytics genannt.