Data Mining
im engeren Sinne, siehe Data Mining. im weiteren Sinne, siehe Knowledge Discovery in Databases. Fasst man den Begriff Data Mining eher weit, so ist Data Mining identisch zum Begriff des Knowledge Discovery in Databases. In seinem engen Verständnis hingegen ist Data Mining ein Teilschritt dieses KDD-Prozesses, der aus Algorithmen besteht, die in akzeptabler Rechenzeit aus einer vorgegebenen Datenbasis einer sehr grossen Datenbank eine Menge von bisher unbekannten Zusammenhängen, Mustern und Trends liefern. Besteht diese Datenbasis aus üblichen, strukturierten Daten, so spricht man vom klassischen Data Mining, das sich der verschiedensten Ansätze aus unterschiedlichsten Wissenschaftsdisziplinen bedient. Dabei werden ebenso klassische Verfahren der Statistik zur Segmentierung, Klassifikation oder Prognose angewendet wie neuere Techniken der Entscheidungsbäume oder der Assoziationsanalysen. Aber auch Methoden der Künstlichen Intelligenz, wie z.B. die künstlichen neuronale Netze (KNN), kommen hier zum Einsatz. Handelt es sich bei der Datengrundlage hingegen um unstrukturierte Daten wie z.B. der Sammlung von Textdokumenten, so versucht das sog. Text Mining diese Daten mit Hilfe spezieller Methoden zu analysieren. Ähnlich dem Data Mining ist das Ziel dieser Analysen die Klassifikation oder die Segmentierung des vorgegebenen Textdatenbestandes sowie das Aufzeigen von Beziehungen zwischen Dokumenten und deren Inhalten. Zur Visualisierung werden oft sog. Topic Maps oder Ontologien aufgebaut. Werden die Verfahren des Data Mining auf Datenstrukturen des Internets angewendet, so bezeichnet man dies als Web Mining. Entsprechend der jeweiligen Zielstellung unterteilt sich Web Mining in Web Content Mining, Web Structure Mining bzw. Web Usage Mining, das sich nochmals in Web Log Mining und Integrated Web Usage Mining differenzieren lässt. Siehe auch Business Intelligence (mit Literaturangaben).
|