fit 2002 > Gruppenthema > Entstehungskontext

Überblick


Das Gebiet Datamining ist gegen Ende der 80er Jahre als eine Disziplin in der Informatik mit Bezügen zur Logik, Künstlichen Intelligenz und Statistik entstanden. Das Wort Datamining steht für „Database mining“, dem Ausbeuten von Datenbanken nach wertvollen Informationen.

Mit dem Einzug des Informationszeitalters ist die Menge an Information enorm gewachsen, und verdoppelt sich weltweit etwa alle 20 Monate [mert99]. Weiters steigt auch die Anzahl der zugänglichen Informationsquellen wie riesige Datenbanken, die alle digitalisierten Daten eines Unternehmens zum Abruf bereithalten. Die täglich steigende Flut an Informationen aus den verschiedensten Bereichen, wie Medizin, Demographie, Finanzwesen und Marketing, erschwert es den Benutzern moderner informationsbasierter Systeme in zunehmenden Ausmaß, noch essentielle Daten auch als solche zu werten. Diese Menge an Daten, in riesige heterogene Datenbeständen zerteilt, macht es ohne die Unterstützung von geeigneten Computerprogrammen unmöglich, eine Aufarbeitung der Datenbestände zu gewährleisten.

Der Begriff Data Mining lässt sich am besten anhand der Metapher des Bergbaus erörtern. In riesigen Bergen von Daten wird nach kleinen Informationsbrocken gesucht. Die gefundenen Informationen können, richtig angewandt, den Wert von Gold noch um ein vielfaches übersteigen. Wichtig für das Verfahren des Data Minings ist die Tatsache, dass bislang unbekanntes zu Tage gefördert wird.

Data Mining wurde zuerst für die Analyse von Datenbeziehungen auf eine statistische Art und Weise benutzt, sowie in der Forschung wo große Datenbestände in Datenbankmanagementsystemen ruhten. Für diese Vorgehensweisen dachte man an Algorithmnen und Computerprogramme, mit denen die Beziehungen zwischen den Daten mittels Datenmustern ermittelt werden konnten. Die frühen Vorgehensweisen bestanden meist aus dem Aufstellen von Hypothesen, die sich aus den vorliegenden Datenmaterial als richtig oder falsch bestätigten. In den frühen Achtzigern fingen Forscher der künstlichen Intelligenz an, Algorithmen zu entwickeln, mit denen dann umgekehrt vorgegangen werden konnte. Aus den Daten sollten Hypothesen berechnet werden, die neu und interessant waren. Diese mußten dann erneut überprüft und interpretiert werden.

> Hans Wilhelm Wieczorrek Peter Mertens; Data X Strategien; Springer, Germany, 1999.
> Mathias F. H. Hahn; Algorithmen für Data Mining; 2001
> W. H. Janko, P. Bruhn, S. Koch, M. Hahsler; Data Mining, Umfeld, Prozeß, Methoden; 2000

 

Weiterführende Informationen


> Glossary of Data Mining
> C. VanRijsbergen; Information retrieval; 1979
> Robert D. Smal; Debunking data mining myths; 1997

 

Verweise auf Arbeiten anderer gruppen



>Entstehungskontext | Konzepte und Techniken | Entwicklung und Auswirkungen | Praxis | Bewertung