fit 2002 > Gruppenthema > konzeptionelle Entwicklungen und Auswirkungen

Überblick


Dieser wissenschaftliche Bereich, in dem Informatik, Betriebswirtschaft und Mathematik eng zusammenarbeiten, wird derzeit und wohl auch für die nahe Zukunft sowohl von Betriebswirtschaftern als auch von Informatikern als absolut zukunftsträchtig eingeschätzt. Viele andere Wissensbereiche wie Statistik, Künstliche Intelligenz, Maschinelles Lernen, Daten Visualisierung, Neuronale Netze, Mustererkennung und Andere tragen viele Erkenntnise und Errungenschaften zu diesem ständig breiter werdenden Forschungsfeld bei.

Die Grundsteine des Data Mining

Data mining Verfahren sind das Resultat langer Forschung und Entwicklungsarbeit. Die Evolution begann, als Geschäftsdaten zum ersten Mal mit Hilfe von Computern gespeichert wurden, gefolgt von Weiterentwicklungen in Datenzugriff und neu entwickelten Technologien, die es dem Benutzer erlauben in "Real Time" die Daten abzufragen und zu bearbeiten. Data mining konnte nur durch die Unterstützung der folgenden Technologien zu einem kommerziell rentablen Einsatzbereich heranwachsen:

  • Massive data collection
  • Leistungsstarke Multiprozessor-Computer
  • Data mining Algorithmen

Kommerzielle Datanbanken wachsen mit einer enormen Geschwindigkeit. Eine kürzliche Studie über Datawarehouse Projekte ergab, dass die meisten der Betroffenen Daten im Bereich um 100 Gigabyte zu verwalten haben. In manchen Gebieten wie zum Beispiel Verkauf und Versand liegen diese Werte noch weit höher. Die miteinhergehenden Notwendigkeit nach leistungsstärkeren Rechnern kann nun sehr kosteneffektiv mit parallelen Multiprozessor-Computer Technologien gedeckt werden. Data mining Algorithmen existieren schon seit längerem, konnten aber erst in den letzten Jahrzehnten zu nützlichen und wertvollten Werkzeugen ausgereift werden.

In der Entwicklung von Geschäftsdaten zu Geschäftsinformation baut jeder Schritt auf dem vorhergehenden auf. Aus der Sicht des Benutzers sind die 4 Schritte in der folgenden Tabelle revolutionär, weil sie die aufgeworfenen Fragen sicher und schnell zu beantworten vermochten.

 

Evolutionary Step Business Question Enabling Technologies Product Providers Characteristics
Data Collection

(1960s)

"What was my total revenue in the last five years?" Computers, tapes, disks IBM, CDC Retrospective, static data delivery
Data Access

(1980s)

"What were unit sales in New England last March?" Relational databases (RDBMS), Structured Query Language (SQL), ODBC Oracle, Sybase, Informix, IBM, Microsoft Retrospective, dynamic data delivery at record level
Data Warehousing &

Decision Support

(1990s)

"What were unit sales in New England last March? Drill down to Boston." On-line analytic processing (OLAP), multidimensional databases, data warehouses Pilot, Comshare, Arbor, Cognos, Microstrategy Retrospective, dynamic data delivery at multiple levels
Data Mining

(Emerging Today)

"What’s likely to happen to Boston unit sales next month? Why?" Advanced algorithms, multiprocessor computers, massive databases Pilot, Lockheed, IBM, SGI, numerous startups (nascent industry) Prospective, proactive information delivery

Schritte in der Evolution des Data Mining.

Die Kernkomponenten der Data mining Technologien standen für Jahrzehnte in den Bereichen Statistik, künstliche Intelligenz und machine learning unter Entwicklung. Heute macht die Ausgereiftheit dieser Techniken zusammen mit high-performance relationalen Datenbanken Data mining nutzbar für praktische Anwendungen im Data warehouse Bereich.



> http://www3.shore.net/~kht/text/dmwhite/dmwhite.htm An Introduction to Data Mining

>Entstehungskontext | Konzepte und Techniken | Entwicklung und Auswirkungen | Praxis | Bewertung