TUM-Informatik Logo Technische Universität München
Fakultät für Informatik
Forschungs- und Lehreinheit VII
TUM Logo
Theoretische Informatik und Grundlagen der KI

Data Mining und Knowledge Discovery (WS 03/04)

Priv.-Doz. Dr. Thomas Runkler

Bereich: prüfbare Vorlesung im Bereich 1.4 Künstliche Intelligenz / Maschinelles Lernen

Zeit: Montag 8.30 (s.t.) - 10.00

Ort: Raum MI 00.04.011 (Hörsaal 2)

Beginn: 03.11.03

Inhalt:

Die Information in der Welt verdoppelt sich etwa alle 20 Monate. Zu den am stärksten wachsenden Datenquellen gehören neben dem globalen Internet beispielsweise industrielle Prozessleitsysteme, betriebswirtschaftliche Datenbanken sowie die Biotechnik und die automatische Bilderfassung. Neben der Erfassung und Speicherung stellen die Aufbereitung und Verarbeitung der Daten heute die größten Herausforderungen dar. Ziel ist es, aus den großen Datenmengen die relevanten Informationen, also das "Wissen" zu extrahieren. Neben konventionellen statistischen Verfahren wie Korrelation und Regression werden hierzu Methoden der Clusteranalyse, Fuzzy-Logik, Neuroinformatik und Machine Learning angewandt. Diese Datenanalysemethoden werden unter dem Sammelbegriff Data Mining zusammengefasst. Data Mining ist Teil des Knowledge Discovery Prozesses, der darüber hinaus auch die Datenvorverarbeitung, Filterung, Visualisierung, Transformation und Merkmalsgenerierung umfasst. Laut einer Studie der Gartner Group setzen in Jahr 2000 mindestens 50% der Top-1000-Firmen Data Mining ein. Auch bei Siemens werden diese Methoden schon heute in zahlreichen industriellen Projekten eingesetzt. In der Vorlesung werden die wichtigsten Methoden von Data Mining und Knowledge Discovery vorgestellt und anhand einiger Anwendungsbeispiele aus Siemens-Projekten vertieft.

  1. Einführung: Ziel, Definitionen, Schritte der Knowledge Discovery (KDD)
  2. Datenquellen, -charakteristika und Fehlerquellen
  3. Datenvorverarbeitung und -filterung
  4. Datenvisualisierung
  5. Datentransformationen und Merkmalsgenerierung
  6. Datenanalyse
  7. Anwendungsbeispiele

Hörerkreis: Studenten des Hauptstudiums der Informatik, der Elektrotechnik oder der Physik.

Voraussetzungen: keine

Ohne Schein, Ohne Übungen

Literatur: (begleitende Literatur, kein Ersatz zum Besuch der Vorlesung)

Sprechstunde: nach Vereinbarung und nach der Vorlesung.

Zusatzinformationen: (zur Informatik und dem Informatikstudium allgemein)


webmaster@wwwbrauer
Last modified: Mon Jul 7 13:25:53 MEST 2003