MENÜ MENÜ  

cover

Interaktive Wissensgewinnung in parallelen Datenbanksystemen

Matthias Gimbel

ISBN 978-3-8325-0819-7
302 Seiten, Erscheinungsjahr: 2005
Preis: 40.50 €
Die Suche nach wertvollem, bisher unerkanntem Wissen in großen Datenbeständen, oft auch unter den Schlagworten KDD (Knowledge Discovery in Databases) und Data Mining bekannt, hat sich in den zurückliegenden Jahren zu einer der wichtigsten, aber zugleich auch zu einer der anspruchsvollsten Anwendungen für Datenbanksysteme entwickelt.

Einer problemlosen Erschließung des in den Daten verborgenen Wissens im Rahmen des KDD-Prozesses stehen noch einige Hindernisse entgegen. Das größte Hindernis stellen die massiven Datenmengen dar, die beim Data Mining üblicherweise zu handhaben sind. Sie bewirken erhebliche Laufzeiten bei der Ausführung von Ableitungsketten. Darüberhinaus eignen sich die Lernverfahren aufgrund ihrer Berechnungskomplexität nicht für die schnelle Analyse großer Datenmengen. Laufzeiten von mehreren Stunden oder gar Tagen sind keine Seltenheit. Für eine interaktive Arbeitsweise müssen aber die Antwortzeiten im Bereich des menschlichen Entscheidungsverhaltens liegen. Die Ausführung von Ableitungsketten im Rahmen des KDD-Prozesses wird so zum dominierenden Einflussfaktor und hat nicht nur Auswirkungen auf die Dauer des gesamten Prozesses, sondern schafft auch zusätzliche Randbedingungen hinsichtlich der überhaupt in Betracht kommenden Untersuchungsgegenstände.

Ein naheliegender uind wichtiger Ansatz zur Leistungssteigerung ist traditionell auch der Einsatz von Parallelität. In der hier vorliegenden Arbeit werden folgende Probleme untersucht:

  • Umverteilung (Redistribution)
  • Data Skew
  • Mehrbenutzerbetrieb
  • Moderne Speicherarchitekturen
  • Mangelnde Unterstützung von Interaktivität
  • Ziel der Arbeit ist die Entwicklung von Parallelisierungstechniken für einen interaktiven Wissensgewinnungsprozess auf parallelen Plattformen mit verteiltem Speicher und optimierter Kommunikation, die gegenwärtig in Form von Workstation Clustern, aber auch kommerziellen Komplettsystemen (wie z.B.IBM SP) verstärkt auftreten.

    Keywords:
    • Data Mining
    • Parallele Datenbanken
    • Indexstruktur
    • Interaktivität
    • Anfrageoptimierung

    KAUFOPTIONEN

    40.50 €
    auf Lager
    Versandkostenfrei innerhalb Deutschlands


    Wollen auch Sie Ihre Dissertation veröffentlichen?

    cover cover cover cover cover cover cover cover cover