2/CLU

CLUSTERANALYSEN

DAS PRODUKT

2/CLU ist die ADABOX-App zur einfachen, schnellen und stabilen Segmentierung einer Menge von Objekten in homogene Cluster.

KURZCHARAKTERISTIK

  • Unterstützt alle gängigen hierarchischen und partitionierenden Verfahren
  • Kombiniert beide Vorgehensweisen, um eine stabile Ausgangspartition zu ermitteln und diese Lösung schrittweise zu optimieren (Two-Stage-Clustering)
  • Ermöglicht die Gruppierung auch von Fällen mit fehlenden Werten
  • Liefert Gütekriterien als Entscheidungsgrundlage für die Bestimmung der „richtigen“ Anzahl an Clustern
  • Bietet umfangreiche Optionen zur individuellen Gestaltung von Grafiken, um die gefundenen Cluster prägnant darzustellen

AUFGABENSTELLUNG

Ziel einer Clusteranalyse ist es, eine heterogene Gruppe von Objekten in homogene Untergruppen aufzuteilen.

Die so gefundenen Gruppen wären durch konventionelle Gruppenbildung zum Beispiel nach Altersklassen, Geschlecht, Einkommen etc. nicht zu identifizieren. Sie enthalten Objekte, die hinsichtlich aller betrachteten Merkmale möglichst ähnlich sind. Zum Beispiel Personen, die eine einheitliche Meinung zu einem bestimmten Thema haben. Dem Marketing kann man somit eine Hilfestellung für eine zielgruppengerechte Ansprache geben.

Zu sehen ist eine Meinungsdarstellung in der Clusteranalyse mit 3 Typen und 11 verschiedenen Merkmalen. Es werden pro Typ die Tendenzen gezeigt, wie sich der oder die Fahrerin charakterisiert und welche Merkmale beim Auto selbst geschätzt werden.
Profile von Autofahrer-Typen (Abweichungen vom Durchschnitt)

VORAUSSETZUNGEN

Die Merkmale, nach denen Personen zu klassifizieren sind, sind vorher festzulegen (aktive Variablen). In der Regel werden hierzu Statement-Batterien benutzt. Diese können zum Beispiel die Einstellungen von Personen zu bestimmten Themenbereichen beinhalten.

Das Skalenniveau spielt zur Berechnung keine Rolle, allerdings sollten alle aktiven Variablen ein identisches Skalenniveau haben. Falls Fragen mit unterschiedlichen Skalenniveaus verwendet werden sollen, müssen sie vorher auf ein einheitliches Niveau standardisiert werden.

Als Faustregel gilt: Jedes Cluster sollte mindestens 50 Personen umfassen. Eine Stichprobengröße von mindestens 300 Personen halten wir für ratsam.

Bei der Festlegung der aktiven Variablen sollte darauf geachtet werden, dass diese möglichst nicht allzu hoch miteinander korrelieren. Die redundante Information würde die Gruppenbildung unverhältnismäßig stark beeinflussen. Im „täglichen Leben“ ist dies allerdings nie ganz auszuschließen.

Um starken Korrelationen vorzubeugen, ist es unter Umständen ratsam, eine Faktorenanalyse vorzuschalten.