Multidimensionale Skalierung - MDS |
Die MDS ist eine Sammlung statistischer Analysenmethoden zur Entdeckung von Strukturen innerhalb von Beobachtungen. Die Daten (Beobachtungen) können vom Skalenniveau unterschiedlich sein, wichtig ist nur, dass sie als Ähnlichkeits- oder Unähnlichkeitskoeffizienten (Proximitäten) dargestellt werden können. Die Visualisierung der Koeffizienten zur Beurteilung der Ähnlichkeiten oder Unähnlichkeiten ist ein wesentlicher Bestandteil der MDS. Abb. 1: Wahrnehmungsraum Als Abgrenzung zur Faktorenanalyse müssen die relevanten Eigenschaften der Objekte für die MDS nicht bekannt sein. Das heißt, dass der Befragungsteilnehmer (Für die Argumentation wird von einer Befragung ausgegangen.) nur die subjektiv empfundene Ähnlichkeit / Unähnlichkeit zwischen zwei Objekten einschätzt. Ein möglicherweise oft gehörtes Beispiel ist eine Ähnlichkeitsaussage zwischen Gesichtern, wie “Die Tochter sieht dem Vater aber ähnlich!”. Die Ähnlichkeitsaussage wird i. d. R. subjektiv getroffen, ohne das “Messwerte” vorliegen. Der Nachteil ist allerdings, dass die Ergebnisse einer MDS schwierig zu interpretieren sind! Hier hilft Visualisierung, Kenntnisse über Umfeld / Daten und der gesunde Menschenverstand weiter. Konzept der MDS Das Konzept der MDS wird häufig über das Erstellen einer Landkarte auf Basis einer Städteentfernungstabelle (Abb. 2) erklärt. Die Entfernungsangaben in Abb. 2 spiegeln nicht die geographische Lage der Städte wieder, sondern nur paarweise Distanzen zwischen den Städten. D. h., die Entfernung zwischen Augsburg und Aachen beträgt 570 km. Die Landkarte stellt im Sinne der MDS eine Konfiguration im (zweidimensionalen) Wahrnehmungsraum aufgrund der Städte-Entfernungsangaben dar.
Abb. 2: Städteentfernungstabelle Über die MDS soll nun über die paarweisen Distanzen die relative Lage der Städte zueinander, also die Konfiguration, der Städte ermittelt werden. Die Entfernungsangaben in Abb. 2 können als Rangwerte interpretiert werden, wie in Abb.3 dargestellt. Die geringste Entfernung in Abb. 2 stellt in Abb. 3 den Rangwert 1 dar:
Abb. 3: Städteentfernung als Ränge Abb.4 zeigt die Konfiguration des zweidimensionalen Wahrnehmungsraums Landkarte für die Distanzränge Bremen, Augsburg und Berlin aus Abb. 3. Willkürlich wurde die Konstruktion mit der Distanz zwischen den Städten Bremen und Augsburg angefangen. Als 3. Stadt wird Berlin mit der Distanz Bremen - Berlin und Augsburg - Berlin in den Wahrnehmungsraum aufgenommen. Die Position von Berlin zu Augsburg aufgrund der Distanz (Abb. 2) lässt sich nur als Kreisbahn mit dem Distanzradius um Augsburg (blauer Kreis) beschreiben (Abb. 4). Die Position von Berlin zu Bremen wird ebenso als Kreisbahn mit dem Distanzradius Bremen-Berlin um Bremen (türkisener Kreis) abgebildet. Abb. 4 zeigt, dass die beiden Distanzkreise sich in 2 Punkten schneiden und somit ergeben sich 2 mögliche Lagen (Konfigurationen) für Berlin (dargestellt durch ein hellgraues und dunkelgraues Berlin) im Wahrnehmungsraum (Abb. 4). Welche Konfiguration (Lage von Berlin) gewählt wird, spielt keine Rolle für die MDS, da die beiden Konfigurationen spiegelbildlich identisch sind! D. h., die Konfiguration ist unabhängig von Spiegelung und Drehung (Rotation). Bei der MDS geht es nur darum, die relative Position der Objekte zueinander abzubilden! Für den Wahrnehmungsraum Landkarte steht die zweidimensionale Struktur fest und die Konfiguration für die 3 Beispielobjekte (Städte) ist sicher optimal. Anders sieht es für subjektive Wahrnehmungen über Objekte oder Zusammenhänge aus. Sind die dazu erhobenen Daten in hohem Maße verbunden (hoch strukturiert), kann ein höher dimensionierter Darstellungsraum (Wahrnehmungsraum) erforderlich sein. Auch hierbei gilt, Kenntnisse über die Daten hilft bei der Wahl der Darstellungsraumdimension und somit der Güte der Konfiguration. Wie oben schon erwähnt, soll die MDS die Daten dem Auge zugänglich machen und das Entdecken der Datenstruktur erleichtern. Das sollten Sie beim Zusammenspiel Dimension und Konfigurationsgüte ( Stress) berücksichtigen. Im Allgemeinen bedeutet ein höherdimensionaler Darstellungsraum einen geringeren Stress, weil zur optimalen Anpassung der Punkte mehr Möglichkeiten (Dimensionen) zur Verfügung stehen. Aber mehr dazu später! Bestimmung der Ähnlichkeit/Unähnlichkeit Die Konfiguration des Wahrnehmungsraumes (Darstellungsraumes) für Städtedistanz ist im Vergleich zur subjektiven Objektwahrnehmung ohne größere Probleme zu bestimmen. Die Position der Objekte im subjektiven Wahrnehmungsraum ist über Ähnlichkeit oder Unähnlichkeit der Objekte zueinander möglich. Je dichter zwei Objekte im Wahrnehmungsraum beieinander liegen, desto ähnlicher werden sie empfunden und folglich, je weiter sie auseinander liegen, desto unähnlicher. Wenn wir auf das Fahrzeugbeispiel zurückkommen, werden Fahrzeuge der Marke “VW” und “Opel” sicher ähnlicher empfunden, als “VW” und “Mercedes-Benz”. Wie werden die Ähnlichkeitsurteile ermittelt? Ähnlichkeitsurteile beziehen sich auf Paare von Objekten, die über Befragungen nach subjektiven Urteilen (z. B. das Prestige der Fahrzeugmarken “VW” und “Mecedes-Benz”) oder aber über Korrelationskoeffizienten bestimmt werden. Bei der Ankerpunktmethode dient jedes Objekt genau einmal als Vergleichsobjekt (als Ankerpunkt) für die verbleibenden Objekte, um diese in eine Ähnlichkeitsrangfolge zum Ankerpunkt zu bringen. D. h., “VW” wird z. B . als Ankerpunkt gewählt und dann die restlichen Fahrzeugmodelle bezüglich der Ähnlichkeit für die interessierende Eigenschaft beurteilt. Die Ähnlichkeitsbeurteilung wird mit einer Rangzahl versehen. Somit erhält man für n Objekte n(n-1) Rangwerte. Die aus dieser Methode resultierende Rangmatrix ist nicht unbedingt symmetrisch, da sich beim Vergleich der Objekte mit Ankerpunkt A im Vergleich zu Ankerpunkt B die Rangwerte unterscheiden können. Eine weitere Methode ist das Ratingverfahren (auch Likert-Skala nach Renisis Likert). Hier werden die Ähnlichkeitseinschätzungen (Unähnlichkeits-) auf einer Skala eingestuft. Abb. 5 zeigt eine 5-stufige Ratingskala, wobei Stufe 1 z. B. “vollkommen ähnlich” und Stufe 5 “vollkommen unähnlich” bedeuten kann. Die Zwischenstufen können zur Ausprägung der empfundenen Ähnlichkeit/Unähnlichkeit genutzt werden, wenn die Stufe 1 oder 5 subjektiv nicht vergeben werden kann. Die 3. Stufe nimmt in der 5-stufigen Skala oft eine neutrale Ausprägung ein. Neben der 5-stufigen Ratingskala sind auch 7- oder 9-stufige Ratingskalen in Verwendung. In der Literatur finden Sie Hinweise, keine ungeraden Ratingskalen wie in Abb. 5 gezeigt, sondern gerade Ratingskalen zu verwenden. Dadurch soll der Befragte gezwungen werden, sich für eine Ähnlichkeits- oder Unähnlichkeitsaussage zu entscheiden
. Es soll verhindert werden, dass der Befragte durch die Wahl der mittleren Ausprägung, in Abb. 5 ist es die 3, sich um eine Entscheidung drückt! Das Distanzmodell Die Ähnlichkeit von Objekten im Wahrnehmungsraum wird über Distanzen (auch Abstände, Metriken) abgebildet. Ähnliche Objekte liegen dicht zusammen, die Distanz ist gering, und für unähnliche Objekten liegen weiter auseinander, die Distanz ist größer. Dabei gilt für die Distanzen d 0 <= dij und dij = dji (Symmetrie). Die Distanzbestimmung ist in der MDS der wesentliche Bestandteil und dafür stehen verschiedene Verfahren zur Verfügung. Die oft genutzte euklidische Distanz (weil sie natürlicher zu interpretieren ist, siehe Konfiguration) wird neben weiteren Distanzverfahren hier beschrieben! Bestimmung der Konfiguration Die Bestimmung einer MDS-Konfiguration ist in den meisten Fällen mathematisch aufgrund der komplizierten Lösungsbedingungen nicht exakt durchführbar. Deswegen wird die Konfiguration iterativ durch Annäherungen bestimmt. Dabei wird bei einer Ausgangsbedingung gestartet und durch den Annäherungsalgorithmus wird versucht, die im Iterationsschritt erhaltene Lösung in weiteren Iterationsschritten zu verbessern. Ein Gütekriterium ist hierbei die Minimierung des Stresses, bis die Proximitäten als optimal betrachtet werden können. Je größer das Stress -Kriterium ausfällt, desto schlechter ist die Anpassung der Distanzen (siehe hierzu Backhaus oder Borg). Dabei ist immer zu bedenken, dass die iterative Lösung nicht die bestmögliche Lösung sein muss, sondern aufgrund des “Hängenbleibends” des Lösungsalgorithmuses in einem lokalen Optimum nur die lokale optimale Lösung sein kann! MDS-Konfiguration mit R Die MDS-Konfigurationen werden im Folgenden über die Statistikumgebung R mit Hilfe des Paketes smacof geschätzt. Das smacof-Paket bietet einige MDS-Methoden an aber deren Beschreibung kann aufgrund des Umfanges hier nicht erfolgen! Neben den MDS-Methoden werden auch entsprechende Beispieldatensätze angeboten . Das erste MDS-Beispiel wird mit dem Datensatz kinshipdelta (Verwandschaftsverhältnis) durchgeführt. Der Datensatz kinshipdelta wird hier auszugweise abgebildet: > data(kinshipdelta) Über die symmetrische Funktion smacofSym wird eine “normale” zweidimensionale MDS-Konfiguration im Wahrnehmungsraum geschätzt ( ist dietype = "ratio" Voreinstellung): > MDS_Schaetzung <- smacofSym(kinshipdelta, type = "ratio")
Der Datensatz besteht aus 15 Beobachtungen (Number of objects: 15). Die optimale Konfiguration wurde nach 91 Iterationen (Number of iterations: 91) mit einem Stress-Gütekriterium von 0.264 erreicht. Über die Funktion summary() werden die Schätzungen zur Konfiguration ausgegeben: > summary(MDS_Schaetzung) Wie oben im Text erwähnt, ist das Wesentliche einer MDS die Darstellung der Konfiguration im Wahrnehmungsraum. Über die plot-Funktion wird die Konfiguration über Distanzkoordinaten D1 und D2 dargestellt: > plot(MDS_Schaetzung, type = "p", label.conf = list(TRUE, 3, "darkgray"), pch
= 25, col = "red", main="Konfiguration des Verwandschaftsverhältnisses") Abb. 6: Zweidimensionale Konfiguration im Wahrnehmungsraum Die Ähnlichkeit zwischen Vater/Sohn/Bruder und Mutter/Tochter/Schwester trifft sicher die Erwartung aber letztendlich ist die Beziehung im Wahrnehmungsraum beeindruckend! Die Bereiche lassen sich durch “Vertrauensbereich-Ellipsen”(plot(confEllipse(MDS_Schaetzung))) optisch unterstützen. Als zweites Beispiel wird eine MDS-Konfiguration im dreidimensionalen Wahrnehmungsraum abgebildet. Für den Datensatz breakfast des Paketes smacof wird eine Unfolding-Modell-MDS über die Funktion smacofRect() (rectangular SMACOF) geschätzt (siehe Borg). > breakfast .. > MDS_3D <- smacofRect(breakfast, ndim = 3) Der Datensatz breakfast besteht aus 42 Beobachtungen (Befragungsteilnehmern) mit ihren Frühstückpräferenzen. Über die Funktion summary(MDS_3D) können die Daten zur MDS-Schätzung ausgegeben werden. Hier beschränken wir uns auf die grafische Darstellung des Wahrnehmungsraums mit Hilfe des R-Paketes rgl: > plot3d(MDS_3D$conf.row, type = "s", size = 1) Abb. 7: Dreidimensionale Konfiguration im Wahrnehmungsraum Die erzeugte Grafik können Sie über die Maus beliebig drehen!
|
Hat der Inhalt Ihnen weitergeholfen und Sie möchten diese Seiten unterstützen? |