Diskriminanz-LinDA



*Zurück...*

	Diskriminanzanalyse mit dem R-Paket LinDA

	Laden Sie das Paket LinDA (Lineare Diskriminanzanalyse) und die Beispieldaten in die R-Umgebung: > data(Beispiel)

		Das Datenobjekt Beispiel beinhaltet das 3-Gruppen-Beispiel. Über die Funktion linda.lda() wird die Diskriminanzfunktion geschätzt und in Funktion abgelegt. Die Attribute erweitert = TRUE und gruppenP = TRUE geben die Standardabweichungen, Mittelwerte und wahrscheinliche Gruppenzugehörigkeit aus: > Funktion <- linda.lda(Beispiel, erweitert = TRUE, gruppenP = TRUE)

		Ausgabe: Lienare Diskriminanzfunktion Verteilung der Merkmale zwischen den Gruppen (1 = 100%): A B C 0.3333333 0.3333333 0.3333333 Gruppenmittelwerte: Sicherheit Umwelt Innovativ Prestige A 8.400000 6.533333 7.933333 8.666667 B 8.466667 8.200000 5.333333 5.600000 C 4.533333 7.866667 3.533333 2.866667 Gruppenstandardabweichungen: Sicherheit Umwelt Innovativ Prestige A 1.0555973 1.0600988 1.3345233 0.9759001 B 0.9154754 1.0141851 0.7237469 0.6324555 C 0.9154754 0.9154754 0.6399405 0.6399405 Konstante Glieder b0 (LD1...LDn): [1] -7.765268 -6.098156 Koeffizienten der Diskriminanzfunktion (LD1...n): LD1 LD2 Sicherheit 0.4018996 0.8831480 Umwelt -0.3377654 0.3969992 Innovativ 0.4076665 -0.2366116 Prestige 0.9034934 -0.3269652 Wahrscheinliche Gruppenzugehörigkeit (1 = 100%) und deren Klassierung: A B C Gruppe 1 1.000000e+00 7.346040e-10 4.794868e-24 A 2 9.999974e-01 2.620214e-06 2.061498e-16 A 3 1.000000e+00 1.789203e-08 2.551615e-21 A 4 9.999997e-01 3.336379e-07 5.023774e-21 A 5 1.000000e+00 3.023734e-08 1.118747e-27 A 6 9.993389e-01 6.611424e-04 3.515529e-12 A 7 1.000000e+00 2.184183e-08 4.817927e-24 A 8 9.999997e-01 2.787064e-07 9.409756e-20 A 9 9.999974e-01 2.572034e-06 4.656750e-16 A 10 9.996901e-01 3.099447e-04 7.788740e-15 A 11 9.999998e-01 2.377653e-07 1.002834e-18 A 12 2.203104e-13 1.000000e+00 8.770083e-10 B 13 9.999995e-01 5.158841e-07 2.271002e-23 A 14 9.983323e-01 1.667687e-03 4.521033e-18 A 15 9.999566e-01 4.335960e-05 4.748893e-16 A 16 2.814706e-07 9.999286e-01 7.108160e-05 B 17 2.018240e-08 9.997729e-01 2.270301e-04 B 18 2.677648e-05 9.999731e-01 7.493698e-08 B 19 1.183567e-04 9.988419e-01 1.039753e-03 B 20 3.209768e-04 9.996780e-01 1.067358e-06 B 21 2.814706e-07 9.999286e-01 7.108160e-05 B 22 2.286455e-07 9.999926e-01 7.177334e-06 B 23 6.101408e-05 9.999380e-01 9.591310e-07 B 24 1.459639e-07 9.999998e-01 4.422044e-08 B 25 2.456515e-04 9.997543e-01 1.664885e-08 B 26 3.646441e-05 9.999614e-01 2.176238e-06 B 27 3.646441e-05 9.999614e-01 2.176238e-06 B 28 5.997465e-04 9.994003e-01 7.457860e-10 B 29 2.509357e-05 9.999749e-01 7.047307e-10 B 30 4.278902e-07 9.953805e-01 4.619039e-03 B 31 4.654544e-18 3.297362e-07 9.999997e-01 C 32 2.098572e-18 2.540093e-06 9.999975e-01 C 33 2.280632e-16 2.826467e-05 9.999717e-01 C 34 8.242643e-14 1.387045e-02 9.861295e-01 C 35 1.838896e-19 1.610334e-07 9.999998e-01 C 36 1.498186e-16 1.660190e-05 9.999834e-01 C 37 4.727051e-22 3.673428e-10 1.000000e+00 C 38 9.297544e-22 1.522779e-08 1.000000e+00 C 39 3.613065e-19 3.436823e-07 9.999997e-01 C 40 4.626008e-15 4.931717e-05 9.999507e-01 C 41 6.307707e-16 9.294946e-04 9.990705e-01 C 42 4.599257e-17 1.012873e-07 9.999999e-01 C 43 7.380633e-18 8.066053e-06 9.999919e-01 C 44 4.096082e-15 6.282197e-05 9.999372e-01 C 45 7.099391e-26 1.188476e-09 1.000000e+00 C

	Abbildung 1: Ausgabe der Diskriminanzfunktion und weiterer Daten

		Zur Schätzung der Gruppenzuordnung neuer Daten (Diskriminanz_Predict_Test) laden Sie diese in das Objekt Test: > Test <- read.csv2("Diskriminanz_Predict_Test.csv")

		Schauen Sie sich die Test-Daten an und führen Sie die Schätzung der Gruppierung mit der Funktion linda.predict() durch (Abbildung 2): > Schätzung <- linda.predict(Funktion, Test)

	Ausgabe: Schätzung der Klassifizierung auf Basis LinDA.lda-Anpassung: Schätzung der Gruppenzugehörigkeit als Gruppe und Wahrscheinlichkeit 1 = 100%): Gruppe A B C 1 A 1.000000e+00 1.846640e-09 2.117694e-23 2 A 9.999983e-01 1.663140e-06 5.917994e-17 3 B 1.945914e-05 9.999805e-01 5.742560e-08 4 A 9.999996e-01 3.813227e-07 5.813671e-23 5 A 9.995192e-01 4.808307e-04 1.094949e-18 6 A 9.999756e-01 2.441766e-05 1.454909e-16 7 B 2.228376e-07 9.999542e-01 4.557468e-05 8 B 2.160266e-08 9.998218e-01 1.781563e-04 9 B 1.285059e-07 9.999998e-01 3.759545e-08 10 B 2.006637e-04 9.997993e-01 1.468560e-08 11 B 2.474595e-05 9.999738e-01 1.413729e-06 12 B 2.474595e-05 9.999738e-01 1.413729e-06 13 B 1.821794e-04 9.998178e-01 1.740374e-09 14 B 1.427000e-05 9.999857e-01 1.166174e-09 15 B 3.244018e-07 9.955305e-01 4.469135e-03 16 C 1.599058e-18 2.295355e-07 9.999998e-01 17 C 6.504182e-19 1.370766e-06 9.999986e-01 18 C 1.077109e-16 2.260817e-05 9.999774e-01 19 C 7.333275e-18 7.688062e-08 9.999999e-01 20 C 2.671210e-18 5.782792e-06 9.999942e-01 21 C 2.328343e-15 4.418862e-05 9.999558e-01 22 C 9.558693e-25 1.863697e-09 1.000000e+00

		Abbildung 2: Ausgabe der geschätzten Gruppenzugehörigkeit

		Das Ergebnis der Schätzung (Abb. 2) wird neben der Ausgabe auch im Objekt Schätzung gespeichert. Schätzung enthält zusätzlich die Diskriminanzwerte y (LD1/LD2) der Test-Daten (Abb. 3):

> Schätzung
              A            B            C Gruppe        LD1        LD2
1 1.000000e+00 1.846640e-09 2.117694e-23      A 5.7196022 -1.8135226
2 9.999983e-01 1.663140e-06 5.917994e-17      A 4.0764438 -1.9727062
3 1.945914e-05 9.999805e-01 5.742560e-08      B 0.6089981 1.8813195
4 9.999996e-01 3.813227e-07 5.813671e-23      A 5.6199081 0.2797385
5 9.995192e-01 4.808307e-04 1.094949e-18      A 4.5367108 1.3103485
6 9.999756e-01 2.441766e-05 1.454909e-16      A 3.9825166 -0.9992046
7 2.228376e-07 9.999542e-01 4.557468e-05      B -0.6264938 1.4855243
8 2.160266e-08 9.998218e-01 1.781563e-04      B -1.0341603 1.7221359
9 1.285059e-07 9.999998e-01 3.759545e-08      B 0.1074044 3.0914327
10 2.006637e-04 9.997993e-01 1.468560e-08      B 1.0166646 1.6447079
11 2.474595e-05 9.999738e-01 1.413729e-06      B 0.2769995 1.1585591
12 2.474595e-05 9.999738e-01 1.413729e-06      B 0.2769995 1.1585591
13 1.821794e-04 9.998178e-01 1.740374e-09      B 1.2446271 2.1117410
14 1.427000e-05 9.999857e-01 1.166174e-09      B 1.0108977 2.7644674
15 3.244018e-07 9.955305e-01 4.469135e-03      B -1.0982945 0.4419888
16 1.599058e-18 2.295355e-07 9.999998e-01      C -4.5885477 -1.4773005
17 6.504182e-19 1.370766e-06 9.999986e-01      C -4.6824749 -0.5037990
18 1.077109e-16 2.260817e-05 9.999774e-01      C -4.1167470 -0.4337650
19 7.333275e-18 7.688062e-08 9.999999e-01      C -4.4247194 -2.2904146
20 2.671210e-18 5.782792e-06 9.999942e-01      C -4.5244135 -0.1971534
21 2.328343e-15 4.418862e-05 9.999558e-01      C -3.7789816 -0.8307642
22 9.558693e-25 1.863697e-09 1.000000e+00      C -6.1675719 -0.3563370


	Abbildung 3: Inhalt des Datenobjekt Schätzung

Um sich einen grafischen Überblick der Gruppenzugehörigkeit und -verteilung zu verschaffen, dient die Funktion linda.plot(). Da es sich hier um ein 3-Gruppen-Beispiel handelt, kann natürlich nur LD1 gegen LD2 angezeigt werden. Über linda.plot() können nur bis zu 4-Gruppen-Beispiele dargestellt werden (siehe Hilfe). Der Funktionsaufruf ...

> linda.plot(Schätzung)

... zeigt folgende Grafik (Abb. 4):




			Abbildung 4: Grafische Ausgabe der geschätzten Gruppenzugehörigkeit


	Hat der Inhalt Ihnen weitergeholfen und Sie möchten diese Seiten unterstützen?

Impressum

Datenschutz