Zurück...

Diskriminanzanalyse mit dem R-Paket LinDA

Laden Sie das Paket LinDA (Lineare Diskriminanzanalyse) und die Beispieldaten in die R-Umgebung:

      > data(Beispiel)

Das Datenobjekt Beispiel beinhaltet das 3-Gruppen-Beispiel. Über die Funktion linda.lda() wird die Diskriminanzfunktion geschätzt und in Funktion abgelegt. Die Attribute erweitert = TRUE und gruppenP = TRUE geben die Standardabweichungen, Mittelwerte und wahrscheinliche Gruppenzugehörigkeit aus:

    > Funktion <- linda.lda(Beispiel, erweitert = TRUE, gruppenP = TRUE)

Ausgabe:


          Lienare Diskriminanzfunktion
       
      Verteilung der Merkmale zwischen den Gruppen (1 = 100%):
              A         B         C
      0.3333333 0.3333333 0.3333333

      Gruppenmittelwerte:
        Sicherheit   Umwelt Innovativ Prestige
      A   8.400000 6.533333  7.933333 8.666667
      B   8.466667 8.200000  5.333333 5.600000
      C   4.533333 7.866667  3.533333 2.866667

      Gruppenstandardabweichungen:
        Sicherheit    Umwelt Innovativ  Prestige
      A  1.0555973 1.0600988 1.3345233 0.9759001
      B  0.9154754 1.0141851 0.7237469 0.6324555
      C  0.9154754 0.9154754 0.6399405 0.6399405

      Konstante Glieder b0 (LD1...LDn):
      [1] -7.765268 -6.098156


      Koeffizienten der Diskriminanzfunktion (LD1...n):
                        LD1        LD2
      Sicherheit  0.4018996  0.8831480
      Umwelt     -0.3377654  0.3969992
      Innovativ   0.4076665 -0.2366116
      Prestige    0.9034934 -0.3269652


      Wahrscheinliche Gruppenzugehörigkeit (1 = 100%) und deren Klassierung:
                    A            B            C Gruppe
      1  1.000000e+00 7.346040e-10 4.794868e-24      A
      2  9.999974e-01 2.620214e-06 2.061498e-16      A
      3  1.000000e+00 1.789203e-08 2.551615e-21      A
      4  9.999997e-01 3.336379e-07 5.023774e-21      A
      5  1.000000e+00 3.023734e-08 1.118747e-27      A
      6  9.993389e-01 6.611424e-04 3.515529e-12      A
      7  1.000000e+00 2.184183e-08 4.817927e-24      A
      8  9.999997e-01 2.787064e-07 9.409756e-20      A
      9  9.999974e-01 2.572034e-06 4.656750e-16      A
      10 9.996901e-01 3.099447e-04 7.788740e-15      A
      11 9.999998e-01 2.377653e-07 1.002834e-18      A
      12 2.203104e-13 1.000000e+00 8.770083e-10      B
      13 9.999995e-01 5.158841e-07 2.271002e-23      A
      14 9.983323e-01 1.667687e-03 4.521033e-18      A
      15 9.999566e-01 4.335960e-05 4.748893e-16      A
      16 2.814706e-07 9.999286e-01 7.108160e-05      B
      17 2.018240e-08 9.997729e-01 2.270301e-04      B
      18 2.677648e-05 9.999731e-01 7.493698e-08      B
      19 1.183567e-04 9.988419e-01 1.039753e-03      B
      20 3.209768e-04 9.996780e-01 1.067358e-06      B
      21 2.814706e-07 9.999286e-01 7.108160e-05      B
      22 2.286455e-07 9.999926e-01 7.177334e-06      B
      23 6.101408e-05 9.999380e-01 9.591310e-07      B
      24 1.459639e-07 9.999998e-01 4.422044e-08      B
      25 2.456515e-04 9.997543e-01 1.664885e-08      B
      26 3.646441e-05 9.999614e-01 2.176238e-06      B
      27 3.646441e-05 9.999614e-01 2.176238e-06      B
      28 5.997465e-04 9.994003e-01 7.457860e-10      B
      29 2.509357e-05 9.999749e-01 7.047307e-10      B
      30 4.278902e-07 9.953805e-01 4.619039e-03      B
      31 4.654544e-18 3.297362e-07 9.999997e-01      C
      32 2.098572e-18 2.540093e-06 9.999975e-01      C
      33 2.280632e-16 2.826467e-05 9.999717e-01      C
      34 8.242643e-14 1.387045e-02 9.861295e-01      C
      35 1.838896e-19 1.610334e-07 9.999998e-01      C
      36 1.498186e-16 1.660190e-05 9.999834e-01      C
      37 4.727051e-22 3.673428e-10 1.000000e+00      C
      38 9.297544e-22 1.522779e-08 1.000000e+00      C
      39 3.613065e-19 3.436823e-07 9.999997e-01      C
      40 4.626008e-15 4.931717e-05 9.999507e-01      C
      41 6.307707e-16 9.294946e-04 9.990705e-01      C
      42 4.599257e-17 1.012873e-07 9.999999e-01      C
      43 7.380633e-18 8.066053e-06 9.999919e-01      C
      44 4.096082e-15 6.282197e-05 9.999372e-01      C
      45 7.099391e-26 1.188476e-09 1.000000e+00      C

Abbildung 1: Ausgabe der Diskriminanzfunktion und weiterer Daten

Zur Schätzung der Gruppenzuordnung neuer Daten (Diskriminanz_Predict_Test) laden Sie diese in das Objekt Test:

      > Test <- read.csv2("Diskriminanz_Predict_Test.csv")

Schauen Sie sich die Test-Daten an und führen Sie die Schätzung der Gruppierung mit der Funktion linda.predict() durch (Abbildung 2):

      > Schätzung <- linda.predict(Funktion, Test)

Ausgabe:


          Schätzung der Klassifizierung auf Basis LinDA.lda-Anpassung:

      Schätzung der Gruppenzugehörigkeit als Gruppe und
      Wahrscheinlichkeit 1 = 100%):
       
         Gruppe            A            B            C
      1       A 1.000000e+00 1.846640e-09 2.117694e-23
      2       A 9.999983e-01 1.663140e-06 5.917994e-17
      3       B 1.945914e-05 9.999805e-01 5.742560e-08
      4       A 9.999996e-01 3.813227e-07 5.813671e-23
      5       A 9.995192e-01 4.808307e-04 1.094949e-18
      6       A 9.999756e-01 2.441766e-05 1.454909e-16
      7       B 2.228376e-07 9.999542e-01 4.557468e-05
      8       B 2.160266e-08 9.998218e-01 1.781563e-04
      9       B 1.285059e-07 9.999998e-01 3.759545e-08
      10      B 2.006637e-04 9.997993e-01 1.468560e-08
      11      B 2.474595e-05 9.999738e-01 1.413729e-06
      12      B 2.474595e-05 9.999738e-01 1.413729e-06
      13      B 1.821794e-04 9.998178e-01 1.740374e-09
      14      B 1.427000e-05 9.999857e-01 1.166174e-09
      15      B 3.244018e-07 9.955305e-01 4.469135e-03
      16      C 1.599058e-18 2.295355e-07 9.999998e-01
      17      C 6.504182e-19 1.370766e-06 9.999986e-01
      18      C 1.077109e-16 2.260817e-05 9.999774e-01
      19      C 7.333275e-18 7.688062e-08 9.999999e-01
      20      C 2.671210e-18 5.782792e-06 9.999942e-01
      21      C 2.328343e-15 4.418862e-05 9.999558e-01
      22      C 9.558693e-25 1.863697e-09 1.000000e+00

Abbildung 2: Ausgabe der geschätzten Gruppenzugehörigkeit

Das Ergebnis der Schätzung (Abb. 2) wird neben der Ausgabe auch im Objekt Schätzung gespeichert. Schätzung enthält zusätzlich die Diskriminanzwerte y (LD1/LD2) der Test-Daten (Abb. 3):

> Schätzung
              A            B            C Gruppe        LD1        LD2
1  1.000000e+00 1.846640e-09 2.117694e-23      A  5.7196022 -1.8135226
2  9.999983e-01 1.663140e-06 5.917994e-17      A  4.0764438 -1.9727062
3  1.945914e-05 9.999805e-01 5.742560e-08      B  0.6089981  1.8813195
4  9.999996e-01 3.813227e-07 5.813671e-23      A  5.6199081  0.2797385
5  9.995192e-01 4.808307e-04 1.094949e-18      A  4.5367108  1.3103485
6  9.999756e-01 2.441766e-05 1.454909e-16      A  3.9825166 -0.9992046
7  2.228376e-07 9.999542e-01 4.557468e-05      B -0.6264938  1.4855243
8  2.160266e-08 9.998218e-01 1.781563e-04      B -1.0341603  1.7221359
9  1.285059e-07 9.999998e-01 3.759545e-08      B  0.1074044  3.0914327
10 2.006637e-04 9.997993e-01 1.468560e-08      B  1.0166646  1.6447079
11 2.474595e-05 9.999738e-01 1.413729e-06      B  0.2769995  1.1585591
12 2.474595e-05 9.999738e-01 1.413729e-06      B  0.2769995  1.1585591
13 1.821794e-04 9.998178e-01 1.740374e-09      B  1.2446271  2.1117410
14 1.427000e-05 9.999857e-01 1.166174e-09      B  1.0108977  2.7644674
15 3.244018e-07 9.955305e-01 4.469135e-03      B -1.0982945  0.4419888
16 1.599058e-18 2.295355e-07 9.999998e-01      C -4.5885477 -1.4773005
17 6.504182e-19 1.370766e-06 9.999986e-01      C -4.6824749 -0.5037990
18 1.077109e-16 2.260817e-05 9.999774e-01      C -4.1167470 -0.4337650
19 7.333275e-18 7.688062e-08 9.999999e-01      C -4.4247194 -2.2904146
20 2.671210e-18 5.782792e-06 9.999942e-01      C -4.5244135 -0.1971534
21 2.328343e-15 4.418862e-05 9.999558e-01      C -3.7789816 -0.8307642
22 9.558693e-25 1.863697e-09 1.000000e+00      C -6.1675719 -0.3563370

Abbildung 3: Inhalt des Datenobjekt Schätzung

Um sich einen grafischen Überblick der Gruppenzugehörigkeit und -verteilung zu verschaffen, dient die Funktion linda.plot().  Da es sich hier um ein 3-Gruppen-Beispiel handelt, kann natürlich nur LD1 gegen LD2 angezeigt werden. Über linda.plot() können nur bis zu 4-Gruppen-Beispiele dargestellt werden (siehe Hilfe). Der Funktionsaufruf ...

> linda.plot(Schätzung)

... zeigt folgende Grafik (Abb. 4):

Abbildung 4: Grafische Ausgabe der geschätzten Gruppenzugehörigkeit

Sprung zum Seitenanfang

Hat der Inhalt Ihnen weitergeholfen und Sie möchten diese Seiten unterstützen?