Zurück zum Lexikon...

Klassenbildung

Die Klassenbildung (Klassierung, Kategorisierung) von stetigen Daten (Merkmalsausprägungen) in Klassen (K1, ... Km) ist eine Datenzusammenfassung (Komprimierung), um durch dann die erhaltene Strukturierung eine Aussage über deren Häufigkeitsverteilung machen zu können. Die Komprimierung ist von der Anzahl der Klassen abhängig, d. h., ist die Anzahl zu klein, also wenige Klassen, gehen vielleicht zu viele Informationen verloren und ist sie zu groß, also zu viele Klassen, könnte die Struktur verloren gehen.
Diese Klassierung kann dann natürlich auch als Histogramm grafisch dargestellt werden und ist dadurch wesentlich anschaulicher.

Um die Daten klassieren zu können, muss der Datenbereich (Ergebnisraum), xmin bis xmax in eine vorgegebene Klassenanzahl m (Intervalle) eingeteilt werden. Die Länge dieser Intervalle wird als Klassenbreite b bezeichnet und sie sollte für jedes Intervall gleich groß, äquidistant, sein.

Die äquidistante Klassenbreite b ist von der Klassenanzahl m abhängig und neben der subjektiven Schätzung von m sollte folgende Faustregel angewendet werden:

Die Empfehlung aufgrund der Faustregel lautet in dem links dargestellten Beispiel:
Um 49 Daten zu klassieren, sollten m = 7 Klassen gebildet werden.
Bei Bedarf wird m gerundet.

Ausgehend von der Klassenanzahl m kann nun die äquidistante Klassenbreite b berechnet werden:

Für das unten gezeigte Beispiel mit dem Statistiklabor besitzt b folgenden Wert:

Jede Merkmalsausprägung kann nun seiner Klasse zugeordnet werden:

Statistiklabor-Beispiel:

Beispiel als Zip-Datei laden...

Es kann sinnvoll sein, dass Intervall der ersten oder letzten Klasse nach unten bzw. oben offen zu definieren. D. h., diese Klassen haben keine untere oder obere Grenze, können also beliebig kleine oder große Werte aufnehmen.

Die absolute Häufigkeit einer Klasse n(Kj) entspricht der Summe der Merkmalsausprägungen, die dieser Klasse zugeordnet wurden:

Die relative Häufigkeit einer Klasse f(kj) entspricht der Summe der Merkmalsausprägungen, die dieser Klasse zugeordnet wurden, dividiert durch die Gesamtanzahl n der Beobachtungen:

Als Beispiel für die relative Klassenhäufigkeit wird die Berechnung für die 5 Klasse nachvollzogen:

Die Summe der relativen Häufigkeit (kumulierte relative Häufigkeit) entspricht 1:

Seitenanfang

Hat der Inhalt Ihnen weitergeholfen und Sie möchten diese Seiten unterstützen?