Dieses Forum nutzt Cookies
Dieses Forum verwendet Cookies, um deine Login-Informationen zu speichern, wenn du registriert bist, und deinen letzten Besuch, wenn du es nicht bist. Cookies sind kleine Textdokumente, die auf deinem Computer gespeichert werden. Die von diesem Forum gesetzten Cookies werden nur auf dieser Website verwendet und stellen kein Sicherheitsrisiko dar. Cookies aus diesem Forum speichern auch die spezifischen Themen, die du gelesen hast und wann du zum letzten Mal gelesen hast. Bitte bestätige, ob du diese Cookies akzeptierst oder ablehnst.

Ein Cookie wird in deinem Browser unabhängig von der Wahl gespeichert, um zu verhindern, dass dir diese Frage erneut gestellt wird. Du kannst deine Cookie-Einstellungen jederzeit über den Link in der Fußzeile ändern.

Statistik // Lageparameter berechnen bei klassierten und gruppierten Daten
#1
Hallo ihr Lieben,

ich bin heute auf ein Problem gestoßen, welches die Berechnung der Lageparameter von klassierten Daten bei der univariaten Datenanalyse betrifft.

Ich habe das Dokument erstellt, welches ich beigefügt habe. Ich möchte gerne verschiedene Lageparameter aus einer Häufigkeitstabelle berechnen (keine Urliste) und habe hierzu schon verschiedene Funktionen ausprobiert und bin leider daran komplett gescheitert.  Undecided

Aus der Liste soll, sobald ein Wert erreicht ist, bspw. der Wert von 0,5 bei der relativen Summenhäufigkeit Fi, der Median berechnet werden. Ebenso die Quartile x0,25 sowie x0,75, und der Modus.

Hat jemand von euch eine Idee, welche Formeln ich hierfür anwenden kann? 


Besten Gruß,
tommyp92

.xlsx   statistik klassiert.xlsx (Größe: 17,91 KB / Downloads: 6)
Antworten Top
#2
Hallo Thomas!

Da du mit klassierten Daten arbeitest, gestaltet sich das Ganze ja um einiges schwieriger als mit einer Urliste. Im Anhang findest du mal einen ersten Versuch von mir (ich bin nicht mehr so in Statistik drin, verzeihe mir deshalb ungenaue Begriffsoperationalisierungen). Ich habe mir zunächst mal eine Hilfstabelle unter deine Ausgangsdaten gebaut. Wenn du von einem linearen Anstieg der Daten ausgehst, sollten die berechneten Werte für die Klassenelemente stimmen. Liegen diese Werte einmal vor, lassen sich problemlos alle von dir gewünschten Lageparameter berechnen (abgesehen vom Modus, da weiß ich zwar wie du auf die Modalklasse kommst und dann auch auf den Modus der Modalklasse, aber ich habe noch keine flexible Lösung in Excel gefunden -ist auch ganz schön spät gerade).

Mir ist leider keine Möglichkeit bekannt, wie du diese recht umständlichen und momentan händischen Maßnahmen mit Formeln einfach automatisieren könntest ohne die künstlichen Klassenelemente vorher zu berechnen. Vielleicht geht das einfacher mit VBA. Aber da bin ich nicht der richtige Ansprechpartner.

Ich hoffe trotzdem, dass dir meine Berechnungen etwas helfen und ansonsten hoffe ich, dass es hier andere User gibt, die dir (und mir) vielleicht noch mehr Aufschluss geben könne, wie man das kürzer und eleganter löst. Gerade bei großen Datenmengen könnte man so nicht vorgehen.

Grüße


Angehängte Dateien
.xlsx   statistik klassiert.xlsx (Größe: 24,06 KB / Downloads: 3)
[-] Folgende(r) 1 Nutzer sagt Danke an Florian19 für diesen Beitrag:
  • tommyp92
Antworten Top
#3
Tommy,

ich kann dir Mittelwert, Modalwert, Median, Standardarbweichung, Varianz und Geometrisches Mittel anbieten.

Arbeitsblatt mit dem Namen 'Auswertungen'
CDEFKLM
1KlasseHäufgkeitFunktionaus Häufigkeitstabelle
20,37Mittelwert1,51034483
30,69Modalwert0,62,7
40,960,61,82,7
51,24Anzahl Modalwerte3
61,53Median1,651,65
71,89Standardabweichung0,833705820,83370582
82,15Varianz0,69506540,6950654
92,46
102,79Geometrisches Mittel1,218880921,21888092

NameBezug
Häufigkeiten=Auswertungen!$D$2:$D$10
Klassen=Auswertungen!$C$2:$C$10

ZelleFormel
D2=ZÄHLENWENN(A:A;C2)
K2=SUMMENPRODUKT(Häufigkeiten*Klassen)/SUMME(Häufigkeiten)
D3=ZÄHLENWENN(A:A;C3)
K3=INDEX(Klassen;VERGLEICH(MAX(Häufigkeiten);Häufigkeiten;0))
L3=VERWEIS(MAX(Häufigkeiten);Klassen)
D4=ZÄHLENWENN(A:A;C4)
K4=AGGREGAT(15;6;Klassen/(Häufigkeiten=MAX(Häufigkeiten));SPALTEN($K4:K4))
L4=AGGREGAT(15;6;Klassen/(Häufigkeiten=MAX(Häufigkeiten));SPALTEN($K4:L4))
M4=AGGREGAT(15;6;Klassen/(Häufigkeiten=MAX(Häufigkeiten));SPALTEN($K4:M4))
D5=ZÄHLENWENN(A:A;C5)
K5=ZÄHLENWENN(Häufigkeiten;MAX(Häufigkeiten))
D6=ZÄHLENWENN(A:A;C6)
K6{=MEDIAN(WENN(SPALTE(1:1)<=Häufigkeiten;Klassen))}
L6=AGGREGAT(17;6;Klassen/(SPALTE(1:1)<=Häufigkeiten);2)
D7=ZÄHLENWENN(A:A;C7)
K7{=WURZEL(SUMME(((Klassen-K2)^2)*Häufigkeiten)/SUMME(Häufigkeiten))}
L7{=WURZEL(SUMME(((Klassen-SUMMENPRODUKT(Häufigkeiten*Klassen)/SUMME(Häufigkeiten))^2)*Häufigkeiten)/SUMME(Häufigkeiten))}
D8=ZÄHLENWENN(A:A;C8)
K8=K7^2
L8{=WURZEL(SUMME(((Klassen-SUMMENPRODUKT(Häufigkeiten*Klassen)/SUMME(Häufigkeiten))^2)*Häufigkeiten)/SUMME(Häufigkeiten))^2}
D9=ZÄHLENWENN(A:A;C9)
D10=ZÄHLENWENN(A:A;C10)
K10{=PRODUKT(POTENZ(Klassen;Häufigkeiten))^(1/SUMME(Häufigkeiten))}
L10{=POTENZ(PRODUKT(POTENZ(Klassen;Häufigkeiten));1/SUMME(Häufigkeiten))}
Achtung, Matrixformel enthalten!
Die geschweiften Klammern{} werden nicht eingegeben.
Verlassen Sie den Zelleneditor mit Strg+Shift + Enter, statt Enter alleine.
Verwendete Systemkomponenten: [Windows (32-bit) NT 6.01] MS Excel 2016
Diese Tabelle wurde mit Tab2Html (v2.6.0) erstellt. ©Gerd alias Bamberg
Wir sehen uns!
... Detlef

Meine Beiträge können Ironie oder Sarkasmus enthalten.

[-] Folgende(r) 1 Nutzer sagt Danke an shift-del für diesen Beitrag:
  • tommyp92
Antworten Top
#4
... erstmal vielen herzlichen Dank!
Ich werde mal eben die Formeln einfügen. Des Weiteren versuche ich noch eine elegantere Lösung für die Quartile zu finden, wobei die Tabelle so schon super funktioniert. Und ja, die Verlinkung, da habe ich wohl auch schon halb geschlafen. Vielen Dank für den Hinweis im Dokument. 

An der Uni nutzen wir die Funktion, welche ich dem Dokument hinzugefügt habe. Gibt es denn eine Funktion, in dem Fall für Spalte I, Tabelle kl., welche den Bereich nach dem ersten Wert, welcher größer als 0,5 ist, für den Median xz abfragt? Die Berechnung des Medians habe ich in Zelle E5, Datenauswertung kl, hinzugefügt. Die Berechnung müsste halt nur nach dem Raster ablaufen, dass ein Wert eine Zelle höher, einer in der Spalte der Klassenuntergrenze usw. abgefragt wird. Somit könnte eine "elegantere" Rechnung auch analog für die Quartile erfolgen. Ist dies mit normalen Funktionen möglich oder handelt sich das Vorhaben um eine sehr umständliche Variante?

Nochmals Danke im Voraus! 

tommyp92


.xlsx   Statistik klassiert v2.xlsx (Größe: 45,1 KB / Downloads: 6)
Antworten Top
#5
(13.03.2018, 18:14)tommyp92 schrieb: An der Uni nutzen wir die Funktion, welche ich dem Dokument hinzugefügt habe. Gibt es denn eine Funktion, in dem Fall für Spalte I, Tabelle kl., welche den Bereich nach dem ersten Wert, welcher größer als 0,5 ist, für den Median xz abfragt?

Ich bin mir nicht ganz sicher, ob ich deine Frage richtig verstanden habe. Prinzipiell würde ich wie folgt vorgehen:

Code:
wenn(G5>0,5;'Tabelle kl.'!D6+((0,5-'Tabelle kl.'!I5)/'Tabelle kl.'!G6)*'Tabelle kl.'!J6;G5)

Die Formel verwendest du dann in Spalte I für die anderen Sachverhalte (die erste Bedingung natürlich angepasst, da du ja später G5+G6 > 0,5 u.s.w. verwendest). Ich hab aber nicht ganz verstanden, wovon du dann den Median berechnen willst?

Grüße
Antworten Top


Gehe zu:


Benutzer, die gerade dieses Thema anschauen: 1 Gast/Gäste