statistisches Methodenwirrwarr

Gesperrt
touchtheday

statistisches Methodenwirrwarr

Beitrag von touchtheday »

Hallo Forum!

Ich habe das Forum mittels des Begriffs "Methode" nach einem vergleichbaren Thema durchforstet, aber keines gefunden. Allerdings bin ich zu selten hier, um sicher ausschließen zu können, dass es die Frage so nicht schon gab. Ein Übersehen bitte ich nachzusehen.

Allmählich bin ich in der Mitte meines Arbeitsprogrammes angekommen. Theoretische Grundlagen stehen, Tests sind entworfen und mit DV besprochen (der wie ich kein Statistiker ist), vorgetestet sowie in meinen Stichproben durchgeführt worden. Jetzt sitze ich an der statistischen Auswertung (ich muss das Ganze im Grunde 2x zu unterschiedlichen Zeitpunkten machen; dies ist der erste Zeitpunkt) und zweifle auf einmal massiv.

Ich bin von Haus aus kein Statistiker sondern Geisteswissenschaftler. Ich habe das statistische Grundlagenprogramm im Studium durchlaufen (nichts aus der Schulzeit) und im Rahmen der Dissertation (Block)Seminare für Statistik speziell für Sprachwissenschaftler an 'meiner' Uni (ich promoviere frei, bin aber als Promotionsstudent immatrikuliert und kann deshalb auf das Kursangebot zurückgreifen) besucht. Leider gibt es keinen "Hausstatistiker" an dieser Uni und die Veranstaltungen sind immer von Externen organisiert worden. Derzeit ist kein Ansprechpartner greifbar. Ausgehend von diesen Veranstaltungen arbeite ich mittlerweile mit R (kostenlos und schnell). Bevor es jetzt ernst wurde, bin ich davon ausgegangen, dass meine mittlerweile erarbeiteten Kenntnisse reichen werden, um an vernünftige Ergebnisse zu kommen. An vielen Punkten komme ich mit den Tests, die ich für ideal hielt, aber nicht weiter. Es wäre toll, wenn hier jemand spontan einen Denkfehler bemerken könnte, den ich mache. :-)

Ich habe 1128 Datensätze zu jeder Skala und möchte folgende Fragestellungen beantworten:

1. Zusammenhang zwischen Ergebnissen, die in verschiedenen Ordinalskalen dargestellt werden (bspw. Motivation Fremdeinschätzung, Motivation Selbsteinschätzung; hier kann ich keine Normalverteilung annehmen) -> hier gehe ich vom Mann-Whitney U-Test als ideal aus. Das ist mein geringstes Problem, hier erscheinen mir die Testergebnisse hinreichend plausibel und valide.

2. Zusammenhang zwischen Sozialraum (Intervall- bzw. Ordinalskala mit 5 numerischen Stufen, ich weiß, dass die GG gleichmäßig zu je 20% zugeordnet wird) mit einem Testergebnis (numerisch, unipolar, Intervallskala) -> hier dachte ich ebenfalls an den U-Test, aber alle meine Ergebnisse sind hochsignifikant, was in einem Fall nicht sein kann, wenn ich qualitativ interpretiere. Im Chi-Quadrat-Test (ich bin hinreichend verzweifelt, dass ich einfach wild rumprobiert habe, was für meine Sicherheit nicht besser war) habe ich Ergebnisse erreicht, die zu meiner qualitativen Einschätzung zu passen scheinen. Aber ich habe keine 4-Wert-Matrix, sondern letztlich 2x1128 Werte, also ist das doch wertlos, oder?

3. Zusammenhang zwischen Ergebnissen zweier unterschiedlicher Tests (Ordinalskala vs. Intervallskala bzw. 2 Intervallskalen; in jedem Fall numerisch und unipolar; Normalverteilung wird angenommen) -> hier hatte ich eigentlich an den t-Test gedacht, bin aber auch über ständig hoch signifikante Ergebnisse mit hohen r-Werten gestolpert. Ist meine Stichprobe zu groß oder kann ich dem trauen?

4. Zusammenhang zwischen Einschätzungen (Ordinalskalen) und Testergebnissen (Intervallskalen) -> hier habe ich im Prinzip den gleichen Stand wie in 2. erreicht und bin völlig verwirrt. Ausgehend vom U-Test bin ich jetzt beim Chi-Quadrat-Test, bei dem die Ergebnisse zu meiner qualitativen Analyse passen, aber eigentlich ist der Test doch völlig ungeeignet für das, was ich machen will. Oder?

Wäre toll, wenn mir hier jemand weiterhelfen könnte. Danke schonmal!
Doc-Wolfi

Re: statistisches Methodenwirrwarr

Beitrag von Doc-Wolfi »

Hallo,

nimm es mir nicht übel, aber was Du schreibst klingt so als würdest Du einfach R über Deine Daten jagen, ohne zu verstehen, was Du da tust...
touchtheday hat geschrieben: Ich habe das Forum mittels des Begriffs "Methode" nach einem vergleichbaren Thema durchforstet, aber keines gefunden. Allerdings bin ich zu selten hier, um sicher ausschließen zu können, dass es die Frage so nicht schon gab. Ein Übersehen bitte ich nachzusehen.
OK, diese unscharfe Suchstrategie ignoriere ich mal. :-)
touchtheday hat geschrieben: 1. Zusammenhang zwischen Ergebnissen, die in verschiedenen Ordinalskalen dargestellt werden (bspw. Motivation Fremdeinschätzung, Motivation Selbsteinschätzung; hier kann ich keine Normalverteilung annehmen) -> hier gehe ich vom Mann-Whitney U-Test als ideal aus. Das ist mein geringstes Problem, hier erscheinen mir die Testergebnisse hinreichend plausibel und valide.
Der Mann-Whitney-U-Test ist dafür da, um zu prüfen, ob zwei Sätze von Daten aus derselben Verteilung stammen. Was meinst Du überhaupt mit "Zusammenhang"? Korrelationen? Wie wäre es mit dem Spearman Rangkorrelationstest?
touchtheday hat geschrieben: 2. Zusammenhang zwischen Sozialraum (Intervall- bzw. Ordinalskala mit 5 numerischen Stufen, ich weiß, dass die GG gleichmäßig zu je 20% zugeordnet wird) mit einem Testergebnis (numerisch, unipolar, Intervallskala) -> hier dachte ich ebenfalls an den U-Test, aber alle meine Ergebnisse sind hochsignifikant, was in einem Fall nicht sein kann, wenn ich qualitativ interpretiere.
Was soll heißen "Intervall- bzw. Ordinalskala"? Entweder ist es das eine oder andere. Es kann nicht beides sein! Auch hier wäre eventuell ein Korrelationstest sinnvoll, falls Du Korrelationen suchst. Das ist mir unklar.
touchtheday hat geschrieben: Im Chi-Quadrat-Test (ich bin hinreichend verzweifelt, dass ich einfach wild rumprobiert habe, was für meine Sicherheit nicht besser war) habe ich Ergebnisse erreicht, die zu meiner qualitativen Einschätzung zu passen scheinen. Aber ich habe keine 4-Wert-Matrix, sondern letztlich 2x1128 Werte, also ist das doch wertlos, oder?
Du könntest auf eine 2x2-Matrix kommen, wenn Du bei den 1128 Werten zwei Kategorien hast. Dann zählst Du, wie viele der Messpunkte zu der einen Kategorie gehören und wie viele zur anderen.
touchtheday hat geschrieben: 3. Zusammenhang zwischen Ergebnissen zweier unterschiedlicher Tests (Ordinalskala vs. Intervallskala bzw. 2 Intervallskalen; in jedem Fall numerisch und unipolar; Normalverteilung wird angenommen) -> hier hatte ich eigentlich an den t-Test gedacht, bin aber auch über ständig hoch signifikante Ergebnisse mit hohen r-Werten gestolpert. Ist meine Stichprobe zu groß oder kann ich dem trauen?
Der T-Test prüft, ob die Daten aus derselben Verteilung stammen können oder die beobachteten Unterschiede statistisch signifikant sind. Für ordinalskaliserte Variablen macht er aber keinen Sinn.
touchtheday hat geschrieben: 4. Zusammenhang zwischen Einschätzungen (Ordinalskalen) und Testergebnissen (Intervallskalen) -> hier habe ich im Prinzip den gleichen Stand wie in 2. erreicht und bin völlig verwirrt. Ausgehend vom U-Test bin ich jetzt beim Chi-Quadrat-Test, bei dem die Ergebnisse zu meiner qualitativen Analyse passen, aber eigentlich ist der Test doch völlig ungeeignet für das, was ich machen will. Oder?
siehe oben

Viele Grüße,
Wolfi
flip
Beiträge: 1166
Registriert: 02.11.2012, 02:50
Hat sich bedankt: 2 Mal
Danksagung erhalten: 46 Mal

Re: statistisches Methodenwirrwarr

Beitrag von flip »

Du begehst den Fehler, den sehr, sehr viele Studenten und auch Doktoranden während ihrer Diss tun: nämlich dass sie den Umfnag statistischer Methoden drastisch unterschätzen.
In einer empirischen Arbeit beträgt die Zeit, mit der man sich damit beschäftigt grob die Hälfte bis zwei Drittel (wenn Datenaufbereitung/Erhebung noch dazu kommt).

Du promovierst jetzt seit über zwei Jahren. Dein Text oben zeigt mir, dass du wenig bis gar keine Ahnung von dem hast, was du da tust. Du kannst nicht einfach blind in Seminare mit der Erwartungshaltung gehen, dass dir dort alles erklärt wird. Du musst es selber begreifen. :!:


Alles, was du oben aufgezählt hast, ist Standard. Es ist kein Hexenwerk, es wird dir im Internet in zigtausend Tutorials beigebracht, es gibt zig Bücher dazu. Man muss es aber wollen. Ansonsten greift der alte Bundeswehrspruch: "Kann ich nicht, heißt will ich nicht." Also rann! :blume:

Du benötigst ganz sicher keine Hilfe von jemandem oder weitere Seminare.
Und ja, es wird Wochen dauern. Deine Fortschritte werden langsam und mühselig. Also sie werden kommen.
touchtheday

Re: statistisches Methodenwirrwarr

Beitrag von touchtheday »

Doc-Wolfi hat geschrieben:Hallo,

nimm es mir nicht übel, aber was Du schreibst klingt so als würdest Du einfach R über Deine Daten jagen, ohne zu verstehen, was Du da tust...
Das Gefühl hatte ich zunehmend, obwohl ich mir vorher recht sicher war. Also kann ich es dir nicht übel nehmen. :-) Danke auf jeden Fall für die Hinweise, auch in der PN, ich habe jetzt auf jeden Fall wieder einen Ansatzpunkt und komme weiter.
flip hat geschrieben:Du begehst den Fehler, den sehr, sehr viele Studenten und auch Doktoranden während ihrer Diss tun: nämlich dass sie den Umfnag statistischer Methoden drastisch unterschätzen.
In einer empirischen Arbeit beträgt die Zeit, mit der man sich damit beschäftigt grob die Hälfte bis zwei Drittel (wenn Datenaufbereitung/Erhebung noch dazu kommt).

Du promovierst jetzt seit über zwei Jahren. Dein Text oben zeigt mir, dass du wenig bis gar keine Ahnung von dem hast, was du da tust. Du kannst nicht einfach blind in Seminare mit der Erwartungshaltung gehen, dass dir dort alles erklärt wird. Du musst es selber begreifen. :!:
Als Didaktiker ist mir das zumindest irgendwie klar. Seltsam, wenn man plötzlich vor einem derart harten Brocken steht, verfliegen die Prinzipien. Aber es beruhigt, wenn man liest, das man nicht der einzige ist. Danke auf jeden Fall auch für deinen Post/deine Worte! :-) Der größte Teil meiner Zeit ist bisher für Grundlagenforschung etc. draufgegangen. Der statistische Auswertungsteil beginnt erst jetzt. Ich habe immer angenommen, dass das eine Menge Zeit kostet, allerdings -- wie Wolfi schon angedeutet hat -- habe ich den Zeitbedarf immer in der Datenaufbereitung und -erhebung gesehen und tatsächlich erwartet, dass die Auswertung easy wird, wenn die Tabellen gut sind.
flip hat geschrieben:Alles, was du oben aufgezählt hast, ist Standard. Es ist kein Hexenwerk, es wird dir im Internet in zigtausend Tutorials beigebracht, es gibt zig Bücher dazu. Man muss es aber wollen. Ansonsten greift der alte Bundeswehrspruch: "Kann ich nicht, heißt will ich nicht." Also rann! :blume:

Du benötigst ganz sicher keine Hilfe von jemandem oder weitere Seminare.
Und ja, es wird Wochen dauern. Deine Fortschritte werden langsam und mühselig. Also sie werden kommen.
Läuft. Danke auf jeden Fall, ihr habt mir beide wieder mächtig weitergeholfen. :-)
Doc-Wolfi

Re: statistisches Methodenwirrwarr

Beitrag von Doc-Wolfi »

Hallo touchtheday
touchtheday hat geschrieben: Als Didaktiker ist mir das zumindest irgendwie klar. Seltsam, wenn man plötzlich vor einem derart harten Brocken steht, verfliegen die Prinzipien. Aber es beruhigt, wenn man liest, das man nicht der einzige ist. Danke auf jeden Fall auch für deinen Post/deine Worte! :-) Der größte Teil meiner Zeit ist bisher für Grundlagenforschung etc. draufgegangen. Der statistische Auswertungsteil beginnt erst jetzt. Ich habe immer angenommen, dass das eine Menge Zeit kostet, allerdings -- wie Wolfi schon angedeutet hat -- habe ich den Zeitbedarf immer in der Datenaufbereitung und -erhebung gesehen und tatsächlich erwartet, dass die Auswertung easy wird, wenn die Tabellen gut sind.
flip hat geschrieben:Alles, was du oben aufgezählt hast, ist Standard. Es ist kein Hexenwerk, es wird dir im Internet in zigtausend Tutorials beigebracht, es gibt zig Bücher dazu. Man muss es aber wollen. Ansonsten greift der alte Bundeswehrspruch: "Kann ich nicht, heißt will ich nicht." Also rann! :blume:

Du benötigst ganz sicher keine Hilfe von jemandem oder weitere Seminare.
Und ja, es wird Wochen dauern. Deine Fortschritte werden langsam und mühselig. Also sie werden kommen.
Läuft. Danke auf jeden Fall, ihr habt mir beide wieder mächtig weitergeholfen. :-)
Hoffe ich. Auf jeden Fall ist Statistik nicht so einfach. Und wie eine Studentin von mir mal sagte: "Komisch, im Statistikkurs wurde uns immer gesagt, welche Methode wir verwenden sollen. Jetzt mache ich mir zum ersten Mal darüber Gedanken, welche Methode wann anzuwenden ist und welche wann am besten passt." Genau!

Ach, ich weiß nicht, ob Seminare oder Hilfe nicht doch hilfreich sind. Touchtheday würde die Kursinhalte jetzt mit anderen Augen sehen. :-)

Ich denke, der erste Schritt besteht darin, die Fragestellungen nochmal klarer zu formulieren.
Was sind die unabhängigen und abhängigen Variablen? Welches Skalenniveau haben sie? Welche Frage soll beantwortet werden?
Daraus ergibt sich dann die passende statistische Methode. Und dann wird es einfacher. :-)

Viele Grüße, Wolfi
Gesperrt