Neu hier ... und ein paar Fragen an die Statistik-Cracks

Jahresarchiv
Gesperrt
touchtheday

Neu hier ... und ein paar Fragen an die Statistik-Cracks

Beitrag von touchtheday »

Hallo alle miteinander!

Ich bin neu hier, suche also Anschluss an die Community. Von Haus aus bin ich Germanist, seit vergangenem Winter arbeite ich an einer Dissertation zu einem sprachdidaktischen Thema an einer Universität in Deutschland. Das ganze ist als Langzeitstudie über etwas mehr als vier Jahre ausgelegt. Ich hoffe, dass ich hier in diesem Forum in dieser Zeit und danach etwas behilflich sein kann, habe mich aber natürlich selbst auch deshalb angemeldet, weil ich Hilfe brauche. Es geht nicht um Grundsätzliches, eher um Spezielles: Mein Problem ist nämlich, dass ich aus meinem grundständigen Studium keine nennenswerte Statistikerfahrung habe. Für die Grundlagen besuche ich entsprechende Veranstaltungen an der Universität, an der ich zwecks Promotion immatrikuliert bin ... aber ich habe doch einige spezielle Fragen, die hoffentlich jemand beantworten kann, die oder der in einer empirischen Arbeit schon etwas mehr Erfahrung hat. Ich freue mich auf Antworten!

Also:

1. Angenommen, ich untersuche eine soziale Einrichtung in einer bestimmten Kommune, zu der mir Daten zu allen wesentlichen Faktoren (Arbeitslosigkeit, Migration ...) vorliegen. Gibt es Erfahrungswerte, bis zu welcher Einwohnerzahl ich von validen Ergebnissen ausgehen kann, wenn ich die kommunalen Daten anlege? Andersherum: Ab welcher Einwohnerzahl einer Kommune bräuchte ich weiter unterregionalisierte Daten, bspw. zu Stadtteilen oder wenigstens Stadtbezirken, sofern ich diese bekommen kann?
Konkreter: In einer Kommune mit 10.000 Einwohnern gehe ich davon aus, dass veränderte Siedlungsstrukturen in einzelnen Ortsteilen keinen nennenswerten Einfluss auf Einrichtungen haben, die es im Stadtgebiet nur in geringer Anzahl gibt und die naturgemäß von allen relevanten Gesellschaftsteilen gleichermaßen genutzt werden, weil Ortsteile mit starken Sozialdaten unmittelbar an solche mit schwachen Sozialdaten angrenzen und selten mehr als wenige Straßen umfassen. In Köln kann ich das unmöglich unterstellen und bräuchte unbedingt unterkommunale Daten. Bei welcher Zahl ließe sich — verlässlich — eine Grenze ziehen? Mir ist klar, dass das von weiteren Faktoren abhängen kann, aber für mich wäre ein Richtwert mit Quelle unersetzlich, den ich einfach selbst nicht finde (und mein statistisches Grundverständnis ist für eine eigene Hochrechnung zu gering; also ggf. freue ich mich auch einfach über einen Tipp, der mir bei einer eigenen Hypothese hilft!) damit ich mich nicht monatelange bei der Vorarbeit verrenne, ohne überhaupt mit der eigentlichen Arbeit begonnen zu haben.

2. Hat jemand Erfahrungen damit gemacht, welche statistischen Ämter von größeren Städten unterkommunale Daten überhaupt herausgeben?

Ich bedanke mich für eure Hilfe!
DoneXY

Re: Neu hier ... und ein paar Fragen an die Statistik-Cracks

Beitrag von DoneXY »

Ich bin mir nicht sicher, ob Deine Frage so zu beantworten ist.

Wenn Du bspw. die Arbeitslosenquote Kölns über vier Jahre betrachtest, brauchst Du natürlich keine weitere 'regionale' Gliederung. Ob Du Deine Grundgesamtheit (Einwohner Kölns) gruppieren musst, liegt an der Fragestellung, nicht an der Größe Kölns.
touchtheday

Re: Neu hier ... und ein paar Fragen an die Statistik-Cracks

Beitrag von touchtheday »

Danke für die Antwort, DoneXY. Richtig, ich habe wohl erheblich zu allgemein gefragt.

Ich versuche Grundschulen v.a. nach sozialen, aber auch demographischen Daten des Einzugsgebietes zu kategorisieren. Wenige Schulen oder Schulämter gehen mit derartigen Daten offen um, daher meine Frage, ab welchem Punkt ich unterkommunale Daten brauche: Ich versuche, das Feld übersichtlicher zu gestalten.

Danke nochmal!
DoneXY

Re: Neu hier ... und ein paar Fragen an die Statistik-Cracks

Beitrag von DoneXY »

touchtheday hat geschrieben:Ich versuche Grundschulen v.a. nach sozialen, aber auch demographischen Daten des Einzugsgebietes zu kategorisieren. Wenige Schulen oder Schulämter gehen mit derartigen Daten offen um, daher meine Frage, ab welchem Punkt ich unterkommunale Daten brauche: Ich versuche, das Feld übersichtlicher zu gestalten.
Ich bin mir nicht sicher, ob ich Dich richtig verstehe. Wenn Du auf die Ebene der Schulen runtergehen willst, bräuchtest Du natürlich die Daten der einzelnen Schulen. Die Frage ist natürlich, wie sinnvoll das ist, da ja alle verwandten Daten nach gleichen Kriterien erhoben sein müssen.

Welche Gruppierung sinnvoll ist, kann nur in Kenntnis der zur Verfügung stehenden Daten und der Fragestellung entschieden werden.
Ich denke, der erste Schritt sollte sein, sich zu überlegen, welche Daten sind zugänglich? Dann, was können mir diese Daten sagen? Drittens, was will ich davon weitergeben? Schließlich, wie gruppiere ich sinnvoll diese Daten, damit ich dieses Ziel erreichen kann?

Momentan kommt es mir jedoch so vor, als wolltest Du mit dem letzten Schritt beginnen.
touchtheday

Re: Neu hier ... und ein paar Fragen an die Statistik-Cracks

Beitrag von touchtheday »

Stimmt, ich habe mich wohl missverständlich ausgedrückt. Trotzdem nochmal vielen Dank für die Zeit, die du dir nimmst!

Es geht hier nicht um meine Kernuntersuchung, das ist lediglich eine Grundlage dafür. Die Fragestellung, der ich mit der hier skizzierten Problematik auf den Zahn fühlen möchte, ist im Kern folgende: Wie lässt sich das Einzugsgebiet mehrerer spezifischer Grundschulen (1) beschreiben und (2) zu Vergleichszwecken kategorisieren.

Meine Grundannahme ist, dass sich Grundschulen in bestimmten Kommunen, die hinreichend klein sind, aus mehr oder weniger dem gesamten Kommunalgebiet speisen, ich also auf der Grundlage von allgemein zugänglichen kommunalen Daten eine hinreichend valide Aussage über das Einzugsgebiet treffen kann. Das gilt auch deshalb, weil hinreichend kleine Kommunen keine abgeschlossenen Sozialräume haben, sondern der örtliche "Brennpunkt" (polemisiert) aus zwei Straßenzügen besteht und alle Bewohner die gleichen Einrichtungen im oder in der Nähe des Zentrums des Ortes verwenden. Daten, die für mich relevant sind, sind bspw. der Anteil der Empfänger von Leistungen nach SGB II, der Anteil der Einwohner mit Migrationshintergrund oder das Durchschnittseinkommen; Werte also, die auf kommunaler Ebene frei zur Verfügung stehen.

Wenn nun aber die Kommune eine bestimmte Größe überschreitet (und hier suche ich Orientierungswerte), ist die kommunale Ebene nicht mehr aussagekräftig: Grundschule XY erhält ihre Schülerschaft dann primär aus der nahegelegenen Hochhaussiedlung im Ortsteil XY, die naturgemäß einen anderen Sozialraum bietet als die vorherrschende Einfamilienhausbebauung im Ortsteil YZ, die die Grundschule YZ bedient. Das sind indes Eigenschaften, über die weder Schulen noch Schulämter allzu freigiebig Daten bereitstellen (sicher, Ausnahmen bestätigen die Regeln); das ist insofern nachvollziehbar, als dass Schulen mit schwierigen Einzugsgebieten eher gemieden wären und sich entsprechende Tendenzen damit verfestigen.

Die kleinste von mir betrachtete Kommune hat 10.000 Einwohner und eine einzige Grundschule, die über drei Teilstandorte verteilt ist. Hier gehe ich davon aus, dass die kommunalen Daten für eine valide Aussage verwendbar sind. Auch die Einschätzung zahlreicher Stadtteile in den wirklich großen Städten ist verhältnismäßig leicht, weil ich hier auf der Grundlage von Karten relativ valide Aussagen treffen kann: Ich kann zum Beispiel guten Gewissens unterstellen, dass eine Grundschule in Köln-Chorweiler ihre Schülerschaft praktisch ausschließlich aus diesem Stadtteil gewinnt, da er baulich vollständig isoliert ist (begrenzt durch Felder, Autobahnen und Rhein).

Die größten Bauchschmerzen bereiten mir kleinere und mittlere Städte, in der Regel ab dem Punkt, an dem mehrere weiterführende Schulen gleichen Schultyps vor Ort sind und bis zu dem Punkt, an dem Stadtteile gewachsene Sozialräume bilden können. Beispiel Gütersloh: Hier gibt es erkennbar differenzierten sozialen Wohnungsbau, gleichzeitig auch äußerst hochwertige Quartiere, die von den gleichen Grundschulen bedient werden. Das würde die Rechnung mit Mittelwerten zunächst noch unterstützen. Es gibt aber auch Schulen, die erkennbar ein Einzugsgebiet haben, das sich aus einem bestimmten Stadtteil speist, bspw. die Altstadtschule oder die Blücherschule. Das Klientel dieser Schulen zu entschlüsseln nimmt in manchen Kommunen, die mit unterkommunalen Daten zurückhaltend sind, sehr, sehr viel Zeit in Anspruch. Besonders in den kleineren Städten hängt das natürlich auch damit zusammen, dass es naturgemäß keine Stadtbezirksgliederung gibt, die in den größeren Städten noch einmal einiges erleichtert. D.h. ich versuche herauszufinden, ab welcher Kommunalgröße ich mir darüber überhaupt Gedanken machen muss und bis zu welchem Punkt ich mit den frei verfügbaren Daten guten Gewissens sagen kann: Hier gibt es zwar mehrere Schulen, die Kommune ist aber so klein, dass ich von den kommunalen Mittelwerten ausgehen kann. Bisher komme ich bei Werten irgendwo im Bereich 30.000 Einwohner heraus; um in Ostwestfalen zu bleiben: Ich würde vermuten, dass ich in Lübbecke (Westf.) mit 25.000 Einwohnern hinreichende Überlappungen in den Einzugsgebieten der Grundschulen habe, dass mir die Mittelwerte genügen. In Bünde (Westf.) erkenne ich in der Nähe der Grundschule Südlengerheide Wohnblockbebauung, die Grundschule Mitte scheint ein verhältnismäßig hochwertiges, eher städtisch geprägtes Einzugsgebiet zu haben und die Grundschule Hunnebrock liegt auf der anderen Seite einer Autobahn (vermutlich also einer Schulwegsgrenze) und hat vor allem ländliche Bebauung in einem größeren Einzugsgebiet.

Nunja, mir fällt selbst auf, dass ich in meinen Überlegungen immer konkreter werde. Dafür muss ich auf jeden Fall danken. :-) Die Frage wäre jetzt also viel mehr: Ergeben meine Überlegungen Sinn oder hakt das irgendwo gewaltig, wo es mir nicht auffällt?

VlG!
DoneXY

Re: Neu hier ... und ein paar Fragen an die Statistik-Cracks

Beitrag von DoneXY »

Freut mich, dass Du Dir etwas klarer wirst!

Ob Deine Daten valide Aussagen erlauben, kann nur beurteilt werden, wenn beides Aussage und Daten bekannt sind. Auch auf der Basis 'guter' Daten können falsche Aussagen getroffen werden.

Die Güte der Daten wirst Du unterstellen dürfen, da sie ja von 'offizieller' Seite erhoben wurden. Da Deine Daten wohl methodisch korrekt erhoben wurde, ist der Knackpunkt ihre Interpretation.

Wenn Du beispielsweise die Daten einer Schule hättest: 100 Schüler_innen, davon 67 Mädchen und 23 Jungen, dann kannst Du natürlich schreiben, 67% der Schüler_innen dieser Schule sind Schülerinnen. Was nicht geht, ist zu schreiben, in allen Schulen Köllns sind 2/3 der Schüler_innen Mädchen. Ich denke, das ist Dir klar.

Dein (mögliches) Problem: Wieviel Köllner Schulen musst Du untersuchen, um zu der Aussage zu kommen, dass X% Mädchen und Y% Jungen sind, kann ohne weiteres nicht beantwortet werden. Das hängt ja davon ab, wie representativ die einzelnen Schulen sind. Es kann auch sein, dass manche Aussagen anhand der vorliegenden Daten gar nicht möglich sind.

Spricht irgendwas dagegen, wenn Du wie folgt beginnst:

Die Schulen gruppieren, bspw. so:

1) Einzugsgebiet mit hohem Durchschnitteinkommen
2) Einzugsgebiet mit gemischten Durchschnitteinkommen
3) Einzugsgebiet mit niedrigem Durchschnitteinkommen

Zwischen 1) bis 3) sind natürlich Abstufungen sinnvoll.

Nach der Gruppierung einfach mal die Daten statistisch auswerten und gucken, was dabei rauskommt. Aufpassen vor Scheinkorrelationen sonst bringt der Storch die Kinder!

Da Du ohnehin mit erhobenen Daten arbeiten musst, scheint mir dies der Weg zu sein: Daten sammeln, vor dem Hintergrund der Fragestellung sinnvoll gruppieren, auswerten und das Ergebnis für Dich interpretieren. Ggf. anders gruppieren. Bisschen Spaß am 'Rechnen' musst Du für Dein Projekt ohnehin haben.
touchtheday

Re: Neu hier ... und ein paar Fragen an die Statistik-Cracks

Beitrag von touchtheday »

Hallo (again)!

Neben der stärkeren Klarheit ist das hier eine hervorragende Übung dafür, wie ich mich später in der Arbeit verständlich ausdrücken kann. :)

DoneXY wrote:
> Spricht irgendwas dagegen, wenn Du wie folgt beginnst:
>
> Die Schulen gruppieren, bspw. so:
>
> 1) Einzugsgebiet mit hohem Durchschnitteinkommen
> 2) Einzugsgebiet mit gemischten Durchschnitteinkommen
> 3) Einzugsgebiet mit niedrigem Durchschnitteinkommen
>
> Zwischen 1) bis 3) sind natürlich Abstufungen sinnvoll.
>
> Da Du ohnehin mit erhobenen Daten arbeiten musst, scheint mir dies der Weg zu sein:
> Daten sammeln, vor dem Hintergrund der Fragestellung sinnvoll gruppieren, auswerten
> und das Ergebnis für Dich interpretieren. Ggf. anders gruppieren. Bisschen Spaß
> am 'Rechnen' musst Du für Dein Projekt ohnehin haben.

Also, mir geht es genau darum, wie ich das Einzugsgebiet der Schulen bestimme. Später arbeite ich mit selbst erhobenen Daten, wie ich damit umgehe, weiß ich, glaube ich. Bleiben wir also beim Durchschnittseinkommen:

Wenn ich 3 Schulen habe, eine in einer kleinen Kommune von 10.000 Einwohnern (Schule 1), eine in einer mittleren Stadt von 90.000 Einwohnern (Schule 2) und eine in einer Großstadt von 500.000 Einwohnern (Schule 3): Wie bestimme ich das Durchschnittseinkommen im Einzugsgebiet, wenn ich nur die kommunalen Daten habe?

Schule 1 ist einfach: Ich unterstelle, dass die kommunalen Daten für das gesamte Einzugsgebiet gelten.

Schule 2 ist das größte Problem: Hier muss ich versuchen, an stadtteilbezogene Daten zu kommen.

Schule 3 ist dann einfach, wenn die Stadt über halbwegs homogene Stadtbezirke verfügt, dann kann ich mit den Stadtbezirksdaten arbeiten. Wenn nicht, muss ich auch hier Stadtteildaten bekommen.


Wenn ich jetzt Schule 4 (Gemeinde mit 15.000 Einwohnern), Schule 5 (Kleinstadt mit 20.000 Einwohnern), Schule 6 (Kleinstadt mit 30.000 Einwohnern) und Schule 7 (Stadt mit 40.000 Einwohnern) habe: Bei welcher dieser Schulen kann ich noch sinnvoll davon ausgehen, dass meine kommunalen Daten auf das gesamte Einzugsgebiet zutreffen und bei welcher benötige ich Stadtteildaten, um nicht auf falsche Angaben zu bauen?

Danke!! :blume:
Gesperrt
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag