Sammelthread: Population der deutschen Server (Zensus) (#2)

Die Who-Abfrage listet zum einen lediglich maximal 50 Treffer, egal wie viele Spieler sich auf dem Realm befinden und zum anderen werden die Suchergebnisse (wenn man nur /who ohne weitere Parameter verwendet) durch das lvl des suchenden Spielers und seinen Standort beeinflusst, d.h. wenn du lvl 50 bist und in SW stehst werden dir zuerst alle Chars gelistet, die ebenfalls 50er sind und sich dort befinden. Wären es über 50 würde dir überhaupt niemand anderes angezeigt. Dieses Verhalten ist logisch, da die Suchfunktion dafür konzipiert ist möglichst schnell Spieler im selben lvl-Bereich für Gruppencontent zu finden.

Allein die Begrenzung auf 50 Treffer (die Dugong auch selbst anführt) sorgt aber schon dafür, dass die Daten nutzlos werden.
Die Stichprobe, welche hier gezogen wird um Rückschlüsse auf die Grundgesamtheit zu ziehen ist nicht repräsentativ (die Umfrage in der SPD-Parteizentrale ist die Analogie hierzu), da in einem Suchdurchlauf überhaupt nicht alle Chars erfasst werden können, die zu genau diesem bestimmten Zeitpunkt auf dem Server aktiv sind.
Wenn man mit solchen fehlerhaften Daten rechnet kann man nicht zu einem richtigen Ergebnis kommen.

Außerdem ist eine Stichprobe viel zu wenig um zufallsbedingte Messfehler auszuschließen. Hypothetisch könnte es z.B. passieren, dass man einen Abend erwischt, an dem z.B. durch den reinen Zufall (oder einem Drittfaktor) bei vollständig vertretener Allianz nur jeder dritte Hordespieler on ist. Was passiert jetzt mit dem Fraktionsverhältnis wenn der Server 3000 Hordler zu 1000 Allianzlern hätte? Es würde ausgeglichen aussehen.
Insofern wäre eine wesentlich höhere Stichprobenzahl erforderlich. Allerdings nicht wie hier durchgeführt zu den verschiedensten unterschiedlichen Uhrzeiten und (noch schlimmer) teilweise mehrere Tage auseinander. Man bräuchte Testreihen um Verzerrungen z.B. wenn die Fraktionen zu verschiedenen Tageszeiten unterschiedlich stark vertreten sind rauszurechnen.

Und diese Punkte sind nur das Fähnchen auf der Spitze des Eisberges, was alles hier methodisch schief läuft. Ich verstehe warum du dir die Arbeit machst und ich weiß, das es nur gut gemeint ist. Aber da du hier viele Leute hast, die sich nur die Zahlen ansehen ohne die damit verbundenen Erhebungsprobleme (welche du auch nennst) zu beachsten oder wie Sujo in die Kategorie „dumm & arrogant“ fallen halte ich es für Kontraproduktiv. Nicht zuletzt weil die Qualität der Erkenntnisse nicht über das „gefühlt“-Niveau hinaus gehen.

[e] Ich habe (für Leute wie dich, die sich nicht so gut auskennen) im Folgenden einen Abschnitt mit zwei Literaturtipps zu Statistik angefügt:

Erläuterungen, welche methodischen Probleme bei empirischen Untersuchung zu beachten sind (um überhaupt zu aussagekräftigen Erkenntnissen kommen zu können) finden sich in: „Methoden der empirischen Sozialforschung“ von Peter Atteslander (ISBN-13: 978-3503126187).
Für die mathematischen Basics der quantitativen Statistik ist Udo Kuckartz: „Statistik: Eine verständliche Einführung“ (ISBN-13: 978-3531198897) eine gute Wahl.