Statistiken die niemand braucht!

Grobe Statistik zum alten Forum (nur der Allgemeine Diskussion Teil):

Ingsesamt geschriebene Worte: ~25.094.381 (hab nur grob die Formatierungen und Links rausgefiltert, hab vielleicht zuviele oder auch zu wenige erwischt)

Threads: 17.968
Die HTML-Dateien der einzelnen Threads belegen bei mir ~6 GB.

Meist verwendetes Substantiv: Ich (522.634)

Top 10 der Worte die keine Konjunktion, Artikel, Präposition, Partikel oder Pronomen sind:

  1. Beitrag (141.105)
  2. Kann (127.512)
  3. Dann (125.512)
  4. Karten (122.989)
  5. Hat (124.197)
  6. Mal (113.845)
  7. Habe (87.382)
  8. Wird (82.125)
  9. Deck (75.149)
  10. Spiel (73.429)

Honorable Mentions:
Er (82.043), Sie (78.936)
Blizzard (34.991)
Hearthstone (25.987), Magic (3.893), Gwent (552), Artifact (307), Faeria (110), Shadowverse (69)
Aggro (10.100), Control (8240), Midrange (4.002), Combodecks (353)
Glück (13.506), Pech (4.781), Winrate (4.337), luck (1.058), bad (296)
NForce (3.273), Puschkin (3.244), RomanP (1349), TSMS (1.512), IlkayGott (513)
Manipuliert (861), Manipulation (729)

Edit:
Ich editier die “Useranfragen” mal hierrein. ^^

@LeBigFudge
Nerf: 4.365
OP: 6.121
Aluhut: 178
Fanboy: 869, Fanboys: 1.313
LeBigFudge: 1.072

@TSMS-2529
Beweisen: 1.088
Beweis: 1.081, Beweiß: 14
Beweise: 536
Beweist: 303

@Puschkin
Pushkin: 108
p2w: 4.493
f2p: 4.167

@Hotten
Hack: 289
Cheater: 609, Cheat: 453, Cheaten: 387, Cheats: 283, Cheatet: 78

16 Likes

Ich vermisse die ganzen (unkenntlich gemachten) Schimpfwörter.
:sunglasses:

Hmmja, die Sonderzeichen musste ich zum großen Teil rausfiltern, damit möglichst wenig HTML in die Liste kommt. Das ist wirklich nur Quick’n’Dirty zusammengezimmert, hab da jetzt keine stundenlange Arbeit reingesteckt :wink:

Drei Mal so häufig Glück wie Pech? Die Liste ist bestimmt manipuliert.

4 Likes

:smiley: Ich bin mir sicher das mindestens 95% von „Glück“ eigentlich als „Pech“ gemeint war. :wink: Aber eine Kontextanalyse bei fast 20 Millionen Worten hätte wohl gedauert.

Uh uh uh; wie oft wurde ich erwähnt?!

Was ist mit Nerf, Op, aluhut, p2w und fanboy? :smiley:

Btw: tolle Idee! Hast du dir das Forum quasi kopiert und dann eine „Wörter suchen“ Funktion verwendet.
Über Pushkin scheint ja viel geredet zu werden :slight_smile:

Total coole Idee diese Liste, aber die Wörter in der Rangfolge sind sehr unscheinbar. Die am meisten verwendeten tendenziösen Wörter wären eventuell ganz spannend.

1 Like

So ähnlich, ja. Praktisch die relevanten Bereiche raussuchen lassen, dann die Worte nach Leerzeichen getrennt, alle Buchstaben in kleinbuchstaben umgewandelt und in eine Liste nach dem Schema „Wort, Anzahl“ eingetragen. Und wenn das Wort schon drin war, Anzahl einfach um eins erhöht.

Edit: Hat natürlich den Nachteil das es rechtschreibfehler nicht berücksichtigt.

Nerf: 3.277
OP: 4.970
Aluhut: 139
Fanboy: 625, Fanboys: 885
LeBigFudge: 803

Edit2:

Sagen wir mal so, in der Liste stehen 321.616 einzelne Worte und Links, ein paar vereinzelte Zahlen… Das ist recht unübersichtlich :smiley:

2 Likes

Ich vermute mal, dass für jeden Beitrag den man geschrieben hat der eigene Name ein mal mehr gezählt wurde, oder?

Daher wohl auch die Nr. 1 „Beitrag“?

Das dürfte eigentlich nicht sein, weil ich damals über 2k Beiträge hatte, aber laut Kels Zählung (vielen Dank dafür - total cool :smiley:) nur etwa 800 mal vorkomme

Nein. Hab nur die Worte ausgewertet die im Beitrag selbst standen. Technisch ausgedrückt: Alles was in einem <div> der Klasse „TopicPost-bodyContent“ steht. Aber das „Beitrag“ und die Usernamen sind in der Hauptsache vermutlich die Zitate, ja.

Mich würde “Beweis” interessieren. Davon habe ich ganz viele gesehen.

So, nachdem ich ein paar Bugs behoben hab und noch mal drüber laufen hab lassen musste ich ein paar Zahlen im Eingangspost korrigieren. Aber ich hab dabei auch die Up- und Downvotes gesammelt, hier die Top 10:

Platz Name Differenz Upvotes Downvotes
1 Puschkin 4221 7962 3741
2 Sree 2523 3392 869
3 Mandos 2090 3781 1691
4 IlkayGott 1842 2281 439
5 dalmi 1790 3671 1881
6 Yggr 1775 3364 1589
7 irini 1698 2534 836
8 TSMS 1596 2060 464
9 Dietlaib 1577 2845 1268
10 Opferl4mm 1467 4107 2640

Edit: Battletags auf die reinen Namen runtergekürzt…

7 Likes

Ich vermisse Dietlaib. Aber Puschkin ist ein würdiger Ersatz :slight_smile:

@Kel: Könntest Du nach den Top-10 auch die Bad-10 rauswuseln? Also die mit der negativsten Differenz?^^

1 Like

Ich könnte… Ich bin mir aber nicht sicher ob die entsprechenden Leute da nicht was gegen hätten :wink:

2 Likes

Natürlich hätten sie was dagegen :slight_smile:

Ich poste sie mal ohne Namen… :wink:

Platz Differenz Upvotes Downvotes
1 -4492 1585 6077
2 -1834 276 2110
3 -1534 902 2436
4 -1192 541 1733
5 -1062 290 1352
6 -1046 162 1208
7 -985 3143 4128
8 -888 111 999
9 -804 753 1557
10 -797 66 863
4 Likes

:scream: das macht es nur Schlimmer! jetzt will man umso mehr wissen wer so “verhasst” im alten Forum war!

1 Like

Mein Name wurde fast so oft erwähnt wie ich Posts geschrieben habe? o_0
Und da sind beide Schreibweisen (“Puschkin” und “Pushkin”) mit drin? Weil das verwechselt ja jeder zweite.

Daß “er” und “sie” so dicht bei einanander liegen ha mich zunächst auch verwundert. Dann fiel mir ein, daß eine einfache SQL-querie nicht unterscheidet zwischem Pronomen und Plural-sie (“ich habe 2 Sheeps im Deck, ziehe sie nur nie”).

f2p und p2w würde mich auch noch interessieren.

Ein Blick auf die Top 10 erinnert mich vor allem an Opferlamm. Wo ist er eigentlich geblieben? Einer der wenigen echten Fanboys (selbstdeklariert!). Hatte zwar angekündigt, daß er aufhören will, aber interessant ist das schon: So einer hört wirklich einfach auf ohne zurückzukehren und ohne große Fanfaren.

EDIT:
Danke für Thread, Statistiken, die niemand braucht und nach denen niemand gefragt, sind eh die besten :slight_smile:

2 Likes

Ich glaube, wenn wir noch ein bisschen auf Kel herumklopfen, wird er irgendwann schwach und gibt uns die Informationen, auf die wir so gieren :yum: Wer sind die Zitronen aus dem alten Forum? :lemon:

2 Likes