[offplay] Das Forum als Forschungsgegenstand

    Diese Seite verwendet Cookies. Durch die Nutzung unserer Seite erklären Sie sich damit einverstanden, dass wir Cookies setzen. Weitere Informationen

    • [offplay] Das Forum als Forschungsgegenstand

      aka verrückte Wissenschaftler am Werk
      [betroffener Zeitraum: bis ca. Oktober 2016]


      Die Abteilung für Muggelforschung und Muggelartefakte
      ¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯
      braucht eure Hilfe!


      Lieber Userinnen und User des RPGs, :)
      der Threadtitel verrät es bereits: es geht um eine ganz und gar muggelige Forschungsarbeit in den Fachbereichen des neuro-linguistischen Programmierens und der Stilometrie. Gegenstand dieser Forschung soll tatsächlich das Forum werden, genauer gesagt kreativ verfasste Texte und wie diese in Bezügen zueinander stehen und sich miteinander verändern. Da ich dafür einen sehr großen Corpus an verwertbaren Textwerken brauche, möchte ich euch um eure Mithilfe bitten!
      Damit ihr aber wisst auf was ihr euch einlasst (oder was ihr lieber nicht möchtet), beginne ich mit meinen Erklärungen einmal ganz von vorne:


      ☞ Was genau wird gemacht?
      Auf den ersten Blick klingt insbesondere neuro-linguistisches Programmieren (kurz NLP) ziemlich abenteuerlich. Was ich genau machen werde, ist allerdings überhaupt nichts mehr so unglaublich Neues und auch relativ simpel vom Prinzip her. Vereinfacht wäre das Ganze so zu erklären:
      Mittels eines Programms werden eure RPG-Posts von mir ge-cluster-t, also in gewisse Zeichensequenzen geteilt. Diese Cluster werden wiederum mechanisch ausgezählt und analysiert, wodurch das Programm Gemeinsamkeiten finden kann, für die ein Mensch monate- oder jahrelange Forschungs- oder Analysearbeit hätte leisten müssen. Epochenähnlichkeiten werden erkannt, Autoren, ob ein Mann oder eine Frau geschrieben hat, ob es im Corpus etwas gibt, an das sich orientiert wurde, Altersunterschiede und mit dem richtigen Vergleichsmaterial noch vieles mehr. Anwendung findet diese Forschung insbesondere beim Zuweisen von anonymen Schriftstücken oder beim Aufdecken von Bezügen zwischen Autoren.
      In einem Bilddiagramm sieht das Ganze dann z.B. so aus, um euch das etwas greifbarer zu machen, wobei das Programm natürlich nicht weiß, dass es tatsächlich der gleiche Autor ist, da er nicht Dateinamen, sondern lediglich die Clusterfolgen abgleicht. In meinem Beispiel sieht man nun, dass Doyle offensichtlich eine ganz andere literarische Gruppe bildet als Lovecraft, Howard und Kipling, aber dass es z.B. wieder Ähnlichkeiten zwischen Howard und Kipling gibt. (Ja, manche Linguisten hassen diese digitalen Perks, da so jahrelange Arbeit in Sekunden gemacht werden kann - wenn Corpus und Programme einmal stehen.)


      Das Ganze funktioniert, weil in der Theorie jeder Autor eine fast einzigartige Art hat zu formulieren und das macht nicht einmal die Verwendung von Fremdwörtern, sondern simpel die Anordnung von „und“, „oder“, „der“, „die“, „das“, „nicht“, usw. Es sind also die kleinen Dinge, die einem Menschen vielleicht sogar entgehen, weil sie für ihn selbstverständlich sind.


      ☞ Und was hat Penny jetzt vor bei uns zu finden?

      Gerade in der Wissenschaft an der Uni bestehen die meisten Corpora aus frei zugänglichen Texten…. Goethe, Schiller und Co. sind gefühlt schon tot-analysiert wurden, der Autorschaft von manchen Shakespeare-Werken ist man schon auf der Schliche, aber es ist gar nicht so leicht solche Programme im ganz „einfachen“ Bereich anzuwenden. Zeitungsartikel eigenen sich z.B. nicht so gut, weil Formulierungen oft vorgegeben sind…
      Ich habe nun vor einen Corpus aus den Texten im Forum zu schaffen, nach Charakteren/Usern zu sortieren und dann zu clustern. Fragestellung wird sein, ob sich auch im ganz simplen Hobbybereich Eigenheiten ausmachen lassen, wie z.B. soziale Cliquen und Strukturen, Altersgruppen, Verschiebungen von Gruppen, regionale Unterschiede, vielleicht sogar Lieblingsautoren, etc. - Es ist quasi „Feldforschung“, die schwierig durchzuführen ist, weil man erst einmal wissen muss, wo man einen genügend großen Corpus herbekommen kann. Mein kurioses Hobby war dabei ein Glückstreffer, da man für vernünftige Ergebnisse eigentlich mindestens 1000, besser sogar 5000+ Wörter pro Proband verwerten muss.


      ☞ Was bedeutet das für mich und meine Posts?

      Das ich diese Forschung durchführe, bedeutet erst einmal nicht viel für euch. Ich würde euch nur darum bitten, mir eine PN zu schreiben, wenn ihr ausdrücklich möchtet, dass keiner eurer Texte verwendet wird oder euch hier im Thread bemerkbar zu machen, wenn es euch nicht nur recht ist, dass man eure Texte verwendet, sondern ihr auch dazu bereit wäret einen kleinen Fragebogen für mich und die Auswertung auszufüllen. Ihr könnt kommentieren, allerdings reicht auch ein Like und ihr werdet in naher Zukunft eine PN mit den Fragen und meiner Mitarbeiteradresse meiner Universität bekommen.
      Wie bei jeglicher, wissenschaftlicher Forschung werden eure Angaben absolut anonymisiert, geistiges Eigentum nicht angetastet und auch eure RPG-Post an sich werden in keiner Form bewertet oder etwas dergleichen. Tatsächlich ließt sie hauptsächlich das Programm aus und werden ansonsten auch nur von mir und ggf. meinem Professor angeschaut, sollten wir den Verdacht haben, dass etwas schief gegangen ist.
      Sollten brauchbare Ergebnisse bei meiner Arbeit rauskommen, die sich auch in ein Paper fassen lassen, wird dieses eventuell von den Soziologen und Psychologen meiner oder einer anderen Universität weiterverwendet, aber auch damit lediglich die Datenstruktur und z.B. die Erkenntnis, dass sich Stile in einem Bekanntenkreis angleichen.


      ☞ Springt für mich etwas dabei raus?

      Leider kann ich meinen Probanden keine Schokolade anbieten, da die Sache erst Budget bekommt, wenn sie erfolgreich ist und an den nächsten weitergereicht werden kann, allerdings habe ich vor das Ergebnis im Bilddiagramm hier im Forum zu veröffentlichen, sodass ihr tatsächlich auch einmal sehen könnt, ob ihr ähnlich wie jemand schreibt, vielleicht sogar so ähnlich wie euer Lieblingsautor.
      Jeder Charakter/User konnte von mir dann z.B. ein Kürzel bekommen, das nur er (oder sie) selbst kennt. Ob er dieses Kürzel dann mit anderen Usern teilen möchte, bleibt ihm überlassen.


      Wohlan! Ich danke schon vorab allen, die bereit sind mich zu unterstützen
      & hoffe auf spannende Ergebnisse! :)
      Penny

      Werde mein kleiner Bruder!
    • Her mit dem Fragebogen! Her mit den Vergleichen! Ich will endlich schwarz auf weiß haben, dass du meinen Schreibstil beeinflusst hast wie kein anderer! <3
      (Also bin ich gerne dazu bereit einen Fragebogen auszufüllen und so. Whatever you need, dove.)
      → playlist

      [obacht; die Haut um Ambrose' rechtes Auge ist durch einen Fluch vernarbt und die Iris gräulich-trüb;
      auf diesem Auge ist er fast blind.
      Seit einiger Zeit verschleiert er diesen Umstand aber
      in der Öffentlichkeit mit einem Zauber.]



      got a head full of spiders
      and a heart that isn't here
      in a room full of liars
      all my demons reappear

    • Aye! Auch ich bin mit meinen Charakteren natürlich dabei! Schick mir also gerne den Fragebogen zu! :3

      "Maura hat begriffen wie der Hase läuft. Oh, und sie's halt awesome."

      Tisiphone | Kali | Antichrist