Lexikalisches Profil

Das Lexikalische Profil (Nation; Meara u.a.) dient bei der Untersuchung der schriftlichen Textproduktion von Lernern zur Beschreibung des verwendeten Wortschatzes. Dabei werden die Wörter des Textes einer Worthäufigkeitsklasse zugewiesen; das Lexikalische Profil beschreibt, wie viel Wörter in Prozent der Lerner von jeder Häufigkeitsklasse verwendet hat.

Wir stellen hier drei Prototypen bereit:

  • Prototyp 1 für lemmatisierte Texte. Der Prototyp arbeitet dabei mit den von Jones und Tschirner ermittelten Worthäufigkeitsklassen. Da es sich bei Jones’ und Tschirners Listen um Einträge in Grundform handelt, hat der Prototyp zwei besondere Eigenschaften: er funktioniert 1. mit lemmatisierten Texten, und deshalb 2. weicht er von den Lösungen von Meara und Miralpeix ab, die mit Token-Häufigkeitsklassen arbeiten, d.h., Listen, die nicht in ihrer Grundform vorliegen.
  • Prototyp 2 für unbearbeitete, nicht lemmatisierte Texte. Basierend auf der DeReWo Wortliste (IDS), kann dieser Prototyp direkt natürliche Texte verarbeiten, so dass diese nicht zuerst anhand eines Taggers (z.B. Tree Tagger) lemmatisiert werden müssen.
  • Prototyp 3 für englische Texte für die Lehre.

 

Check our English Prototype.