Negra (Nebenläufige grammatische Verarbeitung)

Das NEGRA Korpus Version 2 besteht aus deutschen Zeitungstexten aus der Frankfurter Rundschau, die mit Parts-of-Speech annotiert wurden. Dieses Korpus wurde erweitert, ebenfalls mit Parts-of-Speech versehen und vollständig mit syntaktischen Strukturen annotiert. Im Projekt wurden nebenläufige constraintbasierte und kaskadierte statistische Methoden für ein hybrides Modell der syntaktischen Verarbeitung entwickelt.

Übersicht:

  • Entwickler/Kontakt: Hans Uzkoreit, Tania Avgustinova, Universität Saarbrücken
  • Datum: Zeitungstexte aus der Frankfurter Rundschau
  • Sprache: deutsch
  • Umfang: 355.096 Tokens (20.602 Sätze)
  • Ebene: schriftlich
  • Zweck: für die maschinelle Sprachverarbeitung
  • Annotation: morphologisch/syntaktisch (Baumbank)
  • Medium: CD
  • URL: http://www.coli.uni-saarland.de/projects/sfb378/negra-corpus/negra-corpus.html oder http://www.coli.uni-saarland.de/projects/sfb378/2002-2004/projects.php4?action=2&w=2
  • Verfügbarkeit: für wissenschaftliche Zwecke frei, Bezug über http://www.coli.uni-saarland.de/projects/sfb378/negra-corpus/corpus-license.html
  • Dokument erstellt von Sibylle Reichel, Juni 2007