BNC

Das British National Corpus ist eine große Wortsammlung von Beispielen schriftlicher (90%) und muuml;ndlicher (10%) gesprochener Sprache verschiedener Quellen. Es ist TEI-kodiert und damit annotiert auf lexikalischer und wortartenbezogener Ebene.

Übersicht:

  • Entwickler: BNC Consortium = Industrie/Uni-Zusammenschluss Oxford/AddisonWesley
  • Datum: spätes 20.Jhd.
  • Sprache: englisch
  • Umfang: ca.100 Millionen Wörter
  • Ebene: schriftlich/mündlich unterschiedliche Textsorten
  • Zweck: für linguistische Zwecke
  • Annotation: annotiert auf lexikalischer und Wortarten-Ebene
  • Medium: online-Recherche/Vollform-Suchmaske, Nach Registrierung auch Annotationen suchbar, Vertrieb durch Subscription oder auf CD
  • URL: http://www.natcorp.ox.ac.uk/
  • Verfügbar?: http://www.natcorp.ox.ac.uk/getting/
  • Preis: Basisrecherche online, nach Registrierung Recherche mit Software SARA (auch Annotation): Kosten: GBP 60/200/500 pro Jahr für 1-2/3-10/11-50 Maschinen; GBP 50,- Für die CD (2007 soll eine XML-Version herauskommen)
  • Sonstiges: Frequenzlisten aus BNC veröffentlicht unter: http://www.comp.lancs.ac.uk/ucrel/bncfreq/
  • Dokument erstellt von Sibylle Reichel, Juni 2007