Anmelden (DTAQ) DWDS     dlexDB     CLARIN-D


Deutsches Textarchiv

Grundlage für ein Referenzkorpus der neuhochdeutschen Sprache

Das Deutsche Textarchiv stellt einen disziplinen- und gattungsübergreifenden Grundbestand deutschsprachiger Texte mit einem Schwerpunkt ab dem frühen 16. bis zum frühen 20. Jahrhundert bereit. Hauptziel des von der Deutschen Forschungsgemeinschaft (DFG) von 2007 bis 2016 geförderten Projekts war die Erstellung des sog. DTA-Kernkorpus. Dieses DTA-Kernkorpus umfasst etwa 1500 Titel aus dem Zeitraum von ca. 1600 bis 1900, die aufgrund ihrer herausragenden Bedeutung für die Entwicklung der deutschen Sprache bzw. der jeweiligen Genres und wissenschaftlichen Disziplinen ausgewählt wurden (weitere Informationen zur Textauswahl). Unter anderem aufgrund des sprachgeschichtlichen Fokus des DTA und um den historischen Sprachstand möglichst genau abzubilden, wurden dabei als Vorlage für die Digitalisierung in der Regel die historischen Erstausgaben ausgewählt (Auswahl der Exemplare für die Digitalisierung).

Über das DTA-Kernkorpus hinaus integriert das DTA eine Vielzahl weiterer Texte aus dem Zeitraum etwa von der Mitte des 15. bis etwa zur Mitte des 20. Jahrhunderts als DTA-Erweiterungen (DTAE), die aus kooperierenden Projekten und weiteren externen Quellen stammen.

Das elektronische Volltextkorpus des DTA ist über das Internet frei zugänglich und dank seiner Aufbereitung durch (computer-)linguistische Methoden schreibweisentolerant über den gesamten jeweils verfügbaren Bestand durchsuchbar. Sämtliche Texte stehen zum Download zur Verfügung.    mehr …

Das DTA in Zahlen

Sie können in 4 457 Werken recherchieren.
Weitere Zahlen finden Sie hier.

Neue Werke im DTA




alle Titel …    

Stöbern im DTA

Download

Alle im DTA angebotenen Texte sind unter einer Creative-Commons-Lizenz zum Download verfügbar.

Videos zum DTA

Klicken Sie auf ein Vorschaubild, um zum Video zu gelangen.