Anmelden (DTAQ) DWDS     dlexDB     CLARIN-D


Deutsches Textarchiv (DTA)

Das DTA stellt auf seiner Plattform disziplinen- und gattungsübergreifende Sammlungen und Korpora von deutschsprachigen Texten bereit. Als Grundlage für ein Referenzkorpus der neuhochdeutschen Sprache steht das rund 1500 Titel umfassende DTA-Kernkorpus im Zentrum.

Dieses zeichnet sich aus durch: eine ausbalancierte Textauswahl in den Textsorten, einen Publikationszeitraum, der ab dem frühen 17. Jahrhundert beginnt und bis zum frühen 20. Jahrhundert reicht, die Verwendung von Erstausgaben bei der Digitalisierung, die Wahrung des Sprachstandes sowie adäquater Textstrukturierung bei der Transkription.

DTA-Erweiterungen

Daneben wurden im Rahmen des Moduls DTA-Erweiterungen (DTAE) digitalisierte historische Quellen aus externen Projekten entsprechend den Richtlinien des DTA aufbereitet und in das DTA integriert. Die vorhandene Sammlung des DTA-Kernkorpus wurde so um ein ca. 4.000 Quellen starkes DTA-Erweiterungskorpus, wiederum schwerpunktmäßig aus Quellen des 17. bis 19. Jhs., ergänzt.

Status quo

Aktuell dient das DTA im Rahmen der Nationalen Forschungsdateninfrastruktur (NFDI) im Konsortium Text+ als Repositorium für strukturierte, historische Texte. Zudem stellt das DTA historische Textkorpora für die Wörterbucharbeit im Projekt Wortgeschichte digital – einem Teilprojekt des sich im Aufbau befindenden Zentrum für digitale Lexikographie der deutschen Sprache (ZDL) – zur Verfügung.

Zugänglichkeit und Nachnutzbarkeit

Die elektronischen Volltexte sind frei zugänglich und dank ihrer Aufbereitung durch (computer-)linguistische Methoden schreibweisentolerant über den gesamten Bestand durchsuchbar. Eine Textanalyse wird sowohl durch über das DWDS bereitgestellte Tools wie Wortverlaufskurven oder DiaCollo, also auch über die Anbindung externer Analysetools wie bspw. die Voyant Tools oder das Language Resource Switchboard (LRS) realisiert.

Alle Texte und Korpora des DTA-Grundbestandes (DTA-Kernkorpus und DTA-Erweiterungskorpus) sind entsprechend dem umfassend dokumentierten TEI-P5-Format DTABf aufbereitet und stehen über eine Text-Bild-Ansicht auf der DTA-Website sowie zum Download zur Verfügung.


Neben den auf dieser Seite verfügbaren Texten bieten wir Zugang zu weiteren Ressourcen:

Korpus Zugang
Polytechnisches Journal Projektseite, Quellen, Korpussuche im DWDS
Soldatenbriefe (1745–1872) Quellen, Korpussuche im DWDS
Korpus Patiententexte (1834–1957) Projektseite, Quellen, Korpussuche im DWDS
A. v. Humboldts Publizistik (dt., 1790–1859) Projektseite, Quellen, Korpussuche im DWDS
Nachrichten aus der Brüdergemeine (1819–1894) Korpussuche im DWDS
Der Neue Pitaval (1842–1890) Korpussuche im DWDS
Briefe von Jean Paul (1780–1825) Projektseite, Korpussuche im DWDS
Deutsche Kunst und Dekoration (1897–1932) Korpussuche im DWDS
Neuer Deutscher Novellenschatz (1884–1887) Quellen, Korpussuche im DWDS
stimm-los – Wiedergefundene Perlen der Literatur Quellen, Korpussuche im DWDS

Das DTA in Zahlen

Sie können in 5 460 Werken recherchieren.
Weitere Zahlen finden Sie hier.

Neue Werke im DTA




alle Titel …    

Stöbern im DTA

Download

Alle im DTA angebotenen Texte sind unter einer Creative-Commons-Lizenz zum Download verfügbar.

Videos zum DTA

Klicken Sie auf ein Vorschaubild, um zum Video zu gelangen.