Anmelden (DTAQ) DWDS     dlexDB     CLARIN-D

Wortwolke – Lemmata

Humboldt, Alexander von: Auszüge aus einem im Jahre 1844 in Berlin zum Besten des Luisenstifts verfaßten Kunst-Albums [...]. In: Dresdner Album. Zur Unterstützung der Nothleidenden im sächsischen Erzgebirge, im Voigtlande und in den Weberdörfern der Oberlausitz. Dresden, 1847, S. 145-146.

Diese Wortwolke basiert auf dem automatischen Lemmatisierungsverfahren historischer Texte (CAB), das im DTA für die Textsuche angewandt wird. Die Lemmatisierung fasst sowohl Transliterationen (also bspw. ſ → s) als auch grammatische Formen (Teil, Theil, Theile, Theiles, ...) zusammen. Die Wortidentifikation (Tokenisierung) erfolgt mittels DTA-Tokwrap. Die Fontgröße der einzelnen Lemmata in der Wortwolke ist proportional zu deren Frequenz im Dokument. Lemmata, die im Dokument weniger als dreimal vorkommen, werden nicht dargestellt.