Dokumentklassifikationen (//profileDesc)

Die Profile Description enthält Angaben zu den Sprachen, in welchen der Text hauptsächlich verfasst ist (<langUsage>/<language ident="[Code nach ISO 639-3]">, → ISO 639-3), sowie Klassifizierungen der Texte nach Textsorte, Thema und Herkunft des DTA-Volltextes (<textClass>).

Für die Klassifizierung nach Textsorten und Themen sind Mehrfachklassifizierungen möglich. Die jeweils verwendeten Deskriptoren werden im Element <classCode> wiedergegeben. Das Attribut @scheme in <classCode> enthält einen Verweis auf das zugrundeliegende Klassifikationsschema, z.B. das Klassifikationsschema der DTA-Kernkorpus-Texte.

Um die im DTA publizierten digitalisierten Volltextausgaben entsprechend ihrer Herkunft in Subkorpora zu gruppieren, enthalten die Metadaten Angaben über den Kontext, in welchem der Volltext entstanden ist, sowie, damit einhergehend, zur Erfassungsmethode (z.B. china, ocr, mts, aedit, gutenberg, wikisource). Die entsprechende Angabe erfolgt jeweils in einem <classCode>-Element, wiederum mit einem Verweis auf das zugrundeliegende Klassifikationsschema (hier: das Klassifikationsschema der DTA-Kernkorpus-Texte) im @scheme-Attribut.

<profileDesc>
  <langUsage>
    <language ident="[Code nach ISO 639-3, z.B. deu]">[Sprache, z.B. German]</language>
  </langUsage>
  <textClass>
    <classCode scheme="[URL DTA-Hauptklassifikation]">[Textsorte lt. DTA-Hauptklassifikation]</classCode>
    <classCode scheme="[URL DTA-Subklassifikation]">[Textsorte lt. DTA-Subklassifikation]</classCode>
    <classCode scheme="[URL DWDS-Hauptklassifikation01]">[Textsorte lt. DWDS-Hauptklassifikation 1]</classCode>
    <classCode scheme="[URL DWDS-Subklassifikation01]">[Textsorte lt. DWDS-Subklassifikation 1]</classCode>
    <classCode scheme="[URL DWDS-Hauptklassifikation02]">[Textsorte lt. DWDS-Hauptklassifikation 2]</classCode>
    <classCode scheme="[URL DWDS-Subklassifikation02]">[Textsorte lt. DWDS-Subklassifikation 2]</classCode>
    <classCode scheme="[URL Klassifikation Textherkunft]">[Herkunft des DTA-Volltextes]</classCode>
  </textClass>
</profileDesc>