DUDS og DK-CLARIN

DUDS er medlem DK-CLARIN, et konsortium som har en løbetid fra januar 2008 til udgangen af 2010. DK-CLARIN-konsortiet skal opbygge en humanistisk, dansk forskningsinfrastruktur med skrevne og talte tekster samt visuelle data til brug for forskere.

Projektet Knowledge for everyman 1500-1750 udgør DK-CLARIN-arbejdspakke 2.3. På baggrund af DUDS’ erfaringer med indsamling og udforskning af tekster bidrages til infrastrukturen ved at opbygge og annotere et korpus på 250.000 ord sammensat af sagtekster på ældre dansk fra perioden 1500 til 1750 for det almindelige publikum. Sagteksterne indsamles, registreres og annoteres efter materialfilologiske principper. Teksterne xml-mærkes i TEI-kompatielt format.

Arbejdet inddeles i fire faser som har følgende milepæle:

  • Efter 9 mdr.: Specifikation af korpus og værktøjer. Pilottekster skannes og digitaliseres.
  • Efter 18 mdr.: Specifikation af tekstlig indholdsstruktur. Digitalisering af tekstkorpus igangsat. Annoterings- og søgeværktøj.
  • Efter 28 mdr.: Korpus digitaliseret. Relevante dele af udvalgte tekster forsynet med leksikalsk flerniveaurepræsentation. Tekstkorpus testet på brugerpanel.
  • Efter 36 mdr.: Færdigudviklet tekstkorpus. Udbygget flerniveaurepræsenteret tekstkorpus. Annoteret korpus og søgeværktøj tilgængelige.

DUDS-forskning kan man læse mere om her

Du kan se yderligere præsentation af DK-CLARIN her