Ordforklaringer og forkortelser

ADL – Arkiv for Dansk Litteratur = Danish National Archive of Literature

Alignerede tekster –  tekster hvor originaltekst og oversættelse optræder parvis sætning for sætning =aligned texts

AP – arbejdspakke = WP – work package

AU – Aarhus Universitet = University of Aarhus

BLARK – Basic Language Ressource Kit = En værktøjskasse med fundamentale sprogresurser, fx korpusser og taggere

Ca - Conversation Analysis = konversationsanalyse

CBS - Copenhagen Business School

CLARIN - Common Language resources and technology infrastructure

Domæne = domain

1.  fagligt interesseområde som en person eller gruppe af personer behersker, bestemmer over eller føler sig hjemme i; afgrænset område eller felt

2.  område på et (edb)netværk; på internettet er det ofte navngivet på en måde der afspejler navnet på den person, institution eller virksomheder, der råder over området; også om dette områdes navn, typisk svarende til en internetadresses midterste del; jf domænenavn

DSL – Dansk Sprog- og Litteraturselskab = the Society for Danish Language and Literature

DSN - Dansk Sprognævn = Danish Language Council

DUDS – Danish Under Digital Study = Digitale Undersøgelser af Dansk Sprog

ESFRI – European Strategy Forum for Research Infrastructures = Europæisk forum for Forskningsinfrastruktur

HLT – Human Language Technology = sprogteknologi

KB – Det Kongelige Bibliotek (Danmarks Nationalbibliotek) = the Royal Library (the Danish National Library)

Kontekst – sammenhæng som et givent ord står i = context

Korpus (flertal: korpora eller korpusser) = et korpus er en elektronisk samling af tekster der bruges til sproglige eller litterære undersøgelser

KU - Københavns Universitet = University of Copenhagen

KU-LAN - Københavns Universitet Lanchart (Danish National Research Foundation Centre for Language Change in Real Time)

KU-CST – Københavns Universitet - Center for Sprogteknologi = Centre for Language Technology

KU-INSS - Københavns Universitet - Institut for Nordiske Studier og Sprogvidenskab = Department of Scandinavian Studies and Linguistics

Lemma = et ords grundstamme (i ordbogssammenhæng: opslagsord)

Lemmatiser – (lemmatisering) = værktøj der finder et ords grundstamme

LGP - Language for General Purposes = alment sprog

LSP - Language for Special Purposes = fagsprog

MOVIN - (Microanalysis Of Verbal/non-Verbal/Visual INteraction) is the Danish network for scholars of interaction analysis and conversation analytic studies = dansk netværk for interaktionsanalyse og konversationsanalytiske studier

Multimodal = Indeholdende informationer på flere forskellige semiotiske kanaler, fx en tv-transmission med billede, lyd og undertekster.

MUMIN – Nordic Network for Multimodal Interfaces (the project was closed)= Nordisk netværk for multimodal interaktion (projektet er afsluttet)

NatMus - Nationalmuseet = the National Museum of Denmark

OCR - Optical Character Recognition, optisk tegngenkendelse, er den mekaniske eller tekniske konvertering af håndlavede, skrevne eller printede billeder med tekst, til maskinredigerbar tekst.

Parallelle korpusser = parallel corpora

1.  alignerede tekster (hvor originaltekst og oversættelse optræder parvis sætning for sætning)

2.  tekster som handler om det samme emne på flere sprog

PoS – Part of Speech =  ordklasse

POS-tagging = at opmærke tekst i ordklasser baseret på ordets definition og konteksten

Repositorium – databank som består af flere integrerede korpusser = repository

SDU – Syddansk Universitet = University of Southern Denmark

Tagger = Værktøj som automatisk beriger en tekst med lingvistisk information. Bruges ofte i betydningen PoS-tagger, altså et værktøj som føjer ordklasseinformation til hvert løbende ord i en tekst.

TEI – Text Encoding Initiative = konsortium af institutioner og forskningsprojekter der samarbejder om at udvikle og vedligeholde en standard til repæsentation af tekster i digital form

Token – Et af de løbende ord i en tekst, fx ”pigens” i sætningen ”Han tog pigens æble.”

Tokenisering = Automatisk opsplitning af en tekst i en sekvens af tokens.

VTU - Ministeriet for Videnskab, Teknologi og Udvikling = Ministry of Science, Technology and Innovation

XML – eXtensible Markup Language = XML er et opmærkningssprog der bruges til at beskrive data og dataskrukturer

WAYF (Where Are You From) WAYF is the connection between the login systems at the connected institutions and external web based services = WAYF-adgang = standard til sikker identifikation af brugere ved login til et websted fx studenter og medarbejdere på et universitet