DK-CLARIN > Forklaringer
Ordforklaringer og forkortelser
ADL – Arkiv for Dansk Litteratur = Danish National Archive of Literature
Alignerede tekster – tekster hvor originaltekst og oversættelse optræder parvis sætning for sætning =aligned texts
AP – arbejdspakke = WP – work package
AU – Aarhus Universitet = University of Aarhus
BLARK – Basic Language Ressource Kit = En værktøjskasse med fundamentale sprogresurser, fx korpusser og taggere
Ca - Conversation Analysis = konversationsanalyse
CBS - Copenhagen Business School
CLARIN - Common Language resources and technology infrastructure
Domæne = domain
1. fagligt interesseområde som en person eller gruppe af personer behersker, bestemmer over eller føler sig hjemme i; afgrænset område eller felt
2. område på et (edb)netværk; på internettet er det ofte navngivet på en måde der afspejler navnet på den person, institution eller virksomheder, der råder over området; også om dette områdes navn, typisk svarende til en internetadresses midterste del; jf domænenavn
DSL – Dansk Sprog- og Litteraturselskab = the Society for Danish Language and Literature
DSN - Dansk Sprognævn = Danish Language Council
DUDS – Danish Under Digital Study = Digitale Undersøgelser af Dansk Sprog
ESFRI – European Strategy Forum for Research Infrastructures = Europæisk forum for Forskningsinfrastruktur
HLT – Human Language Technology = sprogteknologi
KB – Det Kongelige Bibliotek (Danmarks Nationalbibliotek) = the Royal Library (the Danish National Library)
Kontekst – sammenhæng som et givent ord står i = context
Korpus (flertal: korpora eller korpusser) = et korpus er en elektronisk samling af tekster der bruges til sproglige eller litterære undersøgelser
KU - Københavns Universitet = University of Copenhagen
KU-LAN - Københavns Universitet Lanchart (Danish National Research Foundation Centre for Language Change in Real Time)
KU-CST – Københavns Universitet - Center for Sprogteknologi = Centre for Language Technology
KU-INSS - Københavns Universitet - Institut for Nordiske Studier og Sprogvidenskab = Department of Scandinavian Studies and Linguistics
Lemma = et ords grundstamme (i ordbogssammenhæng: opslagsord)
Lemmatiser – (lemmatisering) = værktøj der finder et ords grundstamme
LGP - Language for General Purposes = alment sprog
LSP - Language for Special Purposes = fagsprog
MOVIN - (Microanalysis Of Verbal/non-Verbal/Visual INteraction) is the Danish network for scholars of interaction analysis and conversation analytic studies = dansk netværk for interaktionsanalyse og konversationsanalytiske studier
Multimodal = Indeholdende informationer på flere forskellige semiotiske kanaler, fx en tv-transmission med billede, lyd og undertekster.
MUMIN – Nordic Network for Multimodal Interfaces (the project was closed)= Nordisk netværk for multimodal interaktion (projektet er afsluttet)
NatMus - Nationalmuseet = the National Museum of Denmark
OCR - Optical Character Recognition, optisk tegngenkendelse, er den mekaniske eller tekniske konvertering af håndlavede, skrevne eller printede billeder med tekst, til maskinredigerbar tekst.
Parallelle korpusser = parallel corpora
1. alignerede tekster (hvor originaltekst og oversættelse optræder parvis sætning for sætning)
2. tekster som handler om det samme emne på flere sprog
PoS – Part of Speech = ordklasse
POS-tagging = at opmærke tekst i ordklasser baseret på ordets definition og konteksten
Repositorium – databank som består af flere integrerede korpusser = repository
SDU – Syddansk Universitet = University of Southern Denmark
Tagger = Værktøj som automatisk beriger en tekst med lingvistisk information. Bruges ofte i betydningen PoS-tagger, altså et værktøj som føjer ordklasseinformation til hvert løbende ord i en tekst.
TEI – Text Encoding Initiative = konsortium af institutioner og forskningsprojekter der samarbejder om at udvikle og vedligeholde en standard til repæsentation af tekster i digital form
Token – Et af de løbende ord i en tekst, fx ”pigens” i sætningen ”Han tog pigens æble.”
Tokenisering = Automatisk opsplitning af en tekst i en sekvens af tokens.
VTU - Ministeriet for Videnskab, Teknologi og Udvikling = Ministry of Science, Technology and Innovation
XML – eXtensible Markup Language = XML er et opmærkningssprog der bruges til at beskrive data og dataskrukturer
WAYF (Where Are You From) WAYF is the connection between the login systems at the connected institutions and external web based services = WAYF-adgang = standard til sikker identifikation af brugere ved login til et websted fx studenter og medarbejdere på et universitet

