Strategies in tracing linguistic variation in a corpus of Old Irish texts (CorPH)

Stifter, David; Qiu, Fangzhe; Aquino-López, Marco A.; Bauer, Bernhard; Lash, Elliott; White, Nora

Strategies in tracing linguistic variation in a corpus of Old Irish texts (CorPH)

2022 | journal article. A publication with affiliation to the University of Göttingen.

Jump to: Cite & Linked | Documents & Media | Details | Version history

Cite this publication

Strategies in tracing linguistic variation in a corpus of Old Irish texts (CorPH)
Stifter, D.; Qiu, F.; Aquino-López, M. A.; Bauer, B.; Lash, E. & White, N. (2022)
International Journal of Corpus Linguistics, 27(4) pp. 529-553. DOI: https://doi.org/10.1075/ijcl.22018.sti

Copy

GRO View APA Chicago MLA Vancouver

Citable link

GRO.publications Link

Further links

DOI

Documents & Media

document.pdf1.28 MBAdobe PDF

License

GRO License

Details

Authors: Stifter, David; Qiu, Fangzhe; Aquino-López, Marco A.; Bauer, Bernhard; Lash, Elliott; White, Nora
Abstract: Abstract This article introduces Corpus PalaeoHibernicum (CorPH), a corpus currently consisting of 78 texts in Early Irish (c. 7th–10th cent.) created by the ERC-funded Chronologicon Hibernicum ( ChronHib ) project by bringing together pre-existing lexical and syntactic databases and adding further crucial texts from the period. In addition to being annotated for POS, morphological and syntactic information, another layer of annotation has been developed for CorPH – ‘Variation Tagging’, i.e. a tagset that numerically encodes synchronic language variation during the Early Irish period, thus allowing for much improved research on the chronological variation among the material. Another new pillar of studying linguistic variation is Bayesian Language Variation Analysis (BLaVA), in order to address the challenge that “not-so-big data” poses to statistical corpus methods. Instead of reflecting feature frequencies, BLaVA models language variation as probabilities of variation.
Issue Date: 2022
Journal: International Journal of Corpus Linguistics
Organization: Sprachwissenschaftliches Seminar ; Philosophische Fakultät
ISSN: 1384-6655
eISSN: 1569-9811
Language: English

Export Metadata

Refman EndNote BibTeX RefWorks Excel CSV

Strategies in tracing linguistic variation in a corpus of Old Irish texts (CorPH)

Cite this publication

Citable link

Further links

Documents & Media

License

Details

Export Metadata

Reference

Citations

Social Media