O Corpus 4.0 achega a posibilidade de realizar estudos con perspectiva de xénero

xoves, 10 de febreiro do 2022 Anxo Sesto

O secretario xeral de Política Lingúistica, Valentín García, participou este 10 de febreiro na presentación da versión 4.0 do Corpus de Referencia do Galego Actual (CORGA) no marco do convenio entre o Centro Ramón Piñeiro, dependente da Xunta e a Universidade de Santiago (USC).
Este proxecto consiste nun estudo documental aberto de Internet que vai dende 1975 ata a actualidade co obxectivo de recadar datos para estudar a lingua galega e a súa evolución dende diferentes perspectivas: léxica, morfolóxica, sintáctica, terminolóxica, etc.
Valentín García estivo acompañado de María Sol López Martínez e Guillermo Rojo, directora e director do proxecto; Eva María Domínguez, a coordinadora lingüística do proxecto; e outras personalidades da USC e de NLPgo Tecnologies.
Corpus 4.0
Este servizo do Centro Ramón Piñeiro é unha ferramenta en liña innovadora que proporciona unha grande variedade de datos sobre a lingua galega. Contén máis de 43 millóns de palabras ortográficas correspondentes a textos escritos representativos do galego actual, así como 45 horas de transcricións de programas de radio na súa maioría, aliñando texto con voz.
A nova versión 4.0, segundo se fixo saber na presentación, presenta modernas novidades como son o recoñecemento automático dos apreciativos en -iño, os relativos en -ísimo e unha boa parte de formas con gheada; a posibilidade de realizar estudos con perspectiva de xénero, tendo en conta grafías da linguaxe inclusiva; ou a recuperación de información mediante unha modalidade de inventario.

PUBLICIDADE