O Corpus 4.0 achega a posibilidade de realizar estudos con perspectiva de xénero
xoves, 10 de febreiro do 2022
O secretario xeral de PolÃtica Lingúistica, ValentÃn GarcÃa,
participou este 10 de febreiro na presentación da versión
4.0 do Corpus de Referencia do Galego Actual (CORGA)
no marco do convenio entre o Centro Ramón Piñeiro, dependente da
Xunta e a Universidade de Santiago (USC).
Este proxecto consiste nun estudo documental aberto de Internet que
vai dende 1975 ata a actualidade co obxectivo de recadar datos para
estudar a lingua galega e a súa evolución dende diferentes
perspectivas: léxica, morfolóxica, sintáctica, terminolóxica,
etc.
ValentÃn GarcÃa estivo acompañado de MarÃa Sol López MartÃnez e
Guillermo Rojo, directora e director do proxecto; Eva MarÃa
DomÃnguez, a coordinadora lingüÃstica do proxecto; e outras
personalidades da USC e de NLPgo Tecnologies.
Corpus 4.0
Este servizo do Centro Ramón Piñeiro é unha ferramenta en liña
innovadora que proporciona unha grande variedade de datos sobre a
lingua galega. Contén máis de 43 millóns de palabras ortográficas
correspondentes a textos escritos representativos do galego actual,
asà como 45 horas de transcricións de programas de radio na súa
maiorÃa, aliñando texto con voz.
A nova
versión 4.0, segundo se fixo saber na presentación, presenta
modernas novidades como son o recoñecemento automático dos
apreciativos en -iño, os relativos en -Ãsimo e unha boa parte de
formas con gheada; a posibilidade de realizar estudos con perspectiva
de xénero, tendo en conta grafÃas da linguaxe inclusiva; ou a
recuperación de información mediante unha modalidade de inventario.