Curated Primary Legislation Data to Support Irish Language Technology

27 July 2022

Prior to this work undertaken by researchers at the SFI ADAPT Centre, primary legislation legacy documents were not available in a format that was useful for translation technology.

Dublin, July 27 2022: The Irish Language Technology (ILT) research team at the SFI ADAPT Centre in DCU has provided Rannóg an Aistriúcháin, the Translation Section for the Houses of the Oireachtas, with Translation Memory (TMX) files of primary legislation  (Acts) legacy data spanning the period from 1960-2018. These resources are extremely beneficial to Irish translators as it will allow them to reuse previously translated material using state-of-the-art translation software.

The urgent need for improved technological support for the Irish language has been a recurring issue. The recently published European Language Equality (ELE) project’s report on the Irish language has outlined the necessary steps to securing more technological support for the Irish language to address the risk of digital extinction.

Speaking about the work, ADAPT researcher and ILT lead at DCU, Dr Teresa Lynn, said: “The lack of sufficient language technologies is one of the greatest risks threatening sustained use of many EU languages right now, not only Irish. For these languages to continue to play a role at both national and European level, they need the help of technology in order to meet translation requirements. Our work represents an important step in this direction.’’

Work on producing these valuable translation files was carried out as part of the EU funded PRINCIPLE project (Providing Resources in Irish, Norwegian, Croatian and Icelandic for Purposes of Language Engineering) which focused on gathering, processing and sharing Languages Resources (LRs) such as translation documents for Norwegian (Nynorsk and Bokmål), Croatian, Irish and Icelandic.

In addition to assisting the translators working in Rannóg an Aistriúcháin, this data has also been used to improve the quality of eTranslation, which is used not only by Irish translators at the European Commission but also available to anyone working in the Irish public sector.

ILT researchers in ADAPT have facilitated the State’s commitment to allowing ‘greater access to digital resources developed for the benefit of speakers and learners of Irish’ as outlined in the Action Plan 2018-2022 for the Irish language by delivering technological support for the Irish language through various projects.

Dr Lynn commented: “We are really delighted to show how our work in DCU could help to facilitate technological progress within Rannóg an Aistriucháin. This project also demonstrates that through our combined efforts we can help further support our language in this digital age, both at national and European levels.”

About the ADAPT Centre

ADAPT is the world-leading SFI research centre for AI Driven Digital Content Technology hosted by Trinity College Dublin.  ADAPT’s partner institutions include Dublin City University, University College Dublin, Technological University Dublin, Maynooth University, Munster Technological University, Athlone Institute of Technology, and the National University of Ireland Galway. ADAPT’s research vision is to pioneer new forms of proactive, scalable, and integrated AI-driven Digital Content Technology that empower individuals and society to engage in digital experiences with control, inclusion, and accountability with the long term goal of a balanced digital society by 2030. ADAPT is pioneering new Human Centric AI techniques and technologies including personalisation, natural language processing, data analytics, intelligent machine translation, human-computer interaction, as well as setting the standards for data governance, privacy and ethics for digital content.

————————————————————————————————————————————

Sonraí maidir le Reachtaíocht Phríomha Coimeádta Chun Tacú le Teicneolaíocht na Gaeilge

Roimh an obair seo a bhí déanta ag an bhfoireann taighde san Ionad ADAPT (Ionad ag Fondúireacht Eolaíochta Éireann) ní raibh cáipéisí oidhreachta do reachtaíocht phríomha ar fáil i bhformáid a bhí úsáideach do theicneolaíocht aistriúcháin.

Baile Átha Cliath, Iúil 27 2022: Chuir an fhoireann Teicneolaíochta Gaeilge (TG) san Ionad ADAPT ag Fondúireacht Eolaíochta Éireann, in OCBÁC, comhaid cuimhne aistriúcháin de shonraí oidhreachta príomha (Achtanna) ón tréimhse 1960-2018, do Rannóg an Aistriúcháin, i gcomhair Thithe an Oireachtais. Tá na hacmhainní seo thar a bheith tairbheach d’aistritheoirí le Gaeilge, mar ligfidh sé dóibh ábhar a aistríodh roimhe seo, a athúsáid, ag baint úsáid as bogearraí aistriúcháin úrscothacha.

Tá tacaíocht theicneolaíoch níos fearr don Ghaeilge de dhíth go práinneach, agus is fadhb í ag tarlú arís is arís . Sa tuarascáil ar an nGaeilge maidir le Comhionannas Teanga na hEorpa a foilsíodh le déanaí, leagtar amach na céimeanna riachtanacha chun tuilleadh tacaíochta teicneolaíochta a fháil don Ghaeilge, chun dul i ngleic leis an mbaol go ndíothófar go digiteach í.

Ag labhairt faoin obair, dúirt an taighdeoir ADAPT agus Ceannaire TG in OCBÁC, Dr Teresa Lynn “Tá an easpa teicneolaíochtaí teanga leordhóthanacha ar cheann de na rioscaí is mó atá ag bagairt ar úsáid mharthanach de mórán teangacha de chuid an Aontais faoi láthair, ní hamháin an Ghaeilge. Chun na teangacha sin a bheith ag leanúint ról a imirt ar leibhéal náisiúnta agus ar leibhéal Eorpach araon, tá cabhair ón teicneolaíocht de dhíth orthu, chun riachtanais aistriúcháin a chomhlíonadh. Léiríonn ár gcuid oibre céim thábhachtach sa treo sin.’’

Rinneadh obair ar na comhaid luachmhara aistriúcháin sin, mar chuid den tionscadal PRINCIPLE (Acmhainní a Sholáthar i nGaeilge, san Ioruais, sa Chróitis agus san Íoslainnis chun críocha Innealtóireachta Teanga) a mhaoinighan tAontas Eorpach. Dhírigh an tionscadal ar Acmhainní Teangacha a bhailiú, a phróiseáil agus a roinnt cosúil le doiciméid aistriúcháin don Ioruais (Nua-Ioruais agus Bocmál), Cróitis, Gaeilge agus Íoslainnis.

Chomh maith le cabhair a thabhairt do na haistritheoirí atá ag obair i Rannóg an Aistriúcháin, baineadh úsáid as na sonraí seo freisin, chun caighdeán eTranslation a fheabhsú, rud a úsáideann ní amháin na haistritheoirí Gaeilge sa Choimisiún Eorpach ach d’aon duine atá ag obair san earnáil phoiblí in Éirinn.

Tá gealltanas an Stáit “rochtain níos mó ar acmhainní digiteacha arna bhforbairt ar mhaithe le cainteoirí agus foghlaimeoirí na Gaeilge” éascaithe ag taighdeoirí TG in ADAPT, mar atá leagtha amach sa Phlean Gníomhaíochta 2018-2022 don Ghaeilge, trí thacaíocht theicneolaíoch a chur ar fáil don Ghaeilge trí thionscadail éagsúla.

Dúirt an Dr. Teresa Lynn ón ngrúpa Teicneolaíochta na Gaeilge in OCBÁC “Tá an-áthas orainn a thaispeáint conas a d’fhéadfadh ár gcuid oibre in Ollscoil Chathair Bhaile Átha Cliath cabhrú le dul chun cinn teicneolaíochta a éascú laistigh de Rannóg an Aistriúcháin. Léiríonn an tionscadal seo freisin gur féidir linn tuilleadh tacaíochta a thabhairt dár dteanga sa ré dhigiteach seo, ar leibhéal náisiúnta agus ar leibhéal Eorpach araon, trínár gcomhiarrachtaí.”

Maidir leis an Ionad ADAPT

Is ionad taighde atá chun tosaigh ar leibhéal domhanda é ADAPT, ag Fondúireacht Eolaíochta Éireann do Theicneolaíocht Ábhair Dhigitigh Thiomáinte IS, arna hóstáil ag Coláiste na Tríonóide, Baile Átha Cliath. I measc na n-institiúidí comhpháirtíochta tá Ollscoil Chathair Bhaile Átha Cliath, an Coláiste Ollscoile Baile Átha Cliath, Ollscoil Teicneolaíochta Bhaile Átha Cliath, Ollscoil Mhá Nuad, Ollscoil Teicneolaíochta na Mumhan, Institiúid Teicneolaíochta Bhaile Átha Luain, agus Ollscoil na hÉireann, Gaillimh. Is í fís taighde ADAPT ná, ceannródaíocht a dhéanamh ar chineálacha nua teicneolaíochta ábhair dhigitigh atá réamhghníomhach, inscálaithe agus comhtháite, teicneolaíocht lena dtugtar cumhacht do dhaoine aonair agus don tsochaí, dul i mbun taithí dhigiteach le rialú, cuimsiú agus cuntasacht. Tá sé mar sprioc fhadtéarmach ag ADAPT sochaí dhigiteach chothrom a bhaint amach faoi 2030. Is ceannródaí é ADAPT ar theicnící agus teicneolaíochtaí nua IS, atá dírithe ar an duine. Airítear pearsanú, próiseáil teangacha nádúrtha, anailísíocht sonraí, meaisínaistriúchán cliste, idirghníomhaíocht idir daoine agus ríomhairí leis seo, chomh maith le caighdeáin a leagan síos maidir le rialachas sonraí, príobháideachas agus eitic le haghaidh ábhar digiteach, lena teicnící.