Céard a tharlaíonn do do shíneadh fada?

Le fada an lá, tá ‘cód’ á úsáid chun eolas scríofa a scaipeadh. Ach ní thuigtear i gcónaí a bhfuil ar siúl ‘taobh thiar den scáileán’ chun go mbeifear in ann an chiall cheart a bhaint as. 

Abair dá bhfeicfeá na litreacha ‘PC’  — is dócha gur ríomhaire is túisce a rithfeadh leat. Ach dá mba in alt nuachtáin a scríobhadh, is dócha go mbeifeá ag súil le ‘gone mad’ ina dhiaidh. Tharlódh áfach gur litreacha Coireallacha iad agus an fhuaim ‘rs’ i gceist. Tá an duine daonna in ann an comhthéacs a mheas go neamh-chomhfhiosach.  Táimid an-mhaith ag aithint patrúin fiú nuair atá easpa eolais ann nó eolas míchruinn i gceist.

Níl ríomhairí! 

Ní mór don eolas a bheith iomlán agus cruinn le go dtuigfeadh ríomhaire é. B’fhíor sin go háirithe ag tús ré na ríomhaireachta nuair a bhí idir chuimhne agus chumhacht íseal agus an  chumarsáid daor. 

Tá innealtóirí cruthaitheach ach bíonn orthu obair laistigh de shrianta, agus ní minic a bhíonn siad in ann an todhchaí a thuar. Beidh cuimhne ag roinnt agaibh ar fhadhb an Y2K — bhíodh sé de nós gan ach dhá dhigit a úsáid do dháta. Is beag ríomhchláraitheoir in 1970 a shíl go mbeadh a chuid bogearra in úsáid in 2000. Ach bhí — agus in áiteanna tá fós. 

Rinneadh infheistíocht ollmhór agus ba bheag fadhb a d’eascair as ar an lá — ach bhí an fhadhb dáiríre agus costasach le réiteach. Tá fadhb ghaolmhar ag druidim linn. Tá an t-am i córais atá bunaithe ar Unix tomhaiste de réir an líon soicind ó 00:00:00 Déardaoin, 1 Eanáir 1970. Tagraíonn Y2K38 don bhfíric gurb é an t-am is déanaí is féidir a chur in iúl leis sin ná 03:14:07 UTC Dé Máirt, 19 Eanáir 2038.

Fadhb mar seo is cúis le clamhsán síoraí na nGael faoin síneadh fada.  

D’úsáid go leor córais ríomhaireachta an córas Cód Caighdeánach Meiriceánach um Idirmhalartú Faisnéise, nó ASCII. De bharr costas cumarsáide glacadh cinneadh seacht ngiotán a úsáid. 

Is é an ‘giotán’ an bunaonad dénártha — ann/as nó fíor/bréagach nó náid/a haon. 127 rud ar a mhéid is féidir a chur in iúl le seacht ngiotán. Ós rud é gur do teileachlóire a cumadh an cód i dtosach, tá méid áirithe curtha ar leataobh don chóid rialaithe — chun an leathanach a bhogadh chun cinn, an líne a athrú agus mar sin de. 

Seasann an uimhir a seacht, mar shampla, do ‘BEL’ – clog (🛎️) a bhuaileadh! Bhí 62 carachtar eile ann do A-Z, a-z agus 0-9. Baineadh feidhm as cleas chun nach mbeadh idir litreacha cás íochtair agus uachtair ach giotán amháin difriúil, rud a éascaíonn ríomhchlárú feidhmeanna sórtála, mar shampla. Ghlac poncaíocht go leor de na carachtar eile, agus bhí go leor den bponcaíocht sin de dhíth chun ríomhchláir a scríobh.

Roghnaigh IBM, go neamhspleách, córas ocht ngiotán a raibh mórán na feidhmeanna céanna ann, ach ní iad ar fad. EBCDIC a tugadh ar an gcóras seo agus tá sé fós in úsáid go forleathan. Tá siad tábhachtach mar is ar chórais IBM a bhíonn go leor de na bunachair sonraí ar ollríomhairí.

 Is minic go gcnuasaítear eolas i bhfoirm ASCII agus gur gá é aistriú ó ASCII go EBCDIC agus ar ais. Níl gach carachtar in ASCII ar fáil in EBCDIC, agus ar ndóigh tá 128 carachtar sa bhreis ag EBCDIC.

Ar ndóigh ní féidir na diaicritic atá de dhíth do go leor teangacha Iarthar na hEorpa a chur in iúl, gan trácht ar na carachtair atá de dhíth ar teangacha Áiseacha. Nó don Rúisis nó don Ghréigis. Forbraíodh go leor caighdeáin éagsúla chun dul i ngleic leis sin. ISO-8859-1, Latin 1, is coitianta a bhí in úsáid don nGaeilge. 

Ba ghá anois do ríomhaire a raibh baint aige le cumarsáid an t-eolas faoin gcód a bheith aige. Nuair a thosaigh mise ag scríobh ar liosta r-phoist GAEILGE-A sna 1990í, bhí mé lonnaithe sa Ghearmáin. Ba é ISO-8859-1 an gnáthchód ar mo ríomhaire agus ní raibh deacracht agam ríomhphoist i nGaeilge a sheoladh. 

Is minic áfach gur cuireadh in aimhréidh iad — ar an bhfreastalaí, nó ar ríomhaire an fhaighteora (i Meiriceá go háirithe). Ba é an réiteach neamhfhoirmeálta a bhí ann ná ‘/‘ a úsáid in áit gutaí fada. 

Rinneadh réiteach ar leibhéil teicniúla freisin; ina measc réiteach a sheol an t-eolas faoin gcód a bhí in úsáid in éineacht leis an teachtaireacht. Más rud é go raibh ríomhaire an fhaighteora in ann an cód a léamh, bhí go maith.

Sa lá atá inniu ann, tá cód Unicode de chineál éigin in úsáid forleathan. Tá iarchonn i gceist le Unicode – dearadh d’aon uaim é chun bheith oscailte le go bhféadfaí gach carachtar scríofa dá bhfuil ann a chur in iúl. Is féidir freisin buncharachtair a chur le chéile trí roinnt uimhreacha a chuir i leataobh do carachtar teaglama — carachtar a athraíonn an litir rompu. 

Mar shampla, seachas an cód do ‘á’ (Uimhir 225), is féidir an cód do a (Uimhir 61) agus an cód teaglama do síneadh fada (Uimhir 769) a úsáid.

Ar ndóigh, ní féidir na huimhreacha seo a úsáid go díreach sa ríomhaire: is gá don ríomhaire a bheith in ann deireadh carachtar a aithint. Dá bhrí sin úsáidtear cód eile. An cineál is coitianta faoi láthair ná UTF-8, a úsáideann ocht ngiotán go bunúsach. 

Is ionann an chéad 127 cód ann agus ASCII. Má tá giotán a hocht fíor, ciallaíonn sé sin go bhfuil cód neamh-ASCII, a úsáideann níos mó ná beart, i gceist (is ionann ocht ngiotán agus beart). Tugann an chéad bheart sa tsraith le fios cé mhéid beart atá ann,  agus mar sin is féidir le ríomhaire an uimhir a fháil agus an carachtar cuí a chlóbhualadh. 

Ach chun cárta Leap a chlóbhualadh tá roinnt mhaith ríomhairí i gceist agus is cosúil nach bhfuil Unicode in úsáid acu ar fad. Tá an ríomhaire a bhailíonn an t-eolas trí fhoirm ar líne, go hiondúil ríomhaire baile an úsáideora. Cuirfidh an t-úsáideoir isteach a ainm ceart, ‘Aonghus Ó hAlmhain’, abair.

 211 an uimhir do Ó in Unicode.  Tá sé lasmuigh den réimse caighdeánaithe in ASCII. Má tá an freastalaí ag déanamh talamh slán de gur ASCII atá i gceist, cuirfear as a riocht é. B’fhéidir gur EBCDIC atá mar chóras ar an ríomhaire a stórálann é, agus go n-aistreofar an 211 go luach éigin eile in EBCDIC. Fiú má ghlacann an freastalaí leis i gceart, seans nach bhfuil an clódóir in ann plé le carachtair lasmuigh de réimse ASCII, agus clóbhuailfear rud éigin ait ina áit. “Ë” seans, toisc gurbh é sin atá ag cód DOS d’Iarthar na hEorpa. 

Tá a mhacasamhail sin feicthe agam rómhinic ar thicéid de chuid Iarnród Éireann, nó ar an gcóras a chuireann ainm ar an  gclár os cionn suíochán traenach (ríomhaire eile).

Tá Unicode ag scaipeadh, ach tá go leor leor seanchórais fós in úsáid. Tá mórchuid den na prótacal a úsáidtear chun íocaíocht cárta creidmheasa a phróiseáil bunaithe ar ASCII agus spleách air mar go mbíonn na cóid rialaithe in úsáid chun an t-eolas ar an gcárta a roinnt ina mhíreanna.

Is gá go mbeadh comhlachtaí atá ag plé le ainmneacha Gaeilge airdeallach ar an bhfadhb. Mar is iondúil, is fearr súil chun cinn ná súil siar.