Intleacht Shaorga: Giolla? Uirlis? …nó Tiarna nua na Cruinne?

Is mór an cur is cúiteamh le tamaillín de mhíonna anois mar gheall ar an gcumhacht atá léirithe ag ChatGPT agus an tsamhail GPT-3 (GPT-3.5 anois) a bhí taobh thiar de. Ansin tháinig feabhas as cuimse air nuair a cuireadh an tsamhail GPT-4 laistiar de ChatGPT, cé go mba ghá íoc as cuntas leo lena húsáid. Tá síntiús $20 le híoc as GPT-4 don am i láthair.

Go gairid ina dhiaidh do OpenAI é a sheoladh cuireadh BingChat ar fáil freisin, agus spin éagsúil ar an ábhar a chruthaítear ansin toisc, i mbeagán focal, go bhfuil srianta éagsúla air agus toisc gur féidir leis cuardaigh Idirlín a dhéanamh. GPT-4 is an tsamhail, nó t-inneall, atá taobh thiar de BingChat. Caithfear an brabhsálaí Microsoft Edge a úsáid, don am i láthair, le leas a bhaint as BingChat agus seachas Edge a shuiteáil ar do ríomhaire is féidir GPT-4 a úsáid trí BingChat saor in aisce.

D’fhógair Sam Altman, CEO OpenAI, ar an 18 Bealtaine go bhfuil ChatGPT ar fáil ar iOS sna Stáit Aontaithe anois agus go mbeidh sé ar fáil ar fud an domhain sar i bhfad. Ní beag sin uilig, agus samhlaím go dtiocfaidh athruithe eile ar an scéal sula mbeidh an bhliain istigh.

Tá comhlachtaí móra idirnáisiúnta eile ag obair sa réimse seo i gcónaí, ach is é an chúis go bhfuil baint ag Microsoft le hobair agus le hacmhainní OpenAI ná gur leo cuid shuntasach d’OpenAI.

Cloisfear agus léifear go leor téarmaí teicniúla agus daoine ag caint faoi na teicneolaíochtaí seo (líonra néarach, samhail teanga, intleacht shaorga, agus an réimír “oll-” rompu uilig sách minic freisin) agus tá iarracht san alt seo ar an mistéir a bhaint de chuid de na coincheapa teicniúla seo.

Anuas air seo, ní dóigh liomsa gur tiarnaí nua na cruinne na teicneolaíochtaí seo agus pléifidh mé canathaobh san, canathaobh a tháinig feabhas orthu le deireanas, agus cén sprioc atá ag na comhlachtaí seo atá ina mbun.

Téimis siar cúpla céim sula dtéann muid ar aghaidh.

Cad is ea samhail teanga?

Is éard is samhail teanga ann ná bailiúchán oll-ollmhór sonraí agus próiseáil déanta orthu le paraiméadair a dhéanamh as an inneachar. Ba é sin cúpla milliún doiciméad, a bhfuil cúpla billiún focal iontu ar an iomlán, agus inneachar na ndoiciméad uilig próiseáilte i gcoibhneas a chéile ar feadh achar maith ama leis na billiúin luachanna dóchúlachta a ríomh mar pharaiméadair agus a shannadh leis na focail uilig i gcoibhneas a chéile. Nuair atá an phróiseáil sin déanta agus sábháilte, is féidir samhail a thabhairt air seachas an bailiúchán mór doiciméid a bhí ann ar an gcéad lá. Is féidir an rud céanna a dhéanamh le bailiúchán mór íomhánna freisin, agus caitear le picteilíní na bpictiúr sa chaoi chéanna a gcaitear le focail na ndoiciméad. D’fhéadfá rá, mar sin, go dtógtar na focail agus go gcuirtear nascanna matamaiticiúla eatarthu uilig.

Úsáidtear na samhlacha seo, go hiondúil, le hiarraidh ar ríomhairí tascanna teanga nó tascanna íomhá-bhunaithe a chur i gcrích. Le tasc a chur i gcrích seoltar iarratas chuig an tsamhail trí ríomhchlár (nó trí chomhéadan a bhfuil ríomhchlár taobh thiar de). Ritheann an ríomhchlár sin leis ar chonair luachanna dóchúlachta na samhla ar bhealach a shíleann sé a bheith oiriúnach don iarratas, agus faightear freagra. Cuimhnigh go bhfuil an chonair seo bunaithe ar nascanna matamaiticiúla, nó luachanna dóchúlachta dáiríre, idir focail nó picteilíní uilig na samhla. Fágann sé sin gur boscaí dubha na samhlacha seo ar bhealach, ní heol dúinn cén chonair a leanann siad agus an t-ionchur á phróiseáil acu leis an aschur a chruthú.

Seo léiriúchán simplí ar ailtireacht na samhla.

Is éard a tharlódh leis an tsamhail seo, dá mbeadh ábhar traenála Gaeilge aici, ná go bhféadfaí í a úsáid trí ríomhchláir eile leis an gcéad fhocal eile san abairt a thuar.

Sampla: Rith an t-ionchur “Baile na “ tríd an tsamhail agus sula molfaidh sí aschur breathnóidh sí ar an dóchúlacht a bhaineann leis an gcéad fhocal eile. De réir an corpas Gaeilge is mó a bhfuil teacht agamsa air, is é “nGall” > “Baile an nGall” an toradh is dóchúla – bronnfaidh mé scór 100 ar an dtoradh seo.

Tá dóchúlacht 20% níos ísle ann gur “hAbhann” > “Baile na hAbhann” an chéad fhocal eile – bronnfaidh mé scór dóchúlachta 80 ar an dtoradh seo.

Tá dóchúlacht i bhfad níos ísle ag an bhfocal atá sa tríú háit agus scór 35 ag “nGallógach” > “Baile na nGallógach”, scór 30 ag “Manach” > “Baile na Manach”.

Éiríonn na scóranna as sin amach níos lú agus níos lú, agus níos giorra agus níos giorra le chéile, de réir dlí Zipf.

Tabhair cúpla rud faoi deara faoin sampla seo: bíonn an dóchúlacht is airde ag an bhfocal is airde minicíochta sa tsraith focail. Ach cuimhnigh gur dóchúlacht é seo, seachas fait accompli, agus is mar sin atá sa bhfíorshaol agus muid ag caint faoi bhailte freisin. Ní labhraíonn duine ar bith faoin mbaile is airde minicíochta i gcónaí, ach má táimid ag iarraidh geall a chur ar cé acu baile a bhfuiltear ag caint faoi bheadh sé ciallmhar geall éigin (ceann gach bealach fiú!) a chur ar an gceann is airde minicíochta. Tabharfaidh tú faoi deara, mar sin, nach gá go bhfaighfeá an t-aschur céanna ón tsamhail i gcónaí.

Bíonn foireann uirlisí agus gléasraí ag imirt tionchar ar aschur na samhla freisin sa chaoi gur féidir leis glacadh le hiarratas a scríobhann an t-úsáideoir, tuiscint éigin a bhaint as an iarratas sin, topaicí áirithe íogair agus/nó díspeagúla a sheachaint, agus aschur oiriúnach a sholáthar. Seo ceann de na cúiseanna go bhfuil ChatGPT difriúl le BingChat, tá uirlisí agus gléasraí éagsúla ag scagadh na n-iarratas. Deirtear gur féidir iarratais eile an úsáideora a áireamh uaireanta freisin, ach tá saineolaithe an réimse in amhras faoi chruinneas nó éifeachtúlacht na gné seo.

Anois agus tuiscint ghinearálta againn ar an gcaoi a n-oibríonn na córais seo, táimid ábalta labhairt faoin gcaoi a n-úsáidtear iad.

Cumas na Samhlacha

Bhain gach leagan de na samhlacha is déanaí seo siar asainn agus an cumas a léirigh siad aschur ciallmhar úsáideach a ghiniúint ach iarratas a fháil ón úsáideoir. Mar sin féin, ní mar a shíltear a bhítear.

Tá cruthúnas éigin sna torthaí scrúdaithe a fuair GPT-4 i gcomparáid le GPT-3.5 go bhfuil dul chun cinn déanta ag OpenAI. Agus is léir go bhfuil siad ag maíomh as an dul chun cinn seo.

Is féidir íomhá a chur faoi bhráid GPT-4 agus ceist a chur ar GPT-4 cad a cheap sé faoin íomhá.

Seo thíos ceann a cuireadh faoina bráid.

Thuig, agus mhínigh, GPT-4 go raibh sé aisteach go raibh fear crochta ó chúl tacsaí agus é ag iarnáil léine.

Mar sin féin, tá srian ar na rudaí is féidir a dhéanamh leis na samhlacha seo toisc nach bhfuil aon ní a scríobhadh ná dúradh ó mhí Mheán Fómhair 2021 i leith san áireamh iontu. Tagann BingChat timpeall ar an srian seo agus an cumas aige cuardach idirlín a dhéanamh, agus is GPT-4 atá istigh ann. Déanfaidh sé iarracht torthaí cuardaigh an Idirlín a leabú sna habairtí a chruthaíonn sé, agus súil aige go mbeidh siad san ord ceart le fírinne a chruthú. Cuimhnigh gur féidir bréag nó neamhfhírinne a dhéanamh as an bhfírinne ach na heachtraí a rá san ord mí-cheart.

Uaireanta eile agus cúpla gné le tuiscint aige ón iarratas díríonn sé an iomarca aird ar chuid amháin de, agus déanann siad uilig botúin nach ndéanfadh páiste.

Uaireanta eile, féadann sé rudaí dainséaracha agus ionsaitheacha a rá toisc go bhfuil sé ródhírithe ar an ngné mhícheart den iarratas.

Bhí cúpla cás ann inar léirigh BingChat gur fhoghlaim sé an iomarca ó lucht postála Reddit, agus an dream a théann chun cogaidh tríd an méarchlár.

Ba chóir go mbéarfadh na huirlisí a scagann an t-ionchur agus an t-aschur ar na samplaí seo uilig ar chúiseanna éagsúla, ach níor rug. Ba chóir go mbéarfadh, dar liomsa. Ag filleadh dom ar an bpointe mar gheall ar an bhfírinne, cheapfainn féin nach bhfuil na teicneolaíochtaí seo oiriúnach le cineálacha áirithe scríbhneoireachta a dhéanamh – áit a bhfuil cruinneas agus an fhírinne an-thábhachtach – agus is tuairim é seo atá ráite ag saineolaithe ríomheolaíochta eile freisin.

Samplaí is ea an dlí, an leigheas, agus cineálacha áirithe eolaíochta ina bhféadfaí dochar a dhéanamh do dhaoine. Go deimhin, d’fhéadfaí bréagnuacht a scríobh leo freisin ach faighim féin gur faoin léitheoir atá sé foinsí maithe iriseoireachta a lorg seachas dul i muinín aon fhoilsitheoir a fhoilseodh bréagnuacht.

 Canathaobh a dhéantar na botúin thromchúiseacha seo más ea? Go bunúsach, déantar na botúin seo agus cinn eile atá cosúil leo toisc nach bhfuil na teicneolaíochtaí seo go maith ag an réamhphleanáil. Cruthaítear an t-aschur ar bhonn dóchúlachta mar a pléadh thuas, rud nach gcuimsíonn aon tseiceáil fírinne. Anuas air seo, agus simpliú beag déanta agam ar mhaithe le bheith gonta faoi seo, is ag smaoineamh ar an téacs a scríobhadh go dtí sin, an t-iarratas, agus an chéad fhocal eile amháin a bhíonn na teicneolaíochtaí seo. Fágann sé seo nach bhfuil sé ag smaoineamh ar an ord ina gcaithfear na fíricí a leagan amach roimh ré, ná ar na céimeanna loighciúla atá le cur i bhfeidhm le freagra stuama a scríobh.

 Ag filleadh dom ar an gceist a chuireas i dtúis an ailt, cad is ea iad?

 Ní dóigh liomsa gur uirlisí na teicneolaíochtaí seo toisc nach féidir brath ar an aschur ná iompar uathu. Smaoinigh ar an gcaoi a mbítear ag brath ar an iompar céanna gach uair a chastar roth cairt, gach uair a bhrúitear truicear druilire, gach uair a bhrúitear an litir G ar an ríomhaire, nó gach uair a chastar na troitheáin ar an rothar.

Is geall le bheith ina ngiollaí iad, toisc go ndéanann siad rudaí ar a mbealach féin agus toisc go bhfreagraíonn siad iarratais. Ach ós rud é nach ar mhaithe leat féin, ná chun do leasa, an t-aschur má tá bréag nó neamhfhírinne ann n’fheadar an amhlaidh gur giollaí iad ach oiread.

Ní fhágann sé sin gur tiarnaí nua na cruinne iad! Faighim féin go mba ghiorra le gníomhairí nó idirghabhálaithe iad ná aon ní eile. Is gníomhairí ar a son féin agus ar son na gcomhlachtaí iad ar bhealach, agus sonraí le bailiú nó brabús le déanamh, agus is idirghabhálaithe iad idir sinne agus na samhlacha (GPT-3.5 nó GPT-4) ar traenáladh iad le formhór mór ábhar an idirlín.

Níl deireadh leis an scéal seo, dhéanfainn machnamh cúramach ar an úsáid a bhainim as astu sula rachainn ina muinín. Más rud é gur chuir sibh spéis san alt seo bí ag faire amach d’ailt eile ar an ábhar. Caithfear tuilleadh plé a dhéanamh ar úsáid agus mhí-úsáid na dteicneolaíochtaí seo, ach an fhianaise le bailiú ar dtúis.

Fágfaidh ar an bhfocal scor seo le Percy Liang (Ollamh ar an ríomheolaíocht le hOllscoil Stanford) sibh…

SCÉALTA EILE