Módelanna Teanga Móra agus Forbairt Measúnachta

Published on Eanáir 20,2023

Shutterstock 2520071063

Le Charles Foster agus Jesse Hamer

Réamhrá

Ó 2021 i leith, ag Finetune, táimid tar éis a fheiceáil an poitéinseal atá ag Múnlaí Teanga Móra (LLMs) maidir le conas a athraíonn siad an bealach a oibríonn gairmithe sa réimse oideachais & measúnachta. Bhí an luas drámatúil a bhí ag dul ar aghaidh sa spás seo mar thoradh ar a chiallaigh go bhféadfadh coincheapa dul ó toy taighde seachtain amháin, go táirge víreasach an chéad eile.

Mar sin, níorbh ionadh a chonaic an freagra ar ChatGPT: i ndemo amháin, thuig gach duine go bhfuilimid ar leibhéal rud éigin mór. Ag breith ar an excitement agus an neamhchinnteacht atá ann faoi láthair, d'fhéadfadh duine a wonder: conas a oireann Finetune Generate, atá patentaíodh, don tírdhreach seo? Más féidir liom ach chat bot ginearálta a iarraidh chun mo scríbhinn a dhéanamh dom, cén fáth a mbeadh gá agam le haon rud eile?

Is maith linn a shamhlaigh Múnlaí Teanga Móra mar múnlaí bunúsacha: córais AI a ligeann a n-ardú agus éagsúlacht a n-oiliúna gníomhú mar bhunús do raon leathan úsáidí. Tá roinnt eagraíochtaí, lena n-áirítear Anthropic, EleutherAI, agus OpenAI (forbróir ChatGPT), ag traenáil na múnlaí ollmhóra seo agus ag cur ar fáil do dhaoine eile iad a úsáid. Ach tá na múnlaí féin mar leibhéal bunúsach amháin: tá i bhfad níos mó poitéinseal acu nuair a bhíonn siad fite fuaite i gcóras níos mó, a tógadh do bhfeidhm ar leith. Díreach mar atá le teicneolaíochtaí ginearálta eile cosúil leis an nGréasán, d'fhéadfadh sé a bheith ina ghiniúint iomlán taighdeoirí agus fiontraithe ag tógáil córais uirthi, chun a poitéinseal a bhaint amach. I gcomhrá le Ezra Klein, cháin Sam Altman, Ceo OpenAI, tuairim cosúil leis seo:

Cad a cheapaim nach bhfuilimid na daoine is fearr ar domhan ag, ná ní theastaíonn uainn go gcuirfí aird ar [ón], ná ar na táirgí iontacha go léir a tógfar ar bharr [múnlaí teanga móra]. Agus mar sin, smaoinímid ar ár ról mar conas na córais AI is cumasaí ar domhan a thógáil agus ansin iad a chur ar fáil do dhuine ar bith a leanann ár rialacha chun na córais uile a thógáil ar bharr dóibh.

Altman, 2023

Trí LLManna a chomhcheangal le teicneolaíochtaí traidisiúnta níos mó cosúil le bunachair eolais agus comhoibriú duine, is féidir linn stacaí teicneolaíochta a chruthú, nó feidhmchláir ginearálta, a ligeann dúinn na cumais atá ag LLManna a scaoileadh chun uirlisí cliste a chruthú i ngach cineál réimsí iarratais. Is iad Generate agus ChatGPT dhá shampla luath de na hiontrálacha seo.

Leis an gcreat seo i gcuimhne, déanaimis comparáid a dhéanamh idir ChatGPT agus Finetune Generate mar fheidhmchláir ginearálta atá bunaithe ar GPT-3, ó thaobh forbairt míreanna.

Spriocanna Dearaidh

Tá ChatGPT agus Finetune Generate beartaithe chun comhoibriú níos intuigthe a sholáthar do úsáideoirí chun idirghníomhú le múnlaí ginearálta cosúil le GPT-3. Thar sin, tá na dá fheidhmchlár go hiomlán difriúil. Tá misean ag OpenAI chun córais AI sábháilte, ginearálta a thógáil do chách, agus tógadh ChatGPT chun blaiseadh a thabhairt don phobal ginearálta ar cad atá comhoiriúnachtaí múnlaí teanga ábalta a dhéanamh le teanga nádúrtha, agus chun a bheith mar ghairdín tástála do thógálaithe chun smaointe nua a thástáil.

Ag Finetune, cé go mbímid ag comhoibriú leis an bpobal taighde níos leithne maidir le nuálaíochtaí múnla teanga (féach ár gcomhoibriú le OpenAI maidir le feabhsuithe ar chuardach seimantach), ní raibh an sprioc againn le Generate ná córais ginearálta nua a thógáil, ach rud éigin níos fearr a chruthú do scríbhneoireacht míreanna a chabhraíonn AI. Sin é an fáth go bhfuil Generate tógtha go sonrach le scríbhneoirí míreanna i gcuimhne, timpeall a gcleachtais is fearr, teanga, agus na hoibreacha. Bhí gach corraigh dearaidh againn bunaithe ar chómhoibriú le raon leathan de thúsóirí luatha. Tá gach múnla Generate a thógann muid deartha chun struchtúr uathúil gach measúnachta a léiriú, agus tugann sé don úsáideoir na rialuithe ar leith atá ag teastáil dá tasc. Ina theannta sin, is féidir le foirne iomlána scríbhneoirí míreanna comhoibriú ar fhorbairt míreanna ag úsáid Generate, le feidhmiúlacht á tógáil isteach chun bainistíocht ceadanna agus onnmhairiú struchtúrtha go formáidí cosúil le QTI a cheadú.

Sonraíocht

Déantar múnlaí teanga móra a thraenáil i gcéim tosaigh a thugtar pretraining, áit a bhfoghlaimíonn siad ó na milliún leathanach ón nGréasán, leabhair, agus foinsí eile i seisiún fada. Mar gheall ar cé chomh daor is atá an comhoibriú foghlama ó na hionchais sin, tá a n-eolas ginearálta socraithe ina áit ina dhiaidh sin. Ós rud é go bhfuil sé mar dhialann tanaí ar bharr GPT-3, tá bonn eolais socraithe ag ChatGPT freisin nach féidir a chur in eagar. Más mian le teicneoir cabhair a fháil maidir le córas propraíochta, ní bheadh an múnla sin úsáideach dóibh, mar níl aon bhealach ag an múnla chun ábhar nua a fhoghlaim.

Ritheann comhpháirtithe Finetune ó K-12 go hard-oideachas go ceadúnas & teastais, agus cuimsíonn sé raon leathan réimsí.

Mar sin, tá sé ríthábhachtach dúinn go ndéanfaidh na múnlaí a thógaimid dóibh foghlaim óna n-ábhar uathúil—even má tá an t-ábhar sin an-speisialta nó nua—and must be updatable with new materials as they become available.

Chun é seo a dhéanamh indéanta, tá ár bhfoireann R&D AI tar éis ár modhanna féin a shaincheapadh chun eolas nua a chur in eagar go héifeachtach i múnlaí teanga agus chun iad a spriocadh do na treoirlínte ar leith atá i measúnacht. Ina theannta sin, foghlaimíonn Generate go dinimiciúil thar am chun míreanna a spriocadh níos fearr do ábhar agus stíl na dtascanna atá ag gach custaiméir. I rith na bliana seo táimid ag súil le roinnt gnéithe eile a sheoladh a chinnfidh ar chumas agus inathraitheacht ár múnlaí, ó spriocáil frásaí eochair go rialú mion-éadain ar chastaíocht cognaíoch agus níos faide.

Slándáil

Is ábhar imní é slándáil laistigh de fhorbairt míreanna.

Coimeádtar míreanna gafa, le balla, le gach custaiméir ag rochtain amháin ar a múnlaí féin.

Fiú laistigh de chustaiméir aonair, is féidir úsáideoirí a shrianadh chun rochtain a fháil ar mhíreanna ginte ar leith. Le Generate, is iad custaiméirí i gcónaí na húinéirí ar aon mhíreanna a dhéantar, cibé an bhfuil siad ag iarraidh ach múnla tosaigh a thástáil nó an uirlis a ghlacadh ar scála.

Muinín & Tacaíocht

Is é an chuid is mó atá ag déanamh úsáid táirgiúil as LLM deacair ná go bhfuil sé go bunúsach randamach: iarr air an cheist chéanna dhá uair agus tabharfaidh sé freagraí difriúla duit. Tá sé seo in aghaidh a bhfuil súil againn go ginearálta ó ár n-uirlisí: comhoibrímid leo chun a bheith iontaofa. Cuireann sé seo le fadhb amháin den chuid is mó a bhaineann le ChatGPT agus le huirlisí LLM eile, is é sin go bhfuil sé deacair muinín a bheith agat as a gcuid torthaí nuair nach bhfuil a fhios agat cén fáth a roghnaíodh na torthaí sin. An raibh sé bunaithe ar fhíricí a chaomhnaíonn an múnla, nó ar bhréaga a d'innsigh an múnla, nó fiú ar ábhar pléisiúrach ó fhoinse nach raibh le feiceáil?

Tá na caighdeáin muiníne laistigh de oideachas & measúnacht ard, i bhfad níos airde ná do chatbots gnáth. Teastaíonn ó chustaiméirí a fhiosrú go bhfuil na míreanna a chruthaíonn siad trí Generate go deimhin nua, atá bunaithe ar a n-ábhair féin, agus atá bailí.

Obairíonn ár dTéamaí Tomhais agus R&D AI le gach custaiméir chun múnlaí a chruthú atá oiriúnaithe do na riachtanais atá acu, agus chun aiseolas a chur san áireamh i mionfhóird na múnlaí atá ag dul ar aghaidh.

Déanaimid freisin seiceálacha láimhe agus uathoibríocha chun a chinntiú go comhoibríonn na moltaí a dhéanann Generate le sonraíochtaí an chustaiméara. Beidh feidhm nua againn go luath a cheadóidh do dhaoine úsáideoirí a chur i gcomparáid go héasca le míreanna ginte le hábhair tagartha, ionas go mbeidh siad in ann a bheith cinnte láithreach go bhfuil na míreanna a dhéanann siad bunaithe ar fhíric.

Conclúid

Is am spreagúil é seo ina bhfuil céadta feidhmchlár ginearálta á dtógáil, gach duine ag cuardach úsáidí éagsúla do LLManna. Ag dul i ngleic leo mar dhuine a bhfuil suim mhór aige i gcaighdeán measúnachta i d'oideachas, ceadúnas agus deimhniú, molaimid go gcoimeádfaidh tú na ceisteanna seo i gcuimhne i gcónaí:

  • Cé atá an feidhmchlár seo deartha do?
  • An bhfuil an múnla a úsáideann an feidhmchlár seo traenáilte go sonrach do na riachtanais atá ag mo eagraíocht, lena n-áirítear ár riachtanais slándála?
  • Cén chaoi a n-úsáidfear an t-eolas a sholáthraím?
  • Ar mhaith liom infheistíocht a dhéanamh sa tréimhse agus airgead chun múnla ginearálta neamhbhrúite a dhéanamh inúsáidte (m.sh. an UI cuí) agus iontaofa ag ár nTuilleadh Ábhar (SMEs) chun é a chur i ngleic lena n-oibríochtaí agus le cásanna úsáide ard-staide?

Táimid fós i laethanta luatha na teicneolaíochta go háirithe tábhachtach seo, ach tá sé ag éirí soiléir cheana féin an méid atá in ann feidhmchláir ginearálta a chumasú ar fud réimsí éagsúla. Tá guthanna cúramacha a nocht Gary Marcus ó NYU agus daoine eile ag tabhairt aire freisin.

Ag Finetune, táimid an-sásta leanúint ar aghaidh ag taispeáint níos mó gnéithe inár tríú bliain a dhéanfaidh Generate níos mó oibriúnach, níos mó iontaofa, agus níos mó cabhrach ar fud an gcuairte foghlama agus measúnachta.

Nuashonraithe 29 Aibreán, 2025