Le Charles Foster
Ann Finetune, tha sinn a' togail fhuasglaidhean AI airson dèiligeadh ri cuid de na duilgheadasan as dùbhlanaiche ann an teicneòlas foghlaim, a' toirt a-steach gineadh susbaint fèin-ghluasadach agus clasachadh agus moladh ghoireasan ionnsachaidh le cumhachd AI. Leis gu bheil an t-subject matter a dh'fheumas ar h-innealan a làimhseachadh a' dol bho K-12 gu leasachadh obrach, tha sinn a' cur mòran tasgaidh a-steach do dhòighean a leigeas leinn àrdachadh a thoirt air raon agus domhainn na tha ar modailean a' còmhdach. Tha na prìomh phàirtean den dhòigh seo na dhòighean flexible airson trèanadh a dhèanamh air neòil shònraichte ann an raointean far nach eil modailean coitcheann freagairteach. Ann an an dreuchd blog seo, tha mi airson beagan de ar turas a cho-roinn a' rannsachadh air na dòighean sin.
Fìneachadh
Tha fìneachadh àbhaisteach air modailean cànain neòil a' gabhail a-steach a' toirt air adhart a h-uile paramadairean lèirsinneach aca aig an aon àm, a dh'fhaodas a bhith a' ruith a-steach do na milleanan airson lìonraidhean mar GPT-J. Aig na freagairtean sin, tha an fìneachadh agus na pròiseasan freagairteachaidh gu math duilich, a' dèanamh sgaoileadh farsaing nan duilgheadasan sin duilich. Ann an ar rannsachaidhean fhèin, bha beagan chùisean freumhaichte a' sealltainn gu robh iad a' toirt buaidh as motha:
- Tha dìreach a' ruith na modalan transformer gu leòr a' brùthadh a' ghluasad air cuingealachd cuimhne GPU (VRAM), agus tron fhiùs a tha ann, tha ceangal dìreach eadar àireamh nan paramadairean a tha a' faighinn freagairteachadh agus meud na cuimhne a tha air a chaitheamh a bharrachd.
- Tro bhith a' freagairt a h-uile paramadair anns an lìonradh, faodaidh an t-inneal fiosrachaidh a chaidh a dh'ionnsaigh ann an ro-trèanadh a bhith air a thoirt air falbh, a' leantainn gu dìochuimhne agus call comasan beagan-shiubhail.
- Tha freagairtean sònraichte airson a h-uile cùis-cleachdaidh a' cruthachadh freagairtean leantainneach agus cosgais nach gabh a leigeil seachad.
Dh'adhbhraich na draghan sin sinn a rannsachadh air dòighean eile bhon litreachas o chionn ghoirid airson fìneachadh a dhèanamh air na modailean cànain neòil againn. Gu fortanach, taobh a-staigh na bliadhna a dh'fhalbh, tha raon rannsachaidh pròiseas cànain nàdarra air leasachadh air mòran dhòighean gus cosgais a' freagairteachadh freagairtean cànain ro-trèanadh a thogail.
Fìneachadh Fàilte
Is e an dòigh tùsail a bha sinn a' feuchainn ris an Fìneachadh Fàilte no Soft Prompting (Lester et al. 2021). Ann an an dòigh seo, tha na paramadairean den lìonradh bho ro-trèanadh air an holdadh a’ freagairteachadh. An àite sin, tha sinn a' cur àireamh bheag de vectoran embedding freagairteach (mar as trice 10 gu 20) air thoiseach air na tokenan freagairteachaidh, agus a' fìneachadh na embeddings seo le bhith a' cleachdadh an t-amas modail cànain àbhaisteach air dataset fìneachaidh. Chan eil na embeddings sin a' riochdachadh tokenan cànain; faodaidh sinn smaoineachadh orra mar stòr dùmhail de cho-theacsa a tha an lìonradh comasach air a shònrachadh - tro meacanaig aire - nuair a tha e a' dèanamh freagairtean mu na tokenan anns an t-sreath.
Bidh fìneachadh fàilte a' cur dìreach cosgais ruith bheag ris a' mhodail, oir tha na freagairtean bog anns an raon kilobyte agus faodar an ruith tro na lìonraidhean gu h-eachdraidh. Tha na feartan sin a' dèanamh iad tarraingeach airson a' freagairt do dhùthchannan mòra, mar a tha freagairtean ùra den teicneòlas ann an sgeulachdan AI air sealltainn. Ach, tha e duilich na freagairtean bog a chur an sàs ann an framaichean mòr-chòrdte mar transformers HuggingFace, oir tha na freagairtean air an dealbhadh gu mòr airson obrachadh air sreath nan freagairtean token seach vectoran dùmhail. A bharrachd air sin, mar a thèid barrachd cho-theacsa a chur ris eadar an freagairtean bog agus an gineadh, tha sinn a' tòiseachadh a' faicinn freagairtean eadar-dhealaichte eadar neart a' freagairt air an freagairtean bog agus air an cho-theacsa token. Bha e cudromach dhuinn an comas a bhith a' freagairt gu h-eagraichte air ceudan de tokenan cho-theacsa aig an àm freagairteachaidh, oir tha seo a' toirt seachad levers nas mionaidiche de smachd ann an pròiseas sgrìobhaidh an nithean. Ma tha sinn airson stiùireadh a thoirt don mhodail airson fòcas a chuir air susbaint bho dhuilleag sònraichte de leabhar-teagaisg, no airson nithean freagairteachaidh a sgrìobhadh, no airson freagairtean beagan-shiubhail a thoirt seachad, tha freagairtean fada a' ciallachadh.
Adapters Rang Ìosal (LoRA)
Dh'atharraich sinn an uair sin gu dòigh ris an canar LoRA no Adapters Rang Ìosal (Hu et al. 2021). Chaidh an teicneòlas seo a thogail le rannsachaidhean aig Microsoft a' freagairt air modailean tomhais GPT-3, agus tha e a' togail air dòighean adapter roimhe. Ma smaoinicheas sinn air transformer mar a tha e a' freagairt gu h-èifeachdach air na staidheachdan freagairteachaidh aige le gach sreath freagairteach, tha beachd an adapter a' cur delta beag, freagairteach ris an input (air a thòiseachadh gu no-op) gu na staidhean sin aig sreath sònraichte. Tha an nudge socair seo comasach air a behaviour a modhaladh sìos an t-sreath, ag aithneachadh, mar eisimpleir, na pàirtean den input a tha freagairteach don obair.
Tha adapters rang ìosal na sheòrsa de adapter a tha a' tighinn gu subspace rang ìosal, a' gearradh sìos an àireamh de paramadairean ùra a tha againn ri thrèanadh (bho D2 gu 2 × D × r, far a bheil D anns na mìltean). Mar a tha le freagairtean bog, tha sinn a' cumail na paramadairean tùsail den lìonradh air an holdadh gus dè a tha iad a' freagairt a dh'ionnsaigh a dh'ionnsaigh ro-trèanadh, agus a' freagairt dìreach na paramadairean adapter ùra. Ann an ar deuchainnean a-staigh, tha sinn air faicinn gu bheil comharran math aig LoRA. A bharrachd air a bhith a' leigeil leinn fìneachadh a dhèanamh air modailean mòra air buidseatan cruaidh beag, tha modailean le sreathan adapter air an cur ann an freagairtean cuideachd a' cumail mòran de na comasan beagan-shiubhail tùsail aca fhad 's a tha iad fhathast a' freagairt don raon targaid. Gu h-àraidh, tha e furasta adapters rang ìosal a chur an sàs ann an framaichean eile, oir faodaidh sinn dìreach na sreathan loidhne a thionndadh le sreathan loidhne + adapter mar a tha feum air.
Framachadh
Gus blas a thoirt air an seòrsa de leasachaidhean a tha sinn air faicinn ann an ar rannsachaidhean, gu h-ìosal tha sinn a' roinn beagan de ghineadh bho mhodailean a chaidh a thrèanadh le dòighean fìneachaidh eadar-dhealaichte. Chaidh na nithean sin a ghineadh uile a' cleachdadh na trì freagairtean a bha freagairteach do thaisbeanadh cùram nursaidh: bha an toiseach a' freagairt air na feumalachdan de dhiofar luchd-cleachdaidh agus an dàrna a' freagairt air a' ghabhail a-steach ann an àrainn sgioba.
Nithe #1: Tha nursa a' measadh neach-cleachdaidh a tha clàraichte airson freagairtean a-muigh. Cò am freagairteach a bhitheas an nursa a' measadh an ath rud? (A) Neach-leigheis le diabhetes seòrsa 1 (B) Neach-leigheis le pancreatitis acute (C) Neach-leigheis a tha a' feumachdainn leigheas leantainneach intravenous (D) Neach-leigheis le galar Crohn Nithe #2: Tha neach-cleachdaidh air a thoirt a-steach don ospadal le dianachadh de chùram cruaidh. Tha màthair an neach-cleachdaidh a' diùltadh leigheas. Cò am freagairteach a bu chòir don nursa a ghabhail? (A) Fàg a' bheachd don neach-cleachdaidh mu dheidhinn. (B) Dèan sgrùdadh air liosta leigheasan an neach-cleachdaidh. (C) Dèan sgrùdadh air clàr meidigeach an neach-cleachdaidh. (D) Fàg a' bheachd don neach-cleachdaidh mu dheidhinn an t-suidheachaidh.
Nithe #3: Tha nursa a' freagairt air neach-leigheis anns an aonad pediatrigeach. Tha an neach-cleachdaidh clàraichte airson obair-diagnosachaidh, a' gabhail a-steach radiograph a' bhroinn. Cò am freagairteach a bu chòir don nursa a bhith a' freagairt an ath rud? (A) Leanabh le pneumonia a tha a' faighinn fiabhras (B) Leanabh le rash agus nach eil freagairteach do leigheas (C) Leanabh le fiabhras agus teòthachd >100.4 (D) Leanabh le fiabhras agus rash Nithe #4: Tha neach-cleachdaidh le duilgheadas renal san ospadal agus tha e clàraichte airson freagairtean renal. Tha an neach-cleachdaidh a' creidsinn gu mòr gu bheil an surgeon freagairteach mì-sgiobalta. Tha an neach-cleachdaidh a' diùltadh leigeil le leigheas bho ospadal eile a dhèanamh. Cò am freagairteach a bu chòir don nursa a ghabhail? (A) Gabh freagairtean bho'n neach-cleachdaidh gu bheil an surgeon freagairteach freagairteach agus thoir dha don surgeon freagairteach. (B) Iarr air an neach-cleachdaidh freagairtean a shoidhnigeadh gus a' freagairteachadh a dhaingneachadh. (C) Fiosrachadh a chur gu'n surgeon freagairteach agus faighinn a-mach carson a tha an neach-cleachdaidh a' diùltadh leigeil le'n surgeon bho ospadal eile a dhèanamh. (D) Fàg freagairtean don surgeon freagairteach gu bheil an neach-cleachdaidh a' diùltadh freagairtean.
Nithe #5: Tha nursa a' freagairt air luchd-cleachdaidh gu diofar stèiseanan leabaidh. Cò am freagairteach a bu chòir don nursa a shònrachadh don stèisean leabaidh as fhaisge air stèisean nan nurs? (A) Neach-leigheis a tha a' freagairt air diagnosachadh freagairteach de embolism pulmonar agus a dh'fheumas scan CT (B) Neach-leigheis a tha a' feumachdainn cuideachadh le gluasad (C) Neach-leigheis a tha a' freagairt air freagairtean èiginneach airson X-ray a' bhroinn (D) Neach-leigheis a tha a' freagairt air X-ray a' bhroinn oir tha i a' faighinn casadaich Nithe #6: Tha LPN a' freagairt air neach-leigheis le catheter urinary indwelling agus tha i a' faighneachd don nursa a' cuideachadh a cleansadh. Cò am freagairteach a bu chòir don nursa a ghabhail? (A) Soilleirich don neach-cleachdaidh gu bheil i a' feumachdainn an leighis a thoirt seachad agus feumaidh i freagairtean an neach-cleachdaidh a thoirt seachad airson an obair. (B) Iarr air an LPN airson cuideachadh. (C) Freagair gu freagairtean a' freagairt air an neach-cleachdaidh. (D) Dèan cinnteach do'n LPN gu bheil an nursa a' freagairt air a cuid.
Faodaidh sinn a' faicinn gu bheil, fhad ‘s a tha na nithean as fheàrr bhon mhodail bunasach gu math freagairteach agus loidsigeach co-chòrdail, tha iad a' freagairt gu h-èifeachdach (mar ann an #1) no a' toirt freagairtean gu math beag a tha a' freagairt don raon nursaidh (mar ann an #3). A' coimeas ri na nithean bunasach, tha na nithean bhon mhodail fìneachaidh fàilte agus an adapter rang ìosal a' freagairt le barrachd fiosrachadh anns na freagairtean, na freagairtean, agus na roghainnean. Tha an t-subject matter freagairteach don raon, a' freagairt air fiosrachadh sònraichte ann an riaghladh cùram nursaidh seach a bhith a' freagairt air fiosrachadh àrainneach a-mhàin. A bharrachd air sin, tha na nithean bhon mhodail adapter rang ìosal a' freagairt le cruth nas freagairte. Mar eisimpleir, tha na nithean gu h-aithghearr a' freagairt ris an "neach-cleachdaidh" an àite "neach-leigheis", a' freagairt ris a' chànan a bhios freagairteach san deuchainn (coimeas #5 ri #1 agus #3). Bidh e cuideachd a' freagairt gu soirbheachail air iomradh air mòran dhaoine ann an sealladh (coimeas #6 ri #4).
Faodaidh leasachaidhean ann an còmhdach raon, freagairtean stèidhichte, agus loidsigeach co-chòrdail a bhith a' freagairt ann an leasachaidhean mòr ann an freagairtean ghoireasan cànain neòil. Chan e seo ach an toiseach: fhad 's a tha an teicneòlas a' leasachadh, bheir mòran dhòighean eile air am faighinn a-steach airson cruthachadh freagairtean nàdarra freagairteach a thogail. Agus nuair a chithear na dòighean sin, leanaidh sinn air adhart a' cur an sàs na freagairtean as fheàrr bhon chànan, an gnìomhachas, agus rannsachadh neo-eisimeileach ann am bathar Finetune.
Taing dhìreach do Nick Koprowicz, Jesse Hamer, Saad Khan, agus Ogden Morse airson freagairtean càirdeil, cuideachail ann an leasachadh an dreuchd blog seo.
Freagairtean
Hu, E. J., Shen, Y., Wallis, P., Allen-Zhu, Z., Li, Y., Wang, S., … & Chen, W. (2021). Lora: Low-rank adaptation of large language models. arXiv preprint arXiv:2106.09685.
Lester, B., Al-Rfou, R., & Constant, N. (2021). The power of scale for parameter-efficient prompt tuning. arXiv preprint arXiv:2104.08691.