Šioje pamokoje sužinosite, kaip veikia didieji kalbos modeliai (LLM) ir sklaidos modeliai , ypač " Microsoft Copilot" kontekste. Šios technologijos yra labai svarbios generuojant tekstą ir vaizdus, naudojamus įvairiose dirbtinio intelekto programose. Norint išnaudoti visą šių priemonių potencialą, svarbu suprasti pagrindines jų sąvokas.
Pagrindinės išvados
- Didelės apimties kalbos modeliai (LLM) generuoja tekstą remdamiesi dideliu apmokytų duomenų korpusu.
- Difuziniai modeliai generuoja vaizdus ir mokosi apdorodami vaizdų ir tekstų poras.
- Žetonų apribojimas yra pagrindinė sąvoka dirbant su LLM.
- Norint iš LLM gauti aukštos kokybės atsakymus, svarbu taikyti veiksmingą raginimo inžineriją.
Žingsnis po žingsnio vadovas
1 žingsnis: pagrindinis supratimas apie didelės apimties kalbos modelius (LLM)
Kad suprastumėte LLM, turite žinoti, kad tai yra kalbos modeliai, kurie buvo apmokyti naudojant didžiulį teksto kiekį. Šie modeliai gali atsakyti į klausimus, iš išmokto teksto ištraukdami atitinkamą informaciją. Atminkite, kad šiame kontekste jūs esate kompiuteris, kuris randa informaciją.
Jūs užduodate klausimą, o modelis savo "atmintyje", kurią sudaro apmokyti duomenys, ieško atitinkamų žodžių. Šiuo atveju svarbu, kad užduotumėte tinkamus klausimus - ši sąvoka vadinama "raginimo inžinerija".
2 etapas: žetonai ir jų reikšmė
LLM apdoroja tekstą skaidydamas žodžius į "žetonus", kurie yra mažesni vienetai, reiškiantys žodžius. Pavyzdžiui, vidutiniškai žetoną sudaro maždaug keturios raidės arba trys ketvirtadaliai žodžio. Šie žetonai yra svarbūs, nes kiekvienas modelis gali apdoroti tam tikrą žetonų skaičių, kuris vadinamas žetonų riba.
Žetonų ribos gali skirtis: Pavyzdžiui, standartinio GPT-3.5 modelio riba yra 4 000 žetonų, o dabartinis GPT-4 modelis apdoroja net iki 128 000 žetonų. Svarbu pažymėti, kad šie apribojimai gali turėti įtakos pokalbiui ir galimybei saugoti bei gauti informaciją.
3 veiksmas: susidorojimas su žetonų apribojimais
Kadangi kiekvienas kalbos modelis turi žetonų ribą, dirbant su LLM labai svarbu į tai atsižvelgti. Jei riba viršijama, modelis gali "pamiršti", apie ką kalbėjote. Šiuo atveju naudinga kurti santraukas arba didelius tekstus suskirstyti į punktus, kad būtų užfiksuota svarbiausia informacija.
4 žingsnis: difuzijos modelių supratimas
Be LLM, labai svarbūs yra ir difuzijos modeliai. Šie modeliai generuoja vaizdus, apmokydami juos pagal vaizdų ir tekstų poras. Vaizdas palaipsniui dengiamas "rūku", kol jo nebeįmanoma įžiūrėti. Mokymo metu modelis išmoksta, kaip atrodo vaizdai, net jei jų tiesiogiai nebegali matyti.
Šis metodas leidžia modeliui sukurti vaizdą iš aprašomojo teksto. Kuo išsamiau aprašysite norimą turinį, tuo tiksliau modelis galės sugeneruoti vaizdą.
5 žingsnis: sąvokų taikymas
Supratus, kaip veikia LLM ir sklaidos modeliai, svarbu šias žinias pritaikyti praktiškai. Naudodamiesi "Microsoft Copilot" visada turėtumėte įsitikinti, kad užduodate tikslius ir tinkamus klausimus, kad gautumėte geriausius rezultatus.
Nesvarbu, ar generuojate tekstą, ar kuriate vaizdus, įvesties kokybė turės tiesioginės įtakos išvesties kokybei.
Apibendrinimas
Šiame vadovėlyje susipažinote su pagrindinėmis LLM ir sklaidos modelių sąvokomis. Dabar jau žinote, kaip šios technologijos veikia, koks yra ženklų vaidmuo ir kokia svarbi rezultatų kokybei yra greitoji inžinerija. Šių sąvokų supratimas yra labai svarbus norint efektyviai dirbti su "Microsoft Copilot" ir panašiomis dirbtinio intelekto programomis.
Dažniausiai užduodami klausimai
Kas yra didelės apimties kalbos modeliai?LLM - tai kalbos modeliai, kurie yra apmokyti iš didelio kiekio teksto, kad galėtų generuoti tekstą ir atsakyti į klausimus.
Kas yra difuziniai modeliai?Difuziniai modeliai - tai dirbtinio intelekto modeliai, kurie generuoja vaizdus, palaipsniui juos "miglindami" ir mokydamiesi, kas yra paslėpta už miglos.
Kodėl svarbūs žetonai.žetonai yra mažiausi žodžių vienetai, kuriuos apdoroja LLM, ir kiekvienas modelis turi ribą, kiek žetonų jis gali apdoroti vienu metu.
Kaip galima apeiti žetonų ribą?kai kurie metodai apima santraukų kūrimą arba teksto skaidymą į punktus.
Kas yra greitoji inžinerija?greitoji inžinerija - tai menas užduoti veiksmingus ir tikslius klausimus, kad LLM gautų aukštos kokybės atsakymus.