Garsas į tekstą: kuriamos dirbtinio intelekto balso ir gilynų kūrimo pamokos

Dirbtinio intelekto balsai ir gilios klastotės: "Wav2Lip" naudojimas kūrybiškiems vaizdo įrašams

Visi pamokos vaizdo įrašai Garsas į tekstą: kūno intelekto balsai ir gilūs sukčiavimai sukūrimas (vadovas)

Šiame vadove sužinosite, kaip naudoti "Wav2Lip" technologiją ir kurti vaizdo įrašus, kuriuose asmens veidas kalba sinchroniškai su garsu. Tai leidžia formuoti asmens lūpų judesius taip, kad jie atitiktų pasirinktą garso įrašą. Naudojimasis "Wav2Lip" yra įdomus būdas kurti kūrybišką turinį. Ši technika yra stebėtinai paprasta, todėl parodysiu, kaip greitai pradėti.

Pagrindinės žinios

  • Wav2Lip yra atvirojo kodo įrankis, kurį galite naudoti "Google Colab" užrašų knygelėje.
  • Jums reikia pateikti vaizdo klipą ir garso įrašą tam tikru formatu.
  • Procesas apima failų įkėlimą ir kodo paleidimą, kad būtų sukurtas galutinis vaizdo įrašas.
  • Naudojant šią technologiją svarbu elgtis atsakingai ir neskleisti netikrų naujienų ar žalingo turinio.

Žingsnis po žingsnio vadovas

1 žingsnis: "Google Colab" užrašų knygelės nustatymas

Norėdami pradėti dirbti su "Wav2Lip", pirmiausia atidarykite "Google Colab" užrašų knygelę, kurioje įdiegta programinė įranga. Užrašų knygelę galite atidaryti pasirinktoje naršyklėje.

Gali prireikti nedidelės "Google Colab" prenumeratos, tačiau paprastai viskas veikia nemokamai. Atidarę užrašų knygutę, tiesiog spustelėkite mygtuką "Play". Tai yra sąrankos procesas, kurio metu turite suteikti leidimą kodui iš "GitHub" veikti užrašų knygelėje.

Dirbtinio intelekto balsai ir gilios klastotės: "Wav2Lip" naudojimas kūrybiškiems vaizdo įrašams

Suteikus leidimą, užrašų knygelė atliks reikiamus diegimus, kurie paprastai užtrunka tik kelias minutes. Kad viskas paruošta, sužinosite, kai pasirodys varnelė.

Dirbtinio intelekto balsai ir gilios klastotės: "Wav2Lip" naudojimas kūrybiškiems vaizdo įrašams

2 žingsnis: vaizdo įrašo pasirinkimas

Dabar reikia pasirinkti vaizdo įrašą, kurį norite redaguoti. Užrašų knygelė suteikia galimybę nurodyti vaizdo įrašo kelią, tačiau rekomenduoju vaizdo įrašą atsisiųsti tiesiogiai. Anksčiau tai pasirodė patikimiau.

Dirbtinio intelekto balsai ir gilios klastotės: "Wav2Lip" naudojimas kūrybiškiems vaizdo įrašams

Čia taip pat galite nurodyti laiką, nuo kurio iki kurio momento vaizdo įrašas turi būti atkuriamas. Įsitikinkite, kad veidas vaizdo įraše aiškiai matomas iš visų kadrų. Rekomenduoju pirmiausia praleisti šį veiksmą su savo vaizdo įrašu, nes tai paprastai veikia geriau.

Spustelėkite "Play" ir pasirinkite parinktį "Upload" (įkelti), kad įkeltumėte vaizdo įrašą. Jei pageidaujate, taip pat galite nurodyti kelią į "Google Drive".

Dirbtinio intelekto balsai ir gilios klastotės: "Wav2Lip" naudojimas kūrybiškiems vaizdo įrašams

Spustelėjus "Play", pasirodys mygtukas, kuriame galėsite pasirinkti savo failą. Spustelėkite jį ir pasirinkite vaizdo įrašą, kurį norite įkelti.

Dirbtinio intelekto balsai ir gilios klastotės: "Wav2Lip" naudojimas kūrybiškiems vaizdo įrašams

3 veiksmas: garso įrašo pasirinkimas

Įkėlus vaizdo įrašą, kitas žingsnis - pasirinkti garso failą, kuris bus sinchronizuotas su jūsų vaizdo įrašu. Turėtumėte įsitikinti, kad garso failas yra tinkamo formato. Jei jūsų garso įrašas yra MP3 formato, konvertuokite jį į WAV failą.

Dirbtinio intelekto balsai ir gilios klastotės: "Wav2Lip" naudojimas kūrybiškiems vaizdo įrašams

Yra daug internetinių įrankių, kurie gali padėti konvertuoti MP3 į WAV failą. Galite tiesiog pasinaudoti viena iš šių priemonių ir įkelti garso failą, tada atlikti konvertavimą ir atsisiųsti WAV failą.

Dirbtinio intelekto balsai ir gilios klastotės: "Wav2Lip" naudojimas kūrybiškiems vaizdo įrašams

Gavę WAV failą, grįžkite į "Colab Notebook" ir įkelkite WAV failą, kaip tai darėte su vaizdo įrašu.

Dirbtinio intelekto balsai ir gilios klastotės: "Wav2Lip" naudojimas kūrybiškiems vaizdo įrašams

4 žingsnis: failų sinchronizavimas

Dabar, kai įkėlėte vaizdo ir garso failą, kitas žingsnis - juos sinchronizuoti. Atitinkamam žingsniui dar kartą spustelėkite "Play". Tada programa atliks lūpų judesių ir garso sinchronizavimo darbą.

Dirbtinio intelekto balsai ir gilios klastotės: "Wav2Lip" naudojimas kūrybiškiems vaizdo įrašams

Šis procesas paprastai neužtrunka ilgai (apie 4-5 minutes). Jei viskas vyksta gerai, po šio laiko turėtumėte gauti sinchronizuotą vaizdo įrašą.

Dirbtinio intelekto balsai ir gilios klastotės: "Wav2Lip" naudojimas kūrybiškiems vaizdo įrašams

5 veiksmas: atsisiųskite baigtą vaizdo įrašą

Kai procesas bus baigtas, pamatysite parinktį parsisiųsti baigtą vaizdo įrašą. Spustelėkite atitinkamą mygtuką, kad vaizdo įrašą išsaugotumėte kompiuteryje.

Dabar sukūrėte deepfake vaizdo įrašą, kuriame lūpų judesiai puikiai atitinka garsą. Įsitikinkite, kad šia galinga technologija naudojatės atsakingai ir naudokite ją tik juokingiems ar kūrybiniams projektams.

Santrauka

Šiame vadove sužinojote, kaip lengva naudoti "Wav2Lip" ir kurti vaizdo įrašus, kuriuose žmonės sako tai, ką norite, kad jie sakytų. Procesas apima vaizdo ir garso failų parinkimą ir įkėlimą, o tada abiejų elementų sinchronizavimą. Nepamirškite, kad naudodamiesi šia technologija elkitės atsakingai.

Dažniausiai užduodami klausimai

Kaip įkelti vaizdo įrašą?Spustelėkite mygtuką "Play" (Groti), tada pasirinkite "Upload" (Įkelti) ir pasirinkite vaizdo įrašo failą.

Ką daryti, jei mano garso įrašas yra MP3 formato?Prieš naudodami jį "Wav2Lip", turėtumėte jį konvertuoti į WAV failą.

Kiek laiko užtrunka sinchronizavimas?Sinchronizavimas paprastai trunka nuo 4 iki 5 minučių.

Iš kur galiu gauti WAV failą?MP3 failą į WAV failą galite konvertuoti naudodami internetinį konverterį - tiesiog įkelkite MP3 failą ir atlikite konvertavimą.

Ar galiu naudoti šį metodą bet kokiam vaizdo įrašui?Taip, galite naudoti "Wav2Lip" įvairiems vaizdo įrašams, jei veidas yra aiškiai matomas.