
Sora – tekstistä videota silmänräpäyksessä
OpenAI:n kauan odotettu text-to-video -työkalu Sora julkaistiin viime viikolla. Yksinkertaistettuna, kyseessä on siis tekoälymalli, joka luo videota pelkän tekstikuvauksen perusteella. Käyttäjä kirjoittaa, mitä haluaa nähdä, ja Sora tuottaa sen pohjalta videon, joka voi olla mitä tahansa sarjakuvan ja hyperrealistisen henkilökuvan väliltä.
Tätä kirjoittaessa 10.3.2025, mallin kyvykkyydet ovat vielä hyvin rajatut, ja sillä voi luoda esimerkiksi ainoastaan maksimissaan 5 sekunnin mittaisia 720p videoita. Ensimmäiset testaukset onnistuivat kuitenkin vakuuttamaan Nikkolan, jolla ei ole hirveästi aiempaa kokemusta videoiden kuvaamisesta tai editoinnista.
Katso alta lyhyt videoesittely Soran toiminnallisuuksista
Miten onnistuin ensimmäisessä lyhytelokuvassani Soran avulla?
Tässä oppini ensimmäisistä kokeiluista Soran kanssa:
1. Tunne Soran vahvuudet ja heikkoudet
Sora pystyy kyllä jo nyt tuottamaan erittäin realistisia ja elokuvamaisia kohtauksia, mutta sen vahvuudet ja heikkoudet on hyvä tiedostaa etukäteen. Omien kokemuksien mukaan ne voidaan jakaa tällä hetkellä seuraavasti:
Vahvuudet:
Lähikuvat ihmisistä, joissa on hienovaraisia ilmeitä ja eleitä
Hidas kameraliike ja rajatut sommitelmat
Elokuvamaiset valaistukset ja tunnelmalliset ympäristöt
Haasteet:
Monimutkaiset liikkeet, kuten juokseminen tai tanssiminen
Pitkät kameraliikkeet tai dynaamiset action-kohtaukset
Tarkasti määritellyt tarinalliset jatkumot ilman editointia
Tämän vuoksi päädyin itse tekemään lyhytelokuvina puhtaasti Soran vahvuuksien mukaan – ja siksi myös lopputulos on niin realistinen. Somessa kiertää myös paljon videoita, jotka ovat epäonnistuneet pahasti, niihin liittyy usein liikaa elementtejä ja esimerkiksi liikettä.
2. Aloita vahvalla visuaalisella idealla
Kuvittele ensin, millaisen tunnelman tai tarinan haluat kertoa, ja rakenna promptisi sen ympärille. Esimerkiksi The Edge of Us -lyhytelokuvan kohdalla halusin kuvata hiljaista yhteyttä tuntemattomien välillä, joten valitsin visuaalisesti voimakkaan ympäristön – Skotlannin karun rannikon.
Vinkki: Aloita hakemalla inspiraatiota elokuvista, valokuvista tai muista taiteen muodoista. Mitkä elementit tekevät niistä vaikuttavia?
3. Iterointi on avain onnistumiseen
Sora ei aina tuota täydellistä lopputulosta ensimmäisellä yrittämällä. Esimerkiksi The Edge of Us -projektissa käytin kymmeniä kokeiluja saadakseni haluamani tyylin ja tunnelman. Loin myös aluksi videoista automaattisesti kaksi eri versiota – sen asetuksen pystyy valitsemaan Soran ohjauspaneelista. Luovuin tästä kuitenkin nopeasti, sillä pelkäsin, että se kuluttaa krediittini liian nopeasti loppuun.
Oma tärkein vinkkini on, että Soralle syötettäviä prompteja kannattaa iteroida valitun tekoälytyökalun, esimerkiksi Clauden tai ChatGPT:n kanssa. Keskity seuraaviin seikkoihin:
Käytä tekoälyä luomaan paras mahdollinen prompti. Esimerkiksi ihmisten kohdalla voit pyytää sitä luomaan useita prompteja erilaisista ihmisistä samassa ympäristössä – niin myös minä tein.
Testaa erilaisia kuvakulmia, valaistuksia ja sommitelmia.
Kokeile hienosäätää promptiasi pienin muutoksin (esim. “soft cinematic lighting” vs. “dramatic moody lighting”).
Jos jokin ei toimi, muuta lähestymistapaasi. Älä jää kiinni yhteen ideaan, jos se ei onnistu Soran rajoitusten takia.

4. Luo iso nippu videoita Soran avulla ja katso, missä se on parhaimmillaan
Kun olet luonut nipun prompteja tekoälyn avulla, seuraavaksi on aika testata niitä. Syötä ne Soralle erilaisilla asetuksilla, kuten eri kuvasuhteilla, ja katso, mihin Sora pystyy parhaiten. Kun alat tunnistamaan sen vahvuudet, keskity niihin ja luo samalla promptirakenteella ja asetuksilla lisää videoita – jos siis tavoitteesi on luoda tunnelmaltaan yhtenäinen video
5. Hyödynnä muita työkaluja viimeistelyyn
Sora ei ainakaan vielä kykene muokkaamaan videoistasi eheää kokonaisuutta, vaan siihen tarvitaan muita työkaluja tueksi. Itseni kohdalla Soran luomat kohtaukset olivat jo lähtökohtaisesti todella elokuvamaisia, joten esimerkiksi värimäärittelyä ei edes tarvinnut tehdä. Halusin kuitenkin rikastaa yhteenommeltuja pätkiä äänen avulla. Käytin muokkaamiseen ja viimeistelyyn seuraavia työkaluja:
Äänimaailma: Käytin ElevenLabsia tuottamaan skotlantilaisen voice-overin ja taustaääniä, kuten meren kohinaa. ElevenLabs on kiistatta markkinoiden paras tekoälytyökalu äänen luomiseen, ja suosittelen kaikkia kiinnostuneita kokeilemaan sitä. Ilmaista materiaalia pystyy luomaan 5 minuutin edestä kuukausittain.
Editointi: Kokosin lopullisen elokuvan CapCutilla, jossa lisäsin myös automaattiset tekstitykset. CapCutissa on myös loistavia tekoäölyominaisuuksia, mutta en käyttänyt niitä tämän videon luomisessa.
Älä pelkää yhdistää eri työkaluja – Sora on loistava sellaisenaan, mutta sekä text-to-video prompteissa ja videon viimeistelyssä muut työkalut auttavat nostamaan projektin seuraavalle tasolle.
Lopuksi: Onko Sora pettymys?
Myönnetään suoraan – Sora ei ole vielä täydellinen. Se on itse asiassa todella kaukana siitä. Suurin osa Soran tuottamista videoista on joko sekavia tai muuten käyttökelvottomia. Näiden rajoitusten takana piilee kuitenkin jotain aidosti jännittävää ja jokainen kokeilu Soralla vie teknologiaa eteenpäin. Ajatus siitä, että tekstistä voidaan tehdä videota jo näin tehokkaasti, on itselleni jotenkin täysin käsittämätöntä. Sitä ei mielestäni saa pitää itsestäänselvyytenä.
Joten ei, mielestäni Sora ei ole pettymys. Se on aivan jäätävä edistysaskeln teknologian historiassa.
コメント