Skip to main content
28. desember 2021

Sjálfvirk listsköpun með gervigreind

Sjálfvirk listsköpun með gervigreind - á vefsíðu Háskóla Íslands

Geta tölvur fundið upp nýja hluti sem breyta heiminum, jafnvel lyf og lausnir sem eru utan þess sem manninum farnast að uppgötva? Já, segir Hafsteinn Einarsson, lektor í tölvunarfræði við Háskóla Íslands.

„Það er klárt mál að tölvur fari í æ meira mæli að uppgötva hluti. Það er nú þegar farið að gerast. Það er mikið unnið að þróun gervigreindaraðferða fyrir lyfjaþróun og það eru mörg tækifæri til að beita gervigreind í slíkum iðnaði. Vissulega hefur maðurinn hingað til yfirleitt haft einhverja aðkomu þegar gervigreindaraðferðir eru hagnýttar en ég held að sú aðkoma muni einungis minnka með tímanum,“ segir Hafsteinn.

Hafsteinn vakti athygli í aðdraganda jólanna fyrir jólamyndir sem hann hefur fengið tölvur til að teikna með aðstoð gervigreindar. Hafsteinn skrifar hreinlega lýsingu í formi texta sem hann gaukar að tölvunni og hún bókstaflega teiknar myndir út frá lýsingunni einni saman. Það sem gerist er eiginlega sjálfvirk listsköpun með aðferðum á sviði gervigreindar.

„Myndirnar eru unnar með svokölluðu útbreiðslulíkani,“ segir Hafsteinn. „Það er líkan sem notað er til að fjarlægja suð eða noise eins og það er kallað á ensku af myndum. Ef slíkt líkan er notað á mynd sem samanstendur eingöngu af suði þá er hægt, skref fyrir skref, að þróa mynd úr engu. Í ferlinu er hægt að bæta við líkönum sem stýra því hvernig mynd kemur út. Ég er til dæmis að nota annað líkan sem þjálfað er á samspili texta og mynda. Því get ég sett inn textalýsingu og stýrt sköpunarferlinu þannig að í sérhverju skrefi passi myndin betur og betur við textalýsinguna.“

Gervigreind á grunni líkana við smíði mynda út frá texta

Þegar Hafsteinn er beðinn að útskýra þetta nánar er ljóst að ferlið er flókið og tungumálið ef til vill vanmáttugt að útlista nákvæmlega það sem gerist. 

„Það eru nokkur líkön notuð í ferlinu. Útbreiðslulíkanið ber ábyrgð á því að svipta hulunni af myndinni, þ.e. fjarlægja suð skref fyrir skref,“ segir Hafsteinn.

„Líkanið sem ég nota, sem er þjálfað á texta og myndum, byggir á andstæðuþjálfun. Þ.e.a.s. reynt er að nota tauganet til að greypa texta og mynd í sama rúmi þ.a. greyping texta sem lýsir mynd sé áþekk greypingu myndarinnar. En greyping texta sem passar ekki við myndina, og er þá andstæða hennar, á ekki að vera áþekk greypingu myndarinnar í rúminu.“

Hér er eiginlega orðið svolítið erfitt fyrir blaðamann að skilja tungutak tækninnar en Hafsteinn segir að með þjálfun á sviði gervigreindar myndist framsetning á mynd og texta sem geymi merkingarlegar upplýsingar um innihald textans og hvað finna megi á myndinni. Með öðrum orðum, tölvan lærir að gera myndir sem passa við textann.

„Svo nota ég líka önnur líkön sem skipta minna máli en gera myndina t.d. stærri eða hreinsa hana aðeins til.“

„Líkanið sem ég nota, sem er þjálfað á texta og myndum, byggir á andstæðuþjálfun. Þ.e.a.s. reynt er að nota tauganet til að greypa texta og mynd í sama rúmi þ.a. greyping texta sem lýsir mynd sé áþekk greypingu myndarinnar. En greyping texta sem passar ekki við myndina, og er þá andstæða hennar, á ekki að vera áþekk greypingu myndarinnar í rúminu,“ segir Hafsteinn. Hér er ein af jólamyndum Hafsteins sem unnin er með aðferðum gervigreindar.

Hægt að skapa myndir af nánast hverju sem er

Hafsteinn er þessa dagana að rannsaka bæði texta og myndir með tauganetsaðferðum. Í því ferli hefur hann notað þessar aðferðir sem hann nefndi áður, sem byggja á andstæðuþjálfun, og þannig rakst hann á útbreiðslulíkönin. 

„Mikill áhugi hefur myndast á samspili líkana af þeim toga sem ég hef verið að nota á síðustu mánuðum og segja má að ákveðin sprenging sé að myndast í listsköpun með gervigreindaraðferðum. Þetta er í fyrsta skipti sem hægt er að skapa sannfærandi myndir af nánast hverju sem er með lítilli fyrirhöfn. Ég hef verið í sambandi við listafólk erlendis sem notar aðferðir svipaðar þeim sem ég nota og það er mjög misjafnt hvernig aðferðirnar koma inn í listsköpunarferlið. Þetta er virkilega spennandi þróun og ég tel að við munum sjá miklar og hraðar framfarir á þessu sviði á næstunni.“

Þegar talinu er vikið að nýsköpun segir Hafsteinn að varðandi myndsköpunina byggi niðurstöðurnar sem við sjáum frekar á aðgengi að gögnum og reikniafli heldur en nýjum aðferðum. 

„Vissulega þarf þó að þekkja aðferðfræðina til að geta hagnýtt gögnin rétt. Því er gífurlega mikilvægt að hafa reikniinnviði og gögn til staðar svo sinna megi vinnu af þessum toga. Að þjálfa líkön á bæði myndum og texta gerir okkur kleift að skilja og greina gögn sem ekki var hægt að hagnýta með auðveldu móti áður.“

Hafsteinn verður með fyrirlestur á UTmessunni í byrjun febrúar á næsta ári þar sem hann mun fjalla um þetta ferli og aðferðir á sviði sjálfvirkrar listsköpunar.

Hafsteinn Einarsson