8. modul

Művészet és mesterséges intelligencia

"Ha az ember készíti az algoritmust, de az MI hozza létre a képet: akkor ki is a művész?"

A modulról

Ebben a modulban többek között szó esik arról a kérdésről, hogy az MI maga is alkotóvá válik-e a művészetek terén, vagy csupán egy újabb technikai eszköz marad.Azt is megvitatjuk, hogy hol kezdődik a "művészet", valamint hogy az új technológiák fényében miként kell újragondolni a művészet fogalmát.

Céloks

A tanulók képesek lesznek:

maguk meghatározni a "művészet" fogalmát
ismertetni és használni különböző MI-alkalmazásokat
kritikával vizsgálni a művészet fogalmát a mesterséges intelligenciával összefüggésben
ismertetni a mesterséges intelligencia különböző formáinak megjelenését a művészetek területén
ismertetni az Mi-alkalmazásokban rejlő lehetőségeket

Beosztás

Idő	Tartalom	Tananyag
5 perc	Vita - Mi a művészet?	Diák 1
15 - 30 perc	Feladat: A művészet fogalma	Diák 1
20 perc	Elmélet - MI és a művészet	Diák 1
50 perc	Feladat: Alkalmazás-tesztelés	Diák 2, MI-Művészet adatlap

Bevezetés

Az egyik kérdés, amellyel a modul foglalkozik, hogy az MI maga is alkotóvá válik-e a művészetek terén, vagy csak egy újabb technikai eszköz marad. Arról is szó esik, hogy hol kezdődik a "művészet", valamint hogy az új technológiák fényében miként kell újragondolni a művészet fogalmát.

A tematikus blokk elején képeket, zeneműveket stb. mutatunk be a tanulóknak. Miután megvitattuk, hogy milyen hatással voltak rájuk ezek az alkotások, illetve, hogy egyáltalán művészetnek tekinthetők-e bemutatott művek, megállapítjuk, hogy ezeket mind mesterséges intelligenciák alkották.

A foglalkozásvezető ezután elmagyarázza, hogyan tud az MI műalkotásokat létrehozni, valamint hogy milyen hatások érik már most az MI által generált műveket (pl. "Edmond de Belamy" portréja, Beethoven befejezetlen 10. szimfóniájának befejezése, gép által írt Harry Potter fejezet).

Ez alapján a tanulók a következő kérdéseket vitatják meg kis csoportokban: mi a művészet, ki ezeknek a műalkotásoknak a valódi alkotója? Helyettesítheti-e az emberi, illetve művészi kreativitást az MI? Milyen lehetőségek rejlenek ezekben az új alkalmazásokban?

A modul végére a diákok maguk is kutatóvá és alkotóvá válnak, kipróbálnak és értékelnek néhány, az interneten elérhető MI-alkalmazást, és reflektálnak ezek művészetek világában elfoglalt helyére. A létrejött művek és reflexiók a csoport előtt is bemutathatók és megvitathatók.

Ki is az alkotó? - Félelem attól, hogy lecserélhetők vagyunk

Sokak számára még mindig a művészek állnak az alkotómunka középpontjában. A mesterséges intelligenciával dolgozó alkotók azonban nem maguk hozzák létre a műalkotást, hanem azt a szoftvert fejlesztik, amely létrehozza azt.

Néhány művész eszközként tekint az MI-rendszerekre, míg mások emberibbnek látják őket pl. sokkal inkább kollégaként tekintenek rájuk, akikkel együtt alkotnak. Partnerként, múzsaként hivatkoznak a mesterséges intelligenciára, amely segít az alkotói válságok leküzdésében.

Holly Herndon zenész például a gyermekeként tekint a „Proto” című albumához fejlesztett „Spawn” elnevezésű MI-re, amelyet egy szülőhöz hasonlóan felügyel. Ez az MI különböző beszédmintákkal dolgozik, amelyekről eldönti, milyen sorrendben kövessék egymást. Holly "Birth" című dala például saját beszédmintáiból áll össze, míg a "Frontier" egy teljes együttes beszédmintáit tartalmazza. Interjúiban azt is hangsúlyozza, hogy a művészeknek felelősséggel kell használniuk az MI-t, ügyelve a felhasznált adatállományra.

Eddig nem igazán merült fel az az aggodalom a digitális művészet területén, hogy az MI az alkotók helyébe léphetne. Mint ahogy a technológia által létrehozott különösen élethű kép sem számít művészetnek, arra sem volt (eddig) példa, hogy egy gép olyan érzelmekkel teli művet hozzon létre, mint amilyet egy egész élete során formálódó, tapasztalatokkal gyarapodó ember alkotna.

Kreativitás, mint az emberi természet utolsó bástyája?

Az amerikai művész és programozó csodagyerek, Robbie Barrat mindössze 22 éves volt, amikor 2022 márciusában a Sotheby's aukciós cégen keresztül 630 000 fontért (753 700 €) adta el 2018-as, "Akt portré#7Képkocka#64" címmel készült digitális műalkotását.

Az "Edmond de Belamy" című MI által alkotott festmény pedig az előzetesen várt 10 000 dollár helyett 432 500 dollárért (426,800 €) kelt el a Christie's aukciós házban 2018-ban. Az MI-t a francia Obvious művészcsoport képezte ki. Ezeket a furcsán elmosódott, absztrakt képeket tartják az MI-alkotások közül az egyik legsikeresebbnek a világon. "A művészvilágban az MI használatával új mozgalom bontakozott ki, újraértelmezve a kreativitást és a szerzőséget" - írta a Spiegel Online 2020 végén. Ez a mozgalom megingatja azt az elképzelést, miszerint "a kreatív alkotás az emberek kiváltsága" .

Az MI viszont nem csak a képzőművészetben van jelen. Az elmúlt években készítettek olyan szoftvereket, melyek - betáplálva Beethoven és Schubert egyéb műveit - képesek voltak befejezni Beethoven befejezetlen 10., illetve Schubert szintén befejezésre váró 8. szimfóniáját. Más cégek reklámokhoz, hirdetésekhez és videójátékokhoz kínálnak MI által generált zenét. A Botnik cég egy gép által írt Harry Potter fejezetet publikált. Más programok, mint például az Eloquentron3000 németül írnak szerelmes és forradalmi verseket, míg az OpenAI angol nyelven ír novellákat.

A számítógépekkel generált alkotások nem újkeletűek. Német és amerikai művészek már az 1960-as évektől kezdve használtak algoritmusokat műveik létrehozásához. Georg Nees például random számgenerátor segítségével alkotott geometrikus alakzatokat, melyeket kombinálva egész festményeket hozott létre.

A mai programok azonban sokkal összetettebbek, mint 50 évvel ezelőtt, teljesen új távlatokat nyitva előttünk.

Mi jellemző ezeknek az alkalmazásoknak (persze nem az összesnek) a működésére?

Az úgynevezett GAN-ok ("Generative Adversarial Networks", azaz generatív ellenséges hálózatok) az említett, mesterségesen generált képek létrehozására vannak kiképezve, például, hogy betáplált szöveg alapján készítsenek képeket, vagy egy fényképet átalakítsanak festménnyé. Ez a fajta program két egymással versengőrészegységből áll, az úgynevezett "generátor" és a "diszkriminátor" rendszerből. A generátor feladata, hogy új adatokat hozzon létre. A diszkriminátor ezt követően megpróbálja megkülönböztetni a generátor által létrehozott adatokat a tanulóhalmaz adataitól, és felismerni a mesterségesen generált elemeket. Az állandó interakció révén - melyben a generátor megkísérli a diszkriminátor kicselezését - a rendszer önállóan tanul, egyre valósághűbb képeket eredményezve. Ha például nagy mennyiségű ismert impresszionista festményt táplálunk be a rendszerbe, a GAN segítségével akár a nyaralásunkon készült képek is impresszionista festménnyé alakíthatók. Mindazonáltal a GAN-ok képesek deep fake [számítógéppel hamisított mozgóképes tartalom] előállítására is (vö. 9. Modul), ami a médiában való visszaélésekhez, álhírek terjesztéséhez vezethet.

Az úgynevezett transzformátorok a neurális hálózatok olyan fajtái, melyek hatalmas előrelépést tesznek lehetővé többek között a nyelvi MI-k területén. Ilyen a Google BERT vagy az OpenAI GPT-3 a fordítás, beszédfelismerés és szöveggenerálás terén. Ebben az esetben az egyes képpontok vagy szótagok összekapcsolódnak a többivel, amely hozzájárul a teljes adatállomány átfogó megértéséhez. A rendszer például megtanulhatja társítani az "étel" vagy "reggeli" szavakat az "enni" szóhoz, vagy felismerhet egyes ismétlődő motívumokat zeneművek vagy képek esetében, amelyeket aztán maga is alkalmazhat.

Ezek az MI-algoritmusok az elmúlt években rohamtempóban fejlődtek, és mára már elképesztő mennyiségű adatból dolgoznak. 2020-ban például az OpenAI cég kiadta a GPT-3 algoritmust. Ez már képes olyan szöveget is létrehozni, amely úgy néz ki, mint ha ember írta volna. Többek között a szöveget képpé alakító DALL:E alkalmazás - melyre a későbbiekben még visszatérünk - is ezen az algoritmuson alapul.

Mi célból fejlesztik ezeket a programokat?

A GAN-ok használhatók például emberekről vagy tárgyakról készült állóképek animálására, fekete-fehér filmek vagy képek színezésére, ahogy képesek deepfake vagy akár teljesen új filmjelenetek létrehozására is.

Az ilyen alkalmazásokkal még sosem látott képek generálhatók, mindössze néhány kattintással. Ugyanakkor a jövőben, amikor az algoritmusok majd tovább fejlődnek és még pontosabbá válnak, akár az emberek munkáját is kiválthatják. Ezzel együtt a résztvevőknek azt is fel kell ismerniük - miután az órán használták az alkalmazásokat, és látták a képes példákat -, hogy ez nem a közeljövőben fog bekövetkezni.

Akkor ki is az alkotó?

Az "Edmond de Belamy" című alkotásra gyakran hivatkozott úgy a média, mint az egyik első olyan műalkotásra, "amelyet nem egy emberi lény, hanem egy gép önállóan alkotott" . A befolyt pénzt viszont nem az MI, hanem az Obvious művészcsoport kapta, amely az MI betanítását végezte. Még az MI-t elsőként kifejlesztő programozócsoport sem került megemlítésre, ahogy a bevételből sem részesült.

A mesterséges intelligencia fejlesztésében megszámlálhatatlanul sok ember működik közre: így van ez a MI programok segítségével létrehozott műalkotások esetében is. Művészek, kurátorok, programozók és néha még a közönség tagjai is együttműködnek, hogy ezek a rendkívüli művek létrejöhessenek.

Az viszont, hogy a mesterséges intelligenciát tekinthetjük-e a műalkotások szerzőjének, nézőpont kérdése. A Max Planck Intézet tanulmánya alapján azok szerint, akik a mesterséges intelligenciát hajlamosak humanizálni - és nem csupán eszközként kezelni, -, az MI-ket megilleti, hogy alkotóként ismerjék el őket, ugyanakkor nagyobb felelősséggel kellene tartozniuk a szerzői jogok megsértéséért.

Az, hogy egy MI-t mennyire tekintünk emberinek, elsősorban attól függ, hogy milyen nyelvezetet és kontextust használunk. Nem mindegy, hogy azt mondjuk: "az MI művészek támogatásával hoz létre új műalkotásokat", vagy hogy: "a művészek az MI segítségével alkotnak" előzetesen betáplált utasítások szerint.

Egy másik kérdés, amely felmerül a mesterséges intelligencia által generált műalkotások kapcsán, a szerzőség megállapítása. Elképzelhető-e, hogy egy program valaha is kizárólagos szerzői jogot gyakoroljon az általa létrehozott művek felett? Esetleg maradjon a szerzői jog a programozók, művészek, vagy vevők kezében? Az ilyen kérdésekre való tekintettel egyelőre nincs tervben az MI által alkotott művek címkézése , bár a hagyományos módon készült klasszikus művek eladásához eredetigazolás is szükséges. Több szakértő is ellenzi a címkézést, elvégre olyan hatalmas installációk esetében, mint például Jeff Koons művei, nem lehet pontosan megállapítani, mennyi munkát fektetett bele a művész és mennyit a csapata.

A Botto MI művészmasinája

A Botto egy decentralizált, független szervezet és MI-alkalmazás, amely közösségi visszajelzés alapján alkot műveket. A Botto minden héten bemutat 350 műalkotást a közönség számára, akik szavazhatnak kedvenceikre. A Botto ezeket a véleményeket használja az algoritmus tanítására, illetve arra, hogy idővel változtasson a program "művészi tevékenységén". A hetente kiválasztott alkotást elárverezik NFT-ként vagy a SuperRare felületén tokenizált formában. Ezután a Botto új műalkotás-sorozattal áll elő, majd a folyamat kezdődik elölről. A közösségi visszajelzések révén az MI minden kör után egyre jobban meg tud felelni a szavazatot leadók igényeinek.

Hivatkozások

https://www.botto.com/

Tananyag

Arts - AI and Art.pdf (.pptx)

Hivatkozások

Max-Planck-Gesellschaft - Wenn künstliche Intelligenz Kunst schafft

Művészet ez egyáltalán? Mi a művészet lényege?

A művészet fogalmának szubjektív, tudományos és történelmi megközelítéstől függően számos meghatározása lehet.

A művészet fogalmával az alábbi két feladaton keresztül foglalkozhatunk.

A tanulók post-itek segítségével, vagy a miro.com weboldalon keresztül kis csoportokban vagy az osztállyal közösen gondolattérképet készítenek, amelyen a "művészet"kifejezéshez kapcsolódó gondolattársítások szerepelnek. Ezután a diákok megvitatják asszociációikat, hogy közös definíciót alkossanak.
A "művészet" különféle meghatározásait kifüggesztjük az osztályteremben. A tanulók végigolvassák ezeket és odaállnak azon definíció mellé, amelyikkel a legjobban tudnak azonosulni. Ezt követően az egyes definíciók mellett álló diákok megindokolják választásukat, de kifejtik azt is, hogy szerintük mit kellene módosítani - pl. kiegészítés, változtatás - a fogalommeghatározáson.

Használható művészet-definíciók

Ha az alkotás üzen valamit azoknak, aki szemlélik a képet, hallgatják a zeneművet vagy olvassák a könyvet, akkor az művészet, függetlenül attól, hogyan készült.

A művészet "kreatív alkotás a legkülönfélébb anyagok, nyelvi eszközök, hangok felhasználásával, a természettel és a világgal szemben."

A művészet az emberi lény valamennyi alkotómunkája.

Számunkra a művészet egyfajta kreatív kifejezésmód, amely emberi tapasztalatainkat gazdagítja azáltal, hogy érzelmeket vált ki, kérdésfeltevésre sarkall és feszegeti a határokat.

A művészet olyasvalami, amit művészek alkotnak. Egy művésznek valami rendkívüli dolgot kell véghez vinnie. Tökéletesen el kell sajátítania a technikát pl. az ecsetkezelés és festés mikéntjét, vagy hogy hogyan kell izgalmasan elmesélni egy történetet.

A művészet nem mindig "szép", érzelmek széles skáláját képes előhívni, kiváltani és bírálni.

A művészet fogalmának megvitatása után a tanulók (kiscsoportokban vagy egész csoportonként) vitassák meg a következő, MI által generált alkotásokhoz kapcsolódó kérdéseket:

Ki az alkotó - a gép, a programozó, vagy az a személy, akinek az adatait felhasználtad az algoritmus tanításához?

Helyettesítheti-e az MI az emberi kreativitást és leleményességet?

Milyen lehetőségek rejlenek ezekben az új alkalmazásokban?

Alkothat-e az MI művészetet?

Az, hogy az MI valóban képes-e művészetet létrehozni, vitatott. A művészet definíciójától függően bármilyen válasz lehetséges. Egyrészt a művészet felfogható úgy, mint ember alkotta dolog, másrészt viszont a befogadó szemszögéből vizsgálva minden művészetnek tekinthető, ami valamilyen módon megérint minket (függetlenül attól, hogy ki az alkotó).

Így ha a "művészetet" az utóbbi szemszögből szemléljük, nagyon is lehetséges, hogy egy algoritmus kreatív legyen, akárcsak mi, emberi lények.

Alkothat-e az MI művészetet?

Sok középiskolás tanuló valamilyen formában már találkozott GAN-okkal vagy Transzformátorokkal. A legtöbb fiatal használ közösségi média alkalmazásokat, mint például az Instagram, TikTok vagy Snapchat, és gyakran kísérleteznek a filterekkel (szűrőkkel). Így arra is van lehetőség, hogy közelebbről megvizsgáljuk a beépített filtereket és alkalmazásokat, hogy pontosan lássuk hogyan működnek, milyen funkcióik vannak, és milyen problémák merülhetnek fel a működésükkel kapcsolatban (lásd: hátrányos megkülönböztetés azáltal, hogy a torz, egyoldalú adatállomány miatt nem ismerik fel a sötétebb bőrszínt).

A következő feladatban a diákok önállóan próbálják ki ezeket a művészi alkotáshoz használható eszközöket, és kitöltenek egy adatlapot is. Az alábbiakban néhány alkalmazást mutatunk be, melyek eltérő művészeti megközelítésük és változó bonyolultsági fokuk révén lehetővé teszik a tanulók számára, hogy megfelelően válasszanak.

A programok sokszínűsége jól szemlélteti, hogy mára mennyi minden vált lehetségessé, ugyanakkor az egyes alkalmazások korlátai is láthatóvá válnak. A tanulóknak önállóan kell kiválasztaniuk az eszközt, kipróbálni, elmenteni/képernyőfotón megörökíteni a végeredményt, majd bemutatni azt a csoportnak. Ennek során a korábban tárgyalt kérdéseket ismét feltehetjük: helyettesíthetik-e az alkalmazások az emberi alkotókat? Egyáltalán művészet-e ez, vagy inkább csak inspirációként szolgálhatnak más alkotásokhoz?

Tananyag

Tesztelhető programok

Magic Sketchpad

Ez az alkalmazás automatikusan kiegészíti a rajzokat. A végeredmény meglehetősen pontatlan, vázlatos.

Autodraw

Ez az alkalmazás megpróbálja felismerni, hogy mit rajzolunk, és a fejlécben kész, beilleszthető képeket javasol.

AI Duet

Ez az alkalmazás a felhasználóval együtt zongorázik a hangjegyek sorozatára reagálva. A hangokat a billentyűk segítségével választhatjuk ki.

Wombo Dream

Ez az alkalmazás rövid szövegrészleteket alakít át különböző stílusú festményekké.

DALL-E Mini

Ez az alkalmazás rövid szövegeket konvertál 9 különböző képpé. A Dall-E alkalmazást gyakran használják a közösségi médiában, különösen az elmúlt hónapokban.

Arbitrary Style Transfer

Ez az alkalmazás a GAN-ok tipikus példája. Képes egy kép stílusát átvinni egy másikra. Lehet választani előre feltöltött képek közül, vagy használhatjuk a sajátunkat is.

Horror Story Maker (via Open AI)

Az OpenAI ezen alkalmazása rövid rémtörténeteket ír. Csak egy témát/kulcsszót kell megadni, és a mesterséges intelligencia ír belőle egy két mondatból álló rémtörténetet. Ehhez viszont bejelentkezésre van szükség (itt érdemes más példákat is kipróbálni).

Gaugan 2

Ez az alkalmazás a rajzokat élethű képpé alakítja. Fel tudunk tölteni képeket, vagy magunk is létrehozhatjuk őket az ecset segítségével.

Art Breeder

Az Art Breeder az egyik leghíresebb GAN. Ebben az alkalmazásban több kép tartalma és stílusa is kombinálható. Ehhez rengeteg kép közül választhatunk a weboldalról, ennélfogva a tartalmat és a stílust is befolyásolhatjuk. Szintén regisztrációhoz kötött!

A következő weboldalak szintén megfelelőek lehetnek