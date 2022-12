Grafika „Théâtre D’opéra Spatial” Amerykanina Jasona Allena naprawdę robi wrażenie. Przedstawia scenę, która mogłaby być połączeniem „Gwiezdnych wojen” z renesansową salą tronową. Rozmach, detale i emocje zastygłych w oczekiwaniu postaci uruchamiają wyobraźnię. Na co czekają? Kto przybędzie przez ogromny portal? Jaka kraina się za nim otwiera? Nic dziwnego, że w konkursie sztuki wizualnej w Kolorado praca zajęła pierwsze miejsce, zdobywając 300 dol. nagrody. No, prawie nic dziwnego. Dzieło tak naprawdę stworzył wykorzystujący sztuczną inteligencję (AI) program Midjourney. Wygrana wywołała potężne kontrowersje wśród współuczestników konkursu i rozgrzała debatę nad tym, na ile narzędzia do generowania obrazów są etyczne i zgodne z prawem.

Pranie brudnych danych

Midjourney to tylko jeden z kilku generatorów obrazów, które w ostatnim czasie zawładnęły wyobraźnią internautów. Oprócz niego działają m.in. DALL·E 2. Stable Diffusion i Google Imagen. A przecież obrazy to nie wszystko – dowolny tekst można wygenerować przy pomocy Chatbota od OpenAI (fundacja założona przy firmie założonej przez Elona Muska), a wideo – używając Make-A-Video od Meta. Choć różnią się w detalach, pomysł zasadza się na tym samym – ich twórcy zasysają z internetu niewyobrażalne ilości danych i tworzą rozbudowane algorytmy, które następnie analizują ich parametry. Kiedy użytkownik chce wygenerować swoją treść, po prostu opisuje robotowi, czego potrzebuje. Na przykład: „realistyczny dinozaur jedzący ser w Paryżu”. Na tej podstawie maszyna przeszukuje swoje zbiory i po krótkim czasie pokazuje propozycję grafiki, poematu czy klipu, który odpowiada zamówieniu.

Rezultaty mogą być zabawne, zaskakujące, piękne, a na pewno są kontrowersyjne. Maszyny szkolone są bowiem na podstawie utworów zasysanych z sieci bez oglądania się na prawa autorskie. Na przykład Stable Diffusion zostało wytrenowane na zbiorze składającym się z 5 mld obrazów. Wiemy to, bo firma postanowiła podzielić się informacjami o swoim modus operandi. Inne działają mniej otwarcie.

Jak ujawnił programista Andy Baio, firmy, które stoją za tymi maszynami, zdają sobie sprawę z tego, że dotykają śliskiej materii. Do opracowania zbiorów, na których uczą się algorytmy, zatrudniają więc akademików. Ci mają o wiele większe możliwości wykorzystania utworów, bo prawo pozwala na użycie ich do celów naukowych. „Dla firm pracujących nad rozwojem AI stało się standardem, że używają zbiorów danych i modeli wytrenowanych przez badaczy z uniwersytetów do swoich komercyjnych celów. W niektórych przypadkach po prostu płacą za takie badania” – pisze Baio w serwisie Waxy.org i podaje przykład naukowców z Uniwersytetu w Monachium, którzy w publikacji ze swojego badania dziękują firmie Stability AI za „hojne wsparcie”.

Maluj jak Beksiński

Jeśli obrazy, które pokażą się nam po wpisaniu żądania w program, wydają się nam znajome, to… w istocie mogą takie być. Wspomniany już Andy Baio do spółki z innym programistą – Simonem Willisonem – stworzyli narzędzie do przeszukiwania bazy multimediów wykorzystanych do szkolenia algorytmów Stable Diffusion. Bazę przygotowała niewielka niemiecka organizacja non profit LAION. Podobnie jak naukowców z Monachium, także ten NGO sponsoruje firma Stability AI. Przyznał to w dyskusji na Twitterze Emad Mostaque, założyciel firmy. Spośród polskich artystów w bazie LAION można znaleźć prace Zdzisława Beksińskiego, Wojciecha Fangora czy Tytusa Brzozowskiego.

A samo znajdowanie się w zbiorze to nie koniec, bo w wyścigu do osiągnięcia perfekcyjnych rezultatów pojawiają się coraz nowsze możliwości. Na przykład taka, że to użytkownik może nakarmić algorytm danymi, których później użyje on do wygenerowania obrazu. Takie narzędzie – DreamBooth – zaprezentował w sierpniu Google. Na jego kanwie powstało już kilka aplikacji, które pomagają przerabiać swoje selfie na awatary w różnych konwencjach. Błyskawicznie można więc zostać muppetem, Kapitanem Ameryką czy postacią z obrazu Picassa.

Ale to, co dla jednych jest zabawą z obrazem, prawdziwych twórców może przyprawić o ból głowy. Nagle każdy użytkownik narzędzi AI jest w stanie skopiować ich styl. Taka nieprzyjemność spotkała Hollie Mengert, amerykańską ilustratorkę, która pracuje dla Disneya. Jeden z użytkowników serwisu Reddit pochwalił się, że przy użyciu DreamBooth stworzył model, który odtwarza charakterystyczną kreskę autorki. Wystarczyły 32 obrazki, które faktycznie wyszły spod jej ręki, 2 dol. i 2,5 godz. pracy, by użytkownik zaczął otrzymywać łudząco podobne rezultaty.