Wielu z nas sztuczna inteligencja kojarzy się z rozwiązywaniem skomplikowanych równań czy prowadzeniem batalii z mistrzami szachowymi. AI jednak znajduje swoje zastosowanie wszędzie tam, gdzie po prostu można wyeliminować proces myślenia charakterystyczny dla człowieka. Do niedawna uważano nawet, że sztuczna inteligencja nie będzie w stanie zastąpić ludzi w pracach kreatywnych. nVidia udowadnia jednak, że wcale tak nie musi być.
Z możliwości sztucznej inteligencji w pracy kreatywnej korzysta wielu z nas. Być może nie do końca zdajemy sobie z tego sprawę. Dobrym przykładem jest pędzel “magic brush” znany z programu Photoshop. Dla tych, którzy nie znają tego rozwiązania spieszę z tłumaczeniem. Jest to specjalny pędzel, który na podstawie kontekstu potrafi dokonywać korekt na obrazach: usunąć zmarszczki z twarzy, wyeliminować niepożądany obiekt z pierwszego kadru. Jak się okazuje z podobnymi, choć znacznie bardziej zaawansowanymi rozwiązaniami, eksperymentuje nVidia potentat w produkcji sprzętu komputerowego.
Ludzie, którzy nigdy nie istnieli
Wszystko zaczęło w roku 2014, kiedy firma zaprezentowała swój algorytm, generujący w sztuczny sposób zdjęcia nieistniejących ludzkich twarzy. Narzędzie bazowało na analizie setek tysięcy zdjęć twarzy, po to by “zrozumieć” czym jest ludzka twarzy. Pięć lat temu wyniki prac algorytmu nie były imponujące, jednak inteligencja podpowiadała, że to dopiero początek.
Minęło zaledwie pięć lat od zaprezentowania technologii i dzisiaj możliwości sieci neuronowej skonstruowanej przez nVidię wyglądają oszałamiająco. Zdjęcie poniżej przedstawia twarze ludzi, którzy nigdy nie istnieli. Surowe, czarno-białe twarze na górze pochodzą z 2014 r. Opublikowano je jako część przełomowego dokumentu, który wprowadził narzędzie AI znane jako generatywna sieć kontradyktoryjna. Te poniżej, to dzieło bardziej współczesne, pochodzą z roku 2018 i prezentują możliwości systemu znanego pod nazwą GAN.
Te realistyczne twarze są dziełem naukowców z Nvidii. W swoim artykule, udostępnionym publicznie, opisują modyfikację podstawowej architektury GAN w celu utworzenia tych obrazów. Szczególnie interesujące jest to, że w tych fałszywych twarzach można również w łatwy sposób zmieniać cechy charakterystyczne. Inżynierowie Nvidii włączyli do swojej pracy metodę znaną jako przenoszenie stylu, w której cechy jednego obrazu mieszają się z innym. Termin “przenoszenia stylu” łatwo połączyć z rozwiązaniami popularnych aplikacji takich jak Prisma, które pozwalają zmieniać zdjęcia w obrazy w stylu charakterystycznym dla danego malarza.
Sztuczna inteligencja, która wie czego chcesz
Generowanie sztucznych twarzy, to nie jedyne nad czym pracują inżynierowie z nVidii. W zeszłym roku firma pochwaliła się technologią Content-Aware Fill również opierające się na sztucznej inteligencji. Na podstawie zaznaczenia obszaru przez użytkownika Content-Aware Fill potrafi domyślić się o jakie rodzaju “korektę” zdjęcia nam chodzi, tylko na podstawie reszty kontekstu zdjęcia. W tym wypadku również zastosowano technologię przenoszenia obrazu. W tym rozwiązaniu AI stale uczy się i rozwija, a zaawansowane algorytmy biorą pod uwagę masę składowych takich, jak: rozpoznane obiekty na zdjęciu, rodzaj powierzchni, gęstość występowania poszczególnych elementów, topografię terenu itd. Po zebraniu dostatecznej puli informacji oraz przeanalizowaniu otoczenia, Content-Aware Fill wypełnia obraz. Oczywiście Nvidia nie jest pierwszą firmą, która opracowała i rozwija tego typu technologię. Producent podzespołów chwali się jednak, że ich AI jest najbardziej zaawansowanym rozwiązaniem na rynku.
Obraz na podstawie kilku kresek
Najnowszym rozwiązaniem, którym chwali się amerykańskie przedsiębiorstwo jest system GauGAN, potrafiący proste szkice zamieniać w realistyczne obrazy, które spokojnie można pomylić z fotografiami. Jak to wszystko działa? Do stworzenia kompozycji niezbędne są tzw. GAN-y – sieci algorytmów sztucznej inteligencji, wykorzystywane przy nienadzorowanym uczeniu się i doskonaleniu AI. Zastosowania aplikacji, w której rola człowieka sprowadza się do wskazania obszarów wypełnionych obiektami różnego typu, mogą być różnorodne – od błyskawicznego projektowania pejzaży stanowiących tło prezentacji, przez udawane zdjęcia z wakacji, po zgrabne projekty zagospodarowania terenów zielonych. Jednym słowem raj dla osób wizualizujących projekty architektoniczne. Ważne jest to, że sztuczna inteligencja dba o poprawne łączenia obiektów – trudno na pierwszy rzut oka dostrzec różnice pomiędzy obrazem wygenerowanym przez GauGAN a zdjęciem będącym zapisem prawdziwego ujęcia. System GAN uczył się na milionach prawdziwych fotografii, aby poprawnie generować elementy krajobrazu takie jak: las, chmury, niebo, góry, trawy, jeziora itd., a także potrafi z kontekstu domyślić się jaka panuje pora roku i jakie są warunki oświetleniowe. Dyskryminatory z kolei (również szkolone na fotografiach) odpowiadają za poprawne połączenie poszczególnych elementów. To one odpowiedzialne są za dbałość o szczegóły, takie jak zaburzenia wody spływającej z wodospadu do jeziora, czy odbicia skał wystających z wody.
Choć wprawne oko może dopatrzyć się w wygenerowanych obrazach pewnej sztuczności, warto wziąć pod uwagę, że z czasem projekt będzie ewoluował i być może, to jest jego największe zagrożenie.
Deep fake
Możliwości zaprezentowanych narzędzi nVidii mogą wprawiać w osłupienie. Każde z przytoczonych powyżej potrafi wygenerować obrazy, twarze czy nawet światy zbliżone do tego co określilibyśmy rzeczywistością.
Te zaawansowane algorytmy sztucznej inteligencji są tak dobre, że aż zaczynają trochę przerażać. Szczególnie w erze rozpowszechniania fałszywych informacji, w których obraz niejednokrotnie odgrywa kluczową rolę. Czy wraz z doskonaleniem AI sztucznie generującej obrazy, zdjęcia przestaną być materiałami dowodowymi? Niedługo wykreowanie obrazu, a nawet filmu, wedle własne widzimisię dostępne będzie za pośrednictwem kilku kliknięć myszy. Czy przestaniemy wierzyć w jakiekolwiek materiały pojawiające się w internecie? Być może rozwiązaniem okaże się podpisywanie materiałów graficznych i filmowych prawdziwymi personaliami twórców. Tylko co wtedy stanie się z anonimowością w sieci i gdzie prawo do tworzenia pod pseudonimem?
Współczesność daje nam niesamowite możliwości i narzędzia do kreowania rzeczywistości, jednak stawia również mnóstwo pytań o zagrożenia, które płyną z postępu technologii. Musimy uważać, w jaki sposób z nich korzystamy, żeby nie zaprzepaścić wypracowanego do tej pory dorobku technologicznego.