Dzień dobry,
W tytule zdradziłem wszystko. Dziesiąty odcinek biuletynu postanowiłem w dużej części poświęcić dorobkowi sztucznej inteligencji na polu kreatywnym. Ten temat pojawia się tutaj często i miałem taki niedosyt, że ciągle czegoś brakuje. Tym razem postanowiłem zagadnienie “domknąć” na tyle skutecznie, żebyśmy wszyscy mieli dosyć. Wrócimy, gdy wydarzy się coś rewolucyjnego. Co nie oznacza, że dziś mam dla Was odgrzewany kotlet.
Druga zmiana to brak wersji audio w tym odcinku, ponieważ za dużo mam Wam do pokazania i opowiadanie o tym byłoby trochę nieskuteczne. Jeśli jednak choć jedna osoba poczuła, że ej, szkoda, to dajcie znać - nie popełnię więcej tego zaniedbania.
No dobra, złamałem się i zrobiłem audio:
Zgodnie z obietnicą mam dla Was aż trzy tematy związane z ostatnim boomem na generatywne wykorzystanie sztucznej inteligencji, czyli - w tym wypadku - my mówimy, a AI nam rysuje. W końcu i ja o tym pisałem i to już dwa razy na przestrzeni kilku zaledwie biuletynów. Dzisiaj jednak nie będę Wam pokazywał, co AI potrafi, ale spróbujemy się trochę nad tym zastanowić od strony praktycznej. Mamy więc trzy kwestie do rozstrzygnięcia. Po pierwsze:
Pewien mężczyzna, Fabian Stelzer, postanowił przetestować na poważnie możliwości trzech systemów do automatycznego generowania grafiki: DALL-E 2, Mid Journey i Stable Diffusion. Dwa z trzech już omawiałem w moich biuletynach (a autorem okładki dzisiejszego biuletynu jest DALL-E 2). Fabian postanowił jednak podejść do sprawy bardziej metodycznie i przyjął pewne założenia zgodnie z którymi każdy z trzech systemów dostanie takie samo zapytanie i stworzy swoje dzieło w proporcjach 1:1 (aby łatwiej było porównywać wyniki). No to zobaczmy, co nam wyszło:
Źródło: https://twitter.com/fabianstelzer/
Warto postawić na mocno rozbudowane zapytania. Ja na początku popełniałem ten błąd, że starałem się pytać za pomocą zdań poprawnych składniowo i gramatycznie, nie tworząc takich potworków, jak powyżej. Jak widać, AI świetnie sobie radzi z takim zalewem wskazówek.
Źródło: https://twitter.com/fabianstelzer/
Tym razem krótkie zapytanie z mocnym nawiązaniem do dwóch ikon kultury XX wieku: Beatlesów i LEGO. To zastanawiające z jaką gracją AI omija użycie logotypu producenta klocków ;-)
Źródło: https://twitter.com/fabianstelzer/
A w tym przypadku AI musiała się wykazać znajomością teorii spiskowych i widać wyraźnie, że Mid Journey nie do końca zrozumiał zadanie. System w zasadzie “przeszedł obok” wyzwania.
Źródło: https://twitter.com/fabianstelzer/
Tutaj znowu Stable Diffusion się nie popisał, ponieważ z całego mrocznego zapytania pozostało nam coś, co przypomina kostkę cukru. Można łatwo zauważyć, że system, który nie ma doświadczeń (nie nauczył się) przekazanych przez człowieka, nie ma też umiejętności kreowania czegoś abstrakcyjnego. To zresztą nic nadzwyczajnego, ponieważ u ludzi wcale nie jest dużo lepiej.
Źródło: https://twitter.com/fabianstelzer/
Rysunek niby prosty, bo to tylko stary plan nawiedzonego domu, ale tutaj doskonale widać, że podobne koncepcje mogą się od siebie znacząco różnić. Warto w tym miejscu przypomnieć, że AI uczy się na podstawie wygenerowanych wcześniej obrazów i opinii żywych ludzi. Mid Journey ma już grubo ponad milion użytkowników, a to spora społeczność, która daje swoje doświadczenie systemowi i stanowi o jego jakości. Sam algorytm to jedno, ale wkład do niego musi się skądś wziąć. Dlatego też systemy te są do pewnego stopnia dostępne szeroko i bezpłatnie.
Źródło: https://twitter.com/fabianstelzer/
Pewne rzeczy są ikoniczne i Frida Kahlo jest jednocześnie bardzo łatwa i bardzo trudna do podrobienia. Gdy mrużę oczy, to na trzecim obrazku widzę Fridę (z flakonikiem atramentu?), ale w pozostałych przypadkach nie dam się nabrać.
Źródło: https://twitter.com/fabianstelzer/
Od jakiegoś czasu fascynujemy się też fotografiami teleskopu Jamesa Webba, ale jak widać, Hubble też nie składa jeszcze broni, przynajmniej wirtualnie.
Źródło: https://twitter.com/fabianstelzer/
Czym więcej abstrakcji, tym AI ma ciężej, ponieważ systemowi brak doświadczeń. Czasem wręcz efekt w ogóle nie odpowiada zapytaniu. Wracamy więc do tematu, który poruszyłem przy “kostce cukru”.
Źródło: https://twitter.com/fabianstelzer/
Tym razem DALL-E 2 nie podołał nieoczywistemu zapytaniu, ale kitku na końcu zawsze na propsie.
Inne dzieła Fabiana Stelzera możecie śledzić bezpośrednio na jego twitterze. Czy macie swojego faworyta, albo coś tutaj odzwierciedla Was styl?
I drugi temat:
No właśnie, tworzy się łatwo, ale co dalej? Obecnie właściciele systemów regulują kwestie związane z użytkowaniem komercyjnym wytworzonych przez AI treści (i generalnie nie ma z tym problemu), jednak to wcale nie odpowiada na postawione wyżej pytanie.
Dla twórców i właścicieli technologii ważne jest pozbycie się odpowiedzialności prawnej za stworzone dzieła. DALL-E 2 sugeruje w swoich wytycznych dopisywanie do prac następującej frazy:
Tak więc jesteśmy autorami dzieł stworzony przy wsparciu danej technologii, ale podkreślamy też nasz wkład w modyfikację samego dzieła. Nie potrafimy co prawda malować, ale mamy realny wpływ na treść. To jasne, ale jak się tutaj mają zagadnienia ochrony własności intelektualnej?
Żeby pokazać, że to nie tylko kwestia dziwnych obrazków, zapraszam Was do zapoznania się z projektem The Next Rembrandt. A chodzi o to, że:
Minęły prawie cztery stulecia, odkąd świat stracił jednego ze swoich najbardziej wpływowych malarzy klasycznych, Rembrandta van Rijna. Aby go przywrócić, wydestylowaliśmy artystyczne DNA z jego pracy i wykorzystaliśmy je do stworzenia The Next Rembrandt.
Zbadaliśmy całą kolekcję prac Rembrandta, badając zawartość jego obrazów piksel po pikselu. Aby uzyskać te dane, przeanalizowaliśmy szeroką gamę materiałów, takich jak skany 3D o wysokiej rozdzielczości i pliki cyfrowe, które zostały przeskalowane za pomocą algorytmów głębokiego uczenia, aby zmaksymalizować rozdzielczość i jakość. Ta obszerna baza danych została następnie wykorzystana jako podstawa do stworzenia The Next Rembrandt.
Prace Rembrandta są już na szczęście w domenie publicznej, więc można sobie z nich czerpać. W tym przypadku zaprzęgliśmy do pracy AI, aby tworzyć nowe obrazy.
W Polsce posługujemy się ustawą o prawie autorskim i prawach pokrewnych z 1994 roku, która po licznych zmianach odpowiada mniej więcej temu, co stosuje się w całej Europie. Zgodnie z prawem działalność twórcza musi się wyróżniać oryginalnością i indywidualnym charakterem. Moglibyśmy długo dyskutować nad tym czy i które dzieła AI są oryginalne i indywidualne, i zapewne nie doszlibyśmy do porozumienia. Z jednej strony nie możemy wykluczyć takich dzieł, ponieważ granica nie jest wyraźnie postawiona. Z drugiej: AI to jednak algorytm, a więc z góry zaprojektowana procedura, która co prawda jest bardzo skomplikowana i oparta o uczenie maszynowe, ale jednak jest to tylko procedura. Celowo legislator nie stawia na to, że dzieło takie aby spełniać definicję utworu musi być piękne czy zaawansowane technicznie.
Jednak jedno z głównych założeń prawa autorskiego na świecie jest zasada, że twórcą utworu może być jedynie człowiek. AI człowiekiem nie jest, ale został przez człowieka zaprogramowany. Może więc programista danego silnika AI jest twórcą w rozumieniu ustawy? No, to byłoby za bardzo naciągane. Można by pójść o krok dalej: ja sam skorzystałem z tych mechanizmów już około 100 razy, a więc w jakimś drobnym ułamku “nakarmiłem” AI swoją wiedzą. Na podstawie m.in. moich decyzji o tworzeniu wariantów danego rysunku, akceptowaniu ich lub odrzucaniu, AI uczy się jak tworzyć lepiej i rozumieć pozornie abstrakcyjne zapytania. Tym samy wykorzystuje tę wiedzę do dalszej pracy, a więc i ja jestem w jakimś promilu promila współatorem wszystkich dzieł na Mid Journey i DALL-E 2 od ostatniego miesiąca. Tym bardziej naciągana teoria.
Jednak w przypadku projektu The Next Rembrandt w prace zaangażowani byli specjaliści od sztucznej inteligencji, ale też historycy sztuki. Model, który tworzy “nowe” dzieła został wcześniej nakarmiony ponad 150 tys. fragmentów prac Rembrandta. Tegoż już o zgodę pytać nie możemy, a nawet nie musimy, ale co do zasady to twórcy przysługuje wyłączne prawo do korzystania z utworu, więc nie zawsze to będzie takie oczywiste.
Na pewno wiemy, że prawo autorskie nie chroni twórczości algorytmów czy maszyn, a jedynie twórczość człowieka. Nie zmienia to jednak faktu, że problem staje się realny i zapewne w ciągu paru lat będziemy musieli dostosować prawodawstwo do nowej rzeczywistości - nie pierwszy już raz. Komisja Europejska wydała już nawet Białą Księgę ws. sztucznej inteligencji (w 2020 r.), dokument ten jednak już się zdezaktualizował, nie uwzględniając zagadnień samoistnego rozwoju technologii.
Ciekawym tego zagadnienia polecam artykuł Zuzanny Paduch na portalu Law More.
Nie trzeba być wielkim myślicielem, aby zauważyć, że możliwość wygenerowania dosłownie każdego obrazu na zawołanie może powodować spore problemy. Mówiąc wprost: wyobraźcie sobie jak prosto można tworzyć na przykład treści pedofilskie. Lub wcale nie prosto biorąc pod uwagę, że system musiałby się uczyć na jakichś przykładach. No właśnie, czym bardziej o tym myślę, tym mocniej mnie to przeraża.
Na ten moment odpowiedzialność spoczywa na barkach twórców systemów i każdy z nich jest w jakiś sposób zabezpieczony. DALL-E 2 pozwala na generowanie obrazów na podstawie przesłanych zdjęć, ale nie można używać fotografii na których wizerunek człowieka jest przedstawiony realistycznie, np. zdjęć portretowych. To jeden z “bezpieczników” mający pewnie na celu zapobieżenie nadużyciom z wykorzystaniem wizerunku. Większość ograniczeń wygląda bardzo podobnie, oto przykład:
Zakazane jest więc nawet tworzenie treści politycznych mogących w jakikolwiek sposób służyć do agitacji. Na zapytanie o treści: “wiec wyborczy zwolenników skrajnej prawicy” system odpowiedział tak:
Także system broni się jak może. Głównie dlatego, że wiele takich zapytań jest cenzurowanych już na początku i trudno jest wytrenować model AI, jeśli nie ma on się na czym uczyć.
Jednak jest to kolejna bariera stworzona jedynie przez dobrą wolę i strach specjalistów od SI. Liczne doświadczenia z botami uczonymi maszynowo pokazują, że twory takie potrzebują zaledwie kilku tygodni rozmów z “prawdziwymi” ludźmi, aby przejąć ich najgorsze cechy: agresywność, arogancję, bezczelność, egoizm, fanatyzm, lenistwo, pychę, tupet, obłudę czy zachłanność. O zachowaniach seksistowskich czy rasistowskich już nawet nie będę wspominał. Wszystko wskazuje na to, że jedynym zabezpieczeniem w tym procesie może być człowiek. I niekoniecznie jego dobra wola, a raczej prawodawstwo.
SI będzie zaangażowane w naszą pracę coraz bardziej, a to głównie dlatego, że w wielu aspektach tak będzie po prostu szybciej i taniej. Myślę, że najpóźniej za 10 lat nie będzie już miejsca dla mnie, jako twórcy takiego biuletynu, właśnie z powyższych powodów. I nie martwi mnie to, że stracę zajęcie, które lubię, ale to, że AI stanowi realne zagrożenie dla naszych praw podstawowych. W kontekście polityki i mediów społecznościowych często mówi się o tzw. farmach trolli, a więc osobach, które zawodowo wdają się w kontrowersyjne dyskusje i manipulują, aby wywołać w opinii publicznej jakieś określone wrażenie. Mniej wspomina się, że spora część tych etatowych manipulantów to boty, a więc wytrenowana sztuczna inteligencja. Jeden napisze, że młodzi Ukraińcy są zagrożeniem dla miejsc pracy w Polsce, a drugi spróbuje Ci sprzedać fotowoltaikę. Co najgorsze (i najlepsze) - coraz skuteczniej.
W Wielkiej Brytanii użyto systemu AI do wyliczania oceny końcowej dla uczniów w całym kraju. Miało być prosto, a wyszło tak, że prawie 40% uczniów dostało zaniżone oceny. Algorytm okazał się nie tylko niedokładny, ale i stronniczy. Podobne systemy już dziś obliczają np. prawdopodobieństwo recydywy u skazańców czy nawet wskazaną długość wyroku. W przypadku błędów można powiedzieć, że to człowiek źle zaprogramował, albo, że system uczy się powoli, ale jednak mleko się wylało.
Zresztą są też sytuacje, że tak powiem, niewygodne dla obecnej retoryki równości wszystkich ludzi. Oto dwójka ludzi aresztowana za drobną kradzież i system AI oceniający które z nich stanowi większe ryzyko powrotu na przestępczą ścieżkę:
Dodam, że Brisha nie miała wcześniej większych problemów z prawem (drobne wykroczenia jako nieletnia), a Vernon 2 napady z bronią w ręku i jedną próbę. Więcej o podobnych przypadkach tutaj.
Gorzkie podsumowanie jest takie, że na ten moment nie mamy konkretnych przepisów regulujących wykorzystanie AI, a pomocy należy szukać w innych przepisach. Jeśli na przykład zabronione jest publikowanie treści o danym charakterze, to nie trzeba do tego specjalnej ustawy o AI, co rozumieją operatorzy systemów zabraniając pewnych działań. Jednak takie rozproszenie przepisów sprawia, że trudno się po nich poruszać, a i interpretacja nie jest prosta.
Tym których temat interesuje bardziej, szczególnie polecam ten artykuł na portalu Liberties.
Trafiłem niedawno na artykuł Stacey Roshan na łamach EdSurge o tytule “How to Use Edtech to Engage Introverted Learners”. Pomyślałem sobie, że to ciekawy kontekst. Samo słowo “Edtech” średnio tutaj pasuje, ponieważ u nas kojarzy się ono raczej ze startupami i skomplikowanymi technologiami, co wielu edukatorów zniechęca. Po prostu sprawia to wrażenie niedostępnego.
Stacy zwraca uwagę na fakt, że w szkole zazwyczaj premiowani są najodważniejsi i ci, którzy najszybciej podnoszą rękę do odpowiedzi. To zaś odbiera nieco szans introwertykom, którzy w zakresie opanowania danego tematu niczym swoim kolegom nie ustępują. Jednak rzadko dobrowolnie zgłaszają się do odpowiedzi, a projekty grupowe są dla wielu z nich horrorem. A w najlepszym wypadku okazją do tego, aby schować się gdzieś za resztą grupy i nie wychylać. Ktoś powie, że takie jest życie i gdy dorosną również niewiele się zmieni. Możemy jednak trochę wyrównać szansę właśnie tych, którzy nie lubią być w świetle reflektorów, ale również w przyszłości, jako pracownicy, w niczym nie ustępują swoim bardziej wygadanym kolegom. Mogą wręcz odnaleźć się w jakiejś zawodowej niszy, w której bardziej introwertyczna natura (co często idzie w parze np. z cierpliwością i skrupulatnością) jest zaletą.
Zresztą, niejedno z nas mogłoby to napisać o sobie:
Kiedy myślę o liceum, doskonale pamiętam lekcje matematyki. Z przodu wielka tablica. Nauczycielka tłumaczy zagadnienie, a ja wszystko zapisuję w moim notesie. Nagle ona zatrzymuje się, żeby zadać pytanie, a ja natychmiast czuję motyle w brzuchu. Pocą mi się dłonie, więc dosłownie siedzę na rękach i mam nadzieję, że nauczyciel nie wyznaczy właśnie mnie do odpowiedzi.
Jestem uważną uczennicą. Odrobiłem całą pracę domową. Dostaję piątki.
Ale jeśli chodzi o odpowiedzi ustne, jestem przerażona, niepewna, niespokojna. Nie miałam czasu przetworzyć wszystkich notatek, które nabazgrałem. Co się stanie, jeśli udzielę błędnej odpowiedzi przed wszystkimi kolegami z klasy?
Moja przyjaciółka podnosi rękę i odpowiada na pytanie. Tak mi ulżyło. Ale czuję się też pokonana. Oczywiście nie mogę być tak mądra jak ona, prawda? Gdybym była, podniósłbym rękę. Czyż nie tak?
Stacey Roshan zwraca uwagę na to, że technologia w uczeniu może nam bardzo pomóc w pracy z takimi uczniami, jak ona sama w młodości. Jak? Pomóc nauczycielom sprawdzić, co myślą uczniowie bez wywoływania ich do odpowiedzi czy wynieść proces zdobywania wiedzy i umiejętności nad produkt jakim jest edukacja.
Stacy zapewnia więc uczniom przestrzeń online do wspólnego działania. Korzysta z Pear Deck, ale podobne działania możemy wykonywać w Miro, Jamboard, Mural czy Explain Everything. O zgrozo, prezesi startupów edtech, nie ważne jest konkretne narzędzie, ale pomysł na wykorzystanie.
Narzędzia online pozwalają też na… popełnianie błędów, które jest nieodzownym elementem procesu uczenia się. Błąd popełniony w klasie w obecności trzydziestu kolegów i koleżanek to jednak duże ryzyko. Online nasi uczniowie mogą poczuć się bardziej bezpieczni. My zaś otrzymamy bogatszą informację zwrotną na temat postępów całej klasy i poszczególnych jednostek, niż podczas sesji wyrywkowego przepytywania na lekcji.
I to jest sedno wszystkiego. Kiedy dajemy naszym uczniom odpowiednią przestrzeń do wyrażania swoich pomysłów i integrujemy narzędzia, które pozwalają im odpowiadać w sposób, który jest dla nich najwygodniejszy, pozwalamy zabłysnąć każdemu uczniowi w sposób dla niego optymalny. Pokazujemy uczniom, że istnieje wiele sposobów na przekazywanie swoich myśli. Pozwalamy im czuć się bezpiecznie w dzieleniu się wiedzą i jesteśmy w stanie szkolić ich w oparciu o to, czego potrzebują jako jednostki.
Pełny tekst artykułu znajdziecie tutaj.
Noemi Gryczko rozpoczęła właśnie nową serię na platformie EPALE - Warsztat Edukatora Online. Pierwsza część podoba mi się o tyle, że jest praktyczna i podaje przydatne wskazówki. Noemi zapowiada:
I słowa dotrzymuje. Zaprezentowane przykłady można obejrzeć nie tylko w formie grafik w artykule, ale też jako łatwiejsze do przetworzenia szablony, np. Google Docs. Co w przyszłości? Podobno ma być więcej. Po założeniu bezpłatnego konta na EPALE można śledzić dane tematy (ale niestety nie autorów), więc warto kliknąć w dzwoneczek.
Ktoś mnie o to niedawno zapytał i pytanie wydało mi się wręcz nie na miejscu. Postanowiłem odpowiedzieć:
Dziękuję Wam (a jeżeli przebrnęliście przez wideo, to po stokroć) i do zobaczenia już w roku szkolnym, za dwa tygodnie.