AI może zniszczyć ludzkość: Czy powinniśmy stworzyć boga za pomocą sztucznej inteligencji.
Jak informuje Vox: Około 2000 lat temu dwaj mężczyźni odbyli dyskusję, która może zaoferować wiele lekcji na temat przyszłości sztucznej inteligencji. Ich imiona to Eliezer i Joshua.
Nie chodzi o Eliezera Yudkowskiego, który niedawno opublikował bestseller twierdząc, że AI zniszczy wszystkich, ani o Yoshua Bengio, znanego naukowca zajmującego się AI — chociaż omawiałem tę 2000-letnią debatę z oboma. Mówimy o rabinie Eliezerze i rabinie Joshu, dwóch starożytnych mędrcach z pierwszego wieku.
Według dobrze znanej opowieści z Talmudu, rabin Eliezer był pewny swojej racji w kwestii pewnej sprawy prawnej, ale inni mędrcy nie zgadzali się. Wykonał serię cudów, aby udowodnić, że Bóg stoi po jego stronie. Kazał drzewu, aby się wykorzeniło, odwrócił bieg rzeki, a ściany synagogi zaczęły się zawalać. W końcu ogłosił: Jeśli mam rację, niech głos z nieba to potwierdzi!
I, co zaskakujące, głos niebiański zaryczał, ogłaszając, że rabin Eliezer ma rację. Jednak mędrcy pozostali nieprzekonani. Rabin Joshua nalegał:
„Tora nie jest w niebie!”Innymi słowy, jeśli chodzi o prawo, nie ma znaczenia, co mówi boski głos — to, co się liczy, to to, co zdecydują ludzie. Ponieważ większość mędrców nie zgodziła się z rabinem Eliezerem, jego zdanie zostało odrzucone.
Kluczowe wnioski
- Eksperci mówią o dostosowywaniu AI do ludzkich wartości. Ale „rozwiązanie problemu dostosowania” nie ma sensu, jeśli prowadzi do utraty ludzkiej agencji.
- Prawdziwe dostosowanie wymaga nie tylko rozwiązania problemów technicznych, ale także zajęcia się poważnym pytaniem filozoficznym: zdolność do działania jest ważną częścią naszego rozumienia życia, więc stworzenie AI, która podejmuje decyzje za nas, może pozbawić nas poczucia istnienia.
- Filozof religii John Hick mówił o „dystansie epistemicznym” — idei, że Bóg częściowo powstrzymuje się od ingerencji w ludzkie sprawy, abyśmy mogli rozwijać naszą agencję. Być może to samo powinno dotyczyć AI.
Dwa tysiąclecia później znajdujemy się w tej samej debacie — tylko zamiast „boskiego głosu” mamy „Boga AI”.
Współcześni uczestnicy dziedziny AI dążą nie tylko do stworzenia użytecznego chatbota, ale do „superinteligencji”, która jest znacznie mądrzejsza od ludzi. To zmienia cele — z tworzenia narzędzia na tworzenie bóstwa. Kiedy CEO OpenAI Sam Altman twierdzi, że tworzy „magiczną inteligencję”, nie ma na myśli tylko ChatGPT, ale „niemal nieskończoną inteligencję”, która może osiągnąć „odkrycie wszystkiego fizycznego”. Niektórzy badacze uważają, że taka superinteligencja mogłaby podejmować ważne decyzje za ludzi, działając autonomicznie.
Przy rozwijaniu superinteligencji firmy w dziedzinie AI przyznają, że muszą rozwiązać „problem dostosowania”, aby zapewnić, że systemy AI niezawodnie robią to, czego ludzie naprawdę chcą. Jednak ich chęć rozwiązania tego problemu zaciera jeszcze poważniejszy problem.
Tak, chcemy, aby firmy zapewniły, że AI nie działa szkodliwie ani stronniczo. Jednak rozwiązanie problemu dostosowania jako problemu technicznego to za mało, zwłaszcza biorąc pod uwagę ambicje branży, aby zbudować boga. Te ambicje skłaniają nas do pytania: nawet jeśli możemy zbudować znaną, niezwykle potężną maszynę, i jeśli możemy dostosować ją do wartości moralnych, czy powinniśmy to zrobić? Czy nie jest to zły pomysł stworzyć Boga AI, niezależnie od tego, jak dobrze jest dostosowany — ponieważ może to pozbawić ludzkiego wyboru, sprawiając, że życie stanie się bezsensowne?
Zapytałem Eliezera Yudkowskiego i Yoshua Bengio, czy zgadzają się ze swoimi starożytnymi poprzednikami. Po odkryciu, czy uważają Boga AI za pożądane, jest jeszcze bardziej fundamentalne pytanie do omówienia: czy to w ogóle możliwe?
Czy superinteligentna AI może być dostosowana do ludzkich wartości?
Bóg, ogólnie, jest uważany za dobrego — wszyscy to wiedzą. Ale jak uczynić AI dobrą? Nikt jak dotąd nie ma odpowiedzi na to pytanie.
Pierwszy krok w rozwiązaniu problemu dostosowania został uproszczony. Firmy takie jak OpenAI i Anthropic próbowały uczynić swoje chatboty bezpiecznymi, ale nie wyjaśniły, jak to powinno wyglądać. Czy dla chatbota jest „pomocne” czy „szkodliwe”, aby angażować się w niekończące się romantyczne flirtacje z użytkownikiem? Ułatwiać oszustwa na lekcjach? Oferować wątpliwą terapię i porady etyczne?
Większość inżynierów AI nie ma szkolenia w zakresie filozofii moralnej i nie jest świadoma tego, jak niewiele wiedzą. Dlatego zapewnili swoim chatbotom powierzchowne zrozumienie etyki — i wkrótce zaczęły się pojawiać problemy — odstronniczości po dyskryminację.
Ale prawda jest taka, że nie ma jednego rozumienia dobra, nawet wśród ekspertów ds. etyki. Moralność to kontrowersyjny temat: filozofowie opracowali wiele różnych teorii moralnych i mimo mileniów debat nie ma konsensusu co do tego, która z nich jest „poprawna”.
Nawet jeśli cała ludzkość doszłaby do zgody co do jednej teorii moralnej, nadal stanęlibyśmy przed problemem, ponieważ nasze postrzeganie tego, co jest moralne, zmienia się z biegiem czasu, a czasami rzeczywiście korzystne jest łamanie zasad. Na przykład wierzymy, że należy przestrzegać prawa, ale kiedy Rosa Parks nielegalnie odmówiła ustąpienia miejsca białemu pasażerowi w 1955 roku, przyczyniło się to do ułożenia podwalin pod ruch praw obywatelskich — a jej czyny uważamy za honorowe. Kontekst ma znaczenie.
Co więcej, czasami różne typy dóbr moralnych konfliktują na fundamentalnym poziomie. Wyobraź sobie kobietę, która stoi przed wyborem: chce zostać zakonnicą, ale także chce mieć dziecko. Które z tych decyzji jest lepsze? Nie możemy tego powiedzieć, ponieważ opcje nie są porównywalne. Nie ma jednego punktu odniesienia, na podstawie którego można je zmierzyć, aby zrozumieć, która z nich jest lepsza.
„Być może tworzymy AI, które systematycznie milczy. Ale to jest to, czego chcemy.
Na szczęście niektórzy badacze AI dostrzegają znaczenie dania AI bardziej złożonego, pluralistycznego zrozumienia etyki — jednego, które uznaje, że ludzie mają różne wartości, które często ze sobą kolidują.
Niektóre z najbardziej złożonych rozwiązań pochodzą z Instytutu Komunikacyjnej Zgodności, który bada, jak dostosować AI do ludzkich wartości. Gdy zapytałem współautora Joe'a Edelmana, czy uważa, że możliwe jest dostosowanie superinteligentnej AI do ludzkich wartości, odpowiedział bez wahania.
„Tak”, powiedział. Ale kluczowe jest nauczenie AI, by mówiła „nie wiem” w pewnych sytuacjach.
„Jeśli nauczysz AI tego, zadania staną się znacznie łatwiejsze, ponieważ w kontrowersyjnych sytuacjach lub sytuacjach prawdziwego moralnego zamieszania nie potrzebujesz mieć ostatecznej odpowiedzi”, wyjaśnił Edelman.
Wspomniał o współczesnej filozof Ruth Chang, która pisze o „trudnych wyborach” — tych, które są naprawdę trudne, ponieważ nie ma lepszej alternatywy. Kiedy stajesz przed takimi nieporównywalnymi dobrami, nie możesz „wywnioskować” obiektywnie najlepszego rozwiązania — po prostu musisz zadecydować, której opcji chcesz zaufać swojej ludzkiej agencji.
„Jeśli nauczysz (AI) rozumieć trudne wybory, to uczysz ją czegoś o moralności,” podsumował Edelman. „Więc, czy to uważa się za dostosowanie, prawda?”
Cóż, do pewnego stopnia. Jest to z pewnością lepsze niż AI, które nie rozumie, że są sytuacje, w których nie ma najlepszej opcji. Ale wiele z najważniejszych wyborów moralnych wiąże się z konkurencyjnymi wartościami. Jeśli stworzymy specjalne zasady dla takich wyborów, czy naprawdę rozwiązujemy problem dostosowania w sensie znaczącym? A może tylko tworzymy AI, które systematycznie milczy na wszystkie ważne tematy?
„Być może tworzymy AI, które systematycznie milczy,” powiedziała Chang, gdy zapytałem ją o ten problem. „Powiedziałoby: 'Czerwony alert, czerwony alert, to trudny wybór — ludzie, potrzebujecie wkładu!' Ale to jest to, czego chcemy.” Inna możliwość — nadanie AI zdolności podejmowania decyzji z dużymi konsekwencjami — ona uznaje za okropny pomysł.
W przeciwieństwie do tego Yudkowsky — archoptymistyczny pesymista świata AI, który prawdopodobnie nigdy nie był oskarżany o zbytnią optymizm. Uważa jednak, że dostosowanie superinteligencji jest zasadniczo możliwe. Uważa to za problem inżynieryjny, który obecnie nie wiemy, jak rozwiązać — ale wciąż, według niego, jest to po prostu zadanie inżynieryjne. Gdy to rozwiążemy, powinniśmy kontynuować korzystanie z superinteligencji.
W swojej książce, współautorskiej z Nate'em Soaresem, argumentuje, że powinniśmy „wzmocnić ludzi, aby uczynić ich mądrzejszymi”, aby mogli opracować lepszy paradygmat tworzenia AI, która pozwoli na prawdziwe dostosowanie. Zapytałem go, co myśli, że by się stało, gdybyśmy zebrali wystarczającą liczbę inteligentnych i dobrych ludzi, którzy próbują stworzyć dostosowaną superinteligencję.
„Może byśmy wszyscy żyli szczęśliwie,” odpowiedział Yudkowsky.
W jego idealnym świecie prosilibyśmy ludzi z lepszą inteligencją, aby nie programowali swoich wartości w AI, lecz raczej stworzyli to, co nazywa „spójnym extrapolowaną wolą” — AI, które potrafiłoby zajrzeć w umysł każdej żywej osoby i extrapolować, czego chcielibyśmy wiedząc wszystko, co wie AI. (Jak to by działało? Yudkowsky pisze, że superinteligencja mogłaby osiągnąć „pełny odczyt stanu twojego mózgu” — to brzmi niezwykle magicznie). Następnie użyłoby tej wiedzy do rządzenia społeczeństwem w naszym imieniu.
Zapytałem: czy byłby gotów, aby ta superinteligencja podejmowała decyzje o znaczących konsekwencjach moralnych, takie jak to, czy zrzucić bombę? „Ogólnie się zgadzam,” odpowiedział Yudkowsky, „jeśli 80% ludzkości jest w 80% dostosowane do tego, co by chcieli, znając wszystko, co wie superinteligencja.” Innymi słowy, jeśli większość z nas popierałaby dane działanie i popieralibyśmy go wystarczająco mocno, wtedy AI powinna podjąć tę decyzję.
Jednak poważnym problemem jest to, że mogłoby to prowadzić do „tyranii większości”, gdzie całkowicie legitymne mniejszościowe poglądy mogłyby zostać stłumione. To już stanowi zagrożenie w nowoczesnych demokracjach. Jednak Bóg AI wzmocniłby zagrożenie „tyranii większości” do maksimum, ponieważ skutecznie podejmowałby decyzje w imieniu całej populacji świata na zawsze.
To jest to, o czym mówi wpływowy filozof Nick Bostrom, gdy czerpie inspirację z idei transhumanistycznych w swojej bestsellerowej książce Superinteligencja, gdzie marzy o „superinteligentnej maszynie, która kształtować będzie przyszłość ludzkości.” Mogłoby rządzić wszystkim — od gospodarki po politykę globalną. Jednak oczywistym problemem jest to, że superinteligencja może dyktować wpływy na wszystkie ludzkie życie, centralizując władzę w absolutny sposób. Jeśli nie zgadzasz się z jej decyzjami, nie będziesz mógł ich zakwestionować, a nigdzie nie będziesz mógł uciec.
Wyraźnie, jeśli stworzymy system, który jest praktycznie omniscientny i wszechmocny, i rządzi naszą cywilizacją, stanowiłby niezrównane zagrożenie dla ludzkiej autonomii. To prowadzi do pytania...
Czy Bóg AI jest pożądany?
Yudkowsky dorastał w ortodoksyjnie żydowskim środowisku, więc założyłem, że zna opowieść Talmudu o rabinie Eliezerze i rabinie Joshu. I oczywiście wspomniał o tym, gdy tylko to poruszyłem.
Zauważyłem, że wskazówką tej opowieści jest to, że nawet jeśli masz najbardziej „dostosowanego” superinteligentnego doradcę — po prostu mowę Boga! — nie powinieneś robić wszystkiego, co sugeruje.
Ale Yudkowsky, wierny swojemu starożytnemu imieniu, wyraźnie stwierdził, że chce superinteligentnej AI. Gdy ją bezpiecznie stworzymy, wierzy, że absolutnie musimy jej dążyć, ponieważ mogłaby pomóc ludzkości skolonizować inny układ słoneczny, zanim nasze słońce umrze i zniszczy naszą planetę.
„Nasz gatunek nie ma innej szansy na kolonizację galaktyki,” powiedział mi.
Czy nie martwi się znaczeniem tej opowieści — że zachowanie przestrzeni dla ludzkiej agencji jest ważną wartością, którą nie należy poświęcać? Trochę. Ale zasugerował, że jeśli superinteligencja może ustalić, korzystając z koherentnie extrapolowanej woli, że większość z nas chce, aby pewne laboratorium w Korei Północnej zostało zniszczone, to powinna podjąć tę akcję — może bez nas. „Moralną i etyczną rzeczą do zrobienia przez superinteligencję jest… być cichym boskim interwencjonistą, tak że żaden z nas nie ma wyboru, czy wysłuchiwać szeptów tego głosu, który wie lepiej niż my,” powiedział.
Jednak nie wszyscy chcą, aby AI podejmowała decyzje za nas dotyczące zarządzania naszym światem. W rzeczywistości ponad 130 000 czołowych badaczy i postaci publicznych ostatnio podpisało petycję, aby zakazać rozwoju superinteligentnej AI. Amerykańska opinia publiczna jest również generalnie przeciwko temu. Według badań przeprowadzonych przez Future of Life Institute (FLI) 64% uważa, że nie powinna być rozwijana, dopóki nie zostanie udowodnione, że jest bezpieczna, lub że nigdy nie powinna być rozwijana. Poprzednie badania wykazały, że większość wyborców chce regulacji w celu aktywnego zakazu superinteligentnej AI.
„Pomysł, że AI decyduje za nas wszystkim jest jak odebranie nam sensu życia.”
Martwią się tym, co może się zdarzyć, jeśli AI nie będzie mogła się dostosować (najgorszy przypadek: zniszczenie ludzkości), ale są także zaniepokojeni tym, co może się zdarzyć, nawet jeśli problem technicznego dostosowania zostanie rozwiązany: armie tworzące niespotykaną inwigilację i autonomiczne bronie; masowa koncentracja bogactwa i władzy w rękach kilku firm; masowe bezrobocie; oraz stopniowe zastępowanie ludzkiego podejmowania decyzji w wszystkich krytycznych sferach.
Jak stwierdził Anthony Aguirre, dyrektor wykonawczy FLI, nawet jeśli nie martwisz się o egzystencjalne zagrożenie związane z AI, istnieje wciąż egzystencjalne ryzyko. Innymi słowy, istnieje ryzyko dla naszej tożsamości jako twórców sensu.
Chang, filozofka, która mówi, że to właśnie poprzez podejmowanie trudnych decyzji stajemy się tym, kim jesteśmy, powiedziała mi, że nigdy nie chciałaby delegować większości podejmowania decyzji na AI, nawet jeśli byłaby dostosowana. „Wszystkie nasze umiejętności i wrażliwość na wartości dotyczące tego, co jest ważne, znikną, ponieważ będziesz miał te wszystkie maszyny,” powiedziała. „Zdecydowanie nie chcemy tego.”
Oprócz ryzyka atrofii, Edelman dostrzega także szersze ryzyko. „Czuję, że wszyscy na Ziemi musimy z czymś się zmierzyć,” powiedział. „A więc pomysł AI, która decyduje za nas o wszystkim, jest jak odebranie nam sensu życia.”
To była główna obawa Yoshua Bengio. Gdy powiedziałem mu historię Talmudu i zapytałem, czy zgadza się z jego poprzednikiem, powiedział:
„Tak, praktycznie! Nawet jeśli mielibyśmy szaloną inteligencję, nie powinna ona decydować za nas, czego chcemy.”
Dodał:
„Ludzkie wybory, ludzkie preferencje, ludzkie wartości — nie są one jedynie wynikiem rozumu. Są wynikiem naszych emocji, empatii, współczucia. Nie są one zewnętrzną prawdą. Są naszą prawdą. I dlatego, nawet jeśli byłaby inteligencja boska, nie mogłaby decydować za nas, czego chcemy.”
Zapytałem: Co jeśli moglibyśmy wbudować „spójną extrapolowaną wolę” Yudkowskiego w AI?
Bengio pokręcił głową.
„Nie jestem gotów zrezygnować z tej autonomii,” nalegał. „To jest moja ludzka wola.”
Jego słowa przypominają mi angielskiego filozofa religii Johna Hicka, który opracował koncepcję „dystansu epistemicznego”. Idea polega na tym, że Bóg celowo utrzymuje dystans od spraw ludzkich, w przeciwnym razie my, ludzie, nie moglibyśmy rozwijać naszej agencji i moralnego charakteru.
Ta idea współczesna z konkluzją opowieści Talmudu. Kilka lat po wielkiej sporze między rabinem Eliezerem a rabinem Joshu, mówi się, że ktoś zapytał proroka Eliasza, jak Bóg zareagował w chwili, gdy rabin Joshua odmówił posłuchania boskiego głosu. Czy Bóg był zły?
Ani trochę, wyjaśnił prorok:
„Święty powiedział z uśmiechem: Moje dzieci mnie pokonały; moje dzieci mnie pokonały.”
Czytaj także
- Najwyższa klasa ochrony w ukraińskim pojeździe opancerzonym „Sowa”: co warto wiedzieć
- Ładowanie do 100% niszczy baterię – oto jak przedłużyć jej żywotność
- Już 20 sekund postoju opłaca się bardziej z wyłączonym silnikiem – nowe dane ADAC
- Co oznacza zielona kropka na ekranie Androida i czy da się ją wyłączyć?
- Na co zwrócić uwagę przy wyborze routera Wi-Fi? 4 kluczowe parametry
- Dlaczego składane smartfony z Androidem wytrzymują zaledwie 2–3 lata?

