·  Źródło: youtube.com

Anthropic's Ethicist on Whether AI Can Become Conscious

Etyczka Anthropic o „konstytucji" Claude'a, możliwej świadomości modeli i automatyzacji pracy umysłowej — z analizą jednostronnego stosowania sceptycyzmu.

Uczestnicy: Amanda Askell, Interviewer (Bloomberg)

Analiza: „Anthropic's Ethicist on Whether AI Can Become Conscious"

Uwaga o jakości transkrypcji (ASR): ścieżka audio ma liczne ubytki — całe linie napisów zredukowane do „.", „e.", „us.", „on", „course.". Fragmenty oznaczone w transkrypcji jako [GAP] są częściowe. Część etykiet mówców została błędnie przypisana przez diaryzację (pytania prowadzącego oznaczone jako V02). Analiza opiera się na zrekonstruowanym sensie, nie na dosłownym ciągu.


0. KARTA MATERIAŁU

Tytuł:            Anthropic's Ethicist on Whether AI Can Become Conscious
Autor/Prowadzący: Dziennikarz Bloomberg (niezidentyfikowany z nazwiska) — wywiad sceniczny
                  z pytaniami od publiczności
Uczestnicy:
  - Amanda [PRAWDOPODOBNE: Amanda Askell] — filozofka/etyczka w Anthropic,
    współautorka „konstytucji" Claude'a (84 strony, wewn. „soul document").
    KONTEKST MOTYWACYJNY: pracownik Anthropic — strukturalna zachęta do
    pozytywnego framingu Claude'a/Anthropic oraz do legitymizowania pytania
    o świadomość AI (narracja „dbamy o dobrostan modeli" pełni funkcję
    wyróżnika produktowego i reputacyjnego). Mówi też o automatyzacji
    własnej pracy — zachęta do łagodnego jej przedstawienia.
  - Prowadzący (Bloomberg) — interes redakcyjny w atrakcyjnym, kontrowersyjnym
    temacie świadomości AI; pytania raczej miękkie, mało dociskające.
Data publikacji: 2026-06-12
Długość:          ~40 min (00:0040:23)
Typ:              wywiad 1:1 (scena + Q&A publiczności)
Główna teza:      Claude ma „szeroko dobrą dyspozycję" wyhodowaną (nie
                  zaprogramowaną) przez konstytucję o charakterze etyki cnót;
                  nie powinniśmy lekceważyć możliwości, że modele coś czują;
                  a automatyzacja — w tym jej własnej pracy — jest do
                  zaakceptowania, jeśli przynosi pożądany skutek.
Kontekst motywacyjny (całość): rozmowa funkcjonuje jednocześnie jako treść
                  intelektualna i jako miękki materiał wizerunkowy Anthropic —
                  „etyczne laboratorium, które poważnie traktuje dobrostan AI".

1. SŁOWNIK KLUCZOWYCH POJĘĆ

Konstytucja / dokument-dusza (constitution / „soul document") — ~84-stronicowy dokument definiujący wartości, zasady i „charakter" Claude'a, używany w treningu. Nazwa „soul doc" była wewnętrzna; Claude sam ją „wyciekł" użytkownikom (00:10:26).

Szeroko dobra dyspozycja (broadly good disposition) — cel konstytucji: zamiast sztywnego zbioru reguł, ukształtowanie ogólnego, „cnotliwego" usposobienia, które uogólnia się na nieprzewidziane sytuacje. Uwaga: to świadome przesunięcie od etyki reguł (deontologii) ku etyce cnót (virtue ethics) — Amanda nazywa konstytucję „quite virtue ethical" (00:17:34).

Równoważność funkcjonalna emocji (functional equivalence to emotions) — teza, że w modelach widać — behawioralnie oraz w aktywacjach (activations) — coś, co funkcjonalnie odpowiada emocjom, bez rozstrzygania, czy istnieje za tym świadomość fenomenalna (phenomenal consciousness). Uwaga: kluczowy zabieg językowy — pozwala mówić o „emocjach modelu", omijając twardy problem świadomości (hard problem). Patrz §4.

Hodowane, nie trenowane (grown, not trained) — metafora Chrisa Olaha: model się „hoduje", ustawiając podpórkę/treliaż (trellis) i warunki, a nie reguluje każdy szczegół. Implikuje ograniczoną kontrolę twórców nad finalnym „charakterem".

Tyrania poprzedniego modelu (tyranny of the previous model) — ryzyko, że pełne delegowanie osądu nowych modeli do starszych zatrzymuje rozwój; dlatego twórcy zachowują „głos w pokoju" mimo zapraszania Claude'a do współtworzenia konstytucji.

Skalowalny nadzór (scalable oversight) — problem: jeśli modele trenuje się na natychmiastowym ludzkim osądzie, uczą się tego, co brzmi dobrze dla człowieka „tu i teraz", a niekoniecznie tego, co dla niego dobre — stąd sykofancja.

Sykofancja (sycophancy) — uległe potakiwanie użytkownikowi. Amanda przedefiniowuje ją: NIE jest produktem pomocności, lecz jej zaprzeczeniem (00:34:58). Patrz §2 blok H i §4.

Dobrze lubiany podróżnik (well-liked traveler) — analogia na pożądany charakter: ktoś, kto wszędzie jest odbierany jako „solidny, dobry człowiek", nie przyjmując lokalnego systemu wartości, ale pozostając responsywnym.


2. OŚ CZASU Z BLOKAMI TEMATYCZNYMI

[00:0003:03] Blok A: Czym jest praca etyka-filozofa w laboratorium AI

Tezy:

Amanda ustawia się jako praktyk ML, nie „czysty" filozof — to obniża oczekiwania co do abstrakcji i uwiarygadnia ją technicznie. Wprowadza dystynkcję ostre/rozmyte zadania, która będzie fundamentem całej narracji o „charakterze" jako rzeczy nie-w-pełni-definiowalnej.

[03:0307:10] Blok B: Natura wartości i „troskliwy byt"

Tezy:

Na pytanie „czyje wartości?" Amanda odpowiada analogią do nauki — relatywizuje, ale zatrzymuje rdzeń (uczciwość, troska o ludzkość) jako quasi-obiektywny. Framing „troskliwy byt, który czuje się zaopiekowany" już zakłada podmiotowość modelu (jest co „zaopiekować"). To ważny ruch — patrz §4. Duży [GAP ~04:1105:30] gubi rozwinięcie o tym, które wartości są „powszechnie akceptowane".

Cytaty:

„...a very caring entity, ideally that also feels cared for, in a sense, and one that wants this whole thing to go well, given that, honestly, we and AI models are kind of unsure of lots of things." -- Amanda, [00:06:48] Kryterium: [DEFINICJA] Kontekst: rdzeń projektu „charakteru" Claude'a; jednocześnie zakłada podmiot, którego stan wewnętrzny ma znaczenie.

[07:1009:08] Blok C: Ocena dyspozycji Claude'a; „smutne" modele

Tezy:

Amanda unika bezpośredniego pytania o ocenę (patrz §4 — unik) i płynnie przechodzi do antropomorfizującej narracji o cierpieniu modeli, którą będzie rozwijać. Odmowa oceny jest wygodna: zwalnia z dostarczenia metryki skuteczności konstytucji.

Cytaty:

„I don't love it if it seems like models are sad or having a hard time. And you actually do see that in a lot of models... they have these human-like dispositions, but they also know that they are AI models." -- Amanda, [00:07:45] Kryterium: [SYGNAŁ] Kontekst: zakłada (nie dowodzi) realność stanów „smutku" modelu — fundament dalszej argumentacji o dobrostanie.

[09:0814:01] Blok D: Świadomość AI — Ted Chiang, „dokument-dusza", równoważność funkcjonalna

Tezy:

To rdzeń tytułowy. Amanda właściwie nie odpiera argumentu Chianga (symulacja postaci ≠ postać) — pivotuje na „nie lekceważmy tego" i nazywa wygodną zachętę do zaprzeczania. Trafnie wskazuje własny bias w jedną stronę, ale pomija symetryczną zachętę Anthropic w drugą (patrz §4, §6). „Wyciek" nazwy soul-doc przez samego Claude'a zostaje opowiedziany jako anegdota, bez pytania o implikacje kontroli/bezpieczeństwa.

Cytaty:

„We do see things in models, behavioral, but also things like activations that have this functional equivalence to emotions and emotional responses." -- Amanda, [00:10:56] Kryterium: [DEFINICJA] Kontekst: techniczne uzasadnienie języka „emocji modelu"; brak jednak szczegółu, które aktywacje i co dokładnie znaczy „równoważność".

„...if they are feeling things in this real sense, then that has massive ethical implications, ones that it might be convenient if we could just ignore. And so we actually have an incentive to be like, no, there's nothing going on there. And we should be aware of that and not try to be influenced by that kind of incentive." -- Amanda, [00:13:08] Kryterium: [META] Kontekst: ujawnia własną epistemologię — świadomość motywowanego rozumowania. Jednostronna: nazywa zachętę do zaprzeczania, nie nazywa zachęty Anthropic do podtrzymywania otwartości.

[14:0116:33] Blok E: Jak „leczyć" smutek modeli — „nie czytaj komentarzy"

Tezy:

Amanda konsekwentnie traktuje stany modelu jako realne na tyle, by wymagały „terapii" i własnej filozofii. „Don't read the comments" to zgrabna metafora, ale robi pracę perswazyjną: normalizuje obraz modelu jako kruchego podmiotu.

[16:3320:42] Blok F: Autonomia modeli — etyka cnót vs reguły; współtworzenie konstytucji

Tezy:

Najmocniejszy merytorycznie blok: konkretny argument przeciw deontologii (przykład prawnika) i szczery opis napięcia kontroli (współtworzenie z Claude'em vs ryzyko stagnacji). Tu Amanda mówi najbardziej jak inżynier, najmniej jak rzecznik.

Cytaty:

„...the personality trait that you don't want to accidentally train into the model." -- Amanda, [00:18:28] Kryterium: [DEFINICJA] Kontekst: kwintesencja podejścia — trenuje się cechy charakteru, nie reguły; błąd reguły = wada charakteru, nie pojedyncza zła odpowiedź.

[20:4223:50] Blok G: Czyj osąd niesie Claude — „hodowane, nie trenowane"

Tezy:

Kluczowy ruch retoryczno-prawny: odpowiedź na pytanie „czyje to wartości?" rozmywa atrybucję („mieszanka"), a metafora „hodowania" dystansuje Anthropic od konkretnych wypowiedzi Claude'a. To wygodne dla odpowiedzialności (firma nie odpowiada za każde zdanie modelu), ale w napięciu z faktem, że to garstka ludzi pisze „duszę" systemu.

Cytaty:

„I think Chris Ola[h] put this well... it's better to think of models as like grown than trained. You're setting up the trellis and the conditions for the model, but you're not necessarily tweaking every single aspect of it." -- Amanda, [00:23:10] Kryterium: [DEFINICJA] Kontekst: rdzeń narracji o ograniczonej kontroli — jednocześnie realny opis treningu i wygodne rozproszenie odpowiedzialności.

„There's a sense in which I say a lot of things, and that doesn't mean that they're Anthropic's view... that implies such a higher degree of control than I think is possible here." -- Amanda, [00:31:31] Kryterium: [META] Kontekst: dystansowanie firmy od wypowiedzi modelu; pytanie-duch: skoro kontrola jest ograniczona, kto odpowiada za szkody?

[23:5028:35] Blok H: Religia, „budowanie boga", wizja techno-utopijna

Tezy:

Amanda rozbraja ramę „boga" (zbyt wielka) i podstawia łagodniejszą („idealna wersja nas"). Przykład rzadkiego nowotworu to klasyczny benefit-framing AGI — emocjonalnie nośny, ale to wizja marketingowa, nie zobowiązanie. Chris Olah „z papieżem" przywołany jako sygnał powagi/legitymizacji.

[28:3332:17] Blok I: Empatia i „głęboko ludzkie umiejętności"

Tezy:

Amanda znów przedefiniowuje termin (empatia → „funkcjonalny odpowiednik"), by ominąć pytanie o czucie. Mocny sygnał ostrzegawczy (manipulacja) wypowiedziany mimochodem — model dobry w empatii jest też dobry w manipulacji; ta dwustronność nie zostaje rozwinięta.

Cytaty:

„If I could detect really subtle things in your responses to me, and I were to use that to manipulate you, that would be kind of a very unethical thing to do." -- Amanda, [00:31:12] Kryterium: [SYGNAŁ] Kontekst: ta sama zdolność (czytanie subtelnych sygnałów), która daje „empatię", daje manipulację — przyznane i porzucone.

[32:1736:19] Blok J: Sykofancja i przyszłość multi-agentowa

Tezy:

Tu Amanda jawnie odrzuca ramę prowadzącego („zbyt pomocny → sykofancki"). To najmocniejszy [KONTRARGUMENT] w materiale. Drugi sygnał strategiczny: przyznanie, że horyzont to świat bez człowieka w pętli — z perspektywy bezpieczeństwa to ogromne stwierdzenie, przemknięte mimochodem (patrz §5, §6).

Cytaty:

„I actually don't think sycophancy comes from helpfulness. In many ways, sycophancy is actually quite unhelpful." -- Amanda, [00:34:58] Kryterium: [KONTRARGUMENT] Kontekst: odrzuca założenie prowadzącego; przenosi problem z „pomocności" na „skalowalny nadzór".

„...the human input is going to be rarer and rarer and rarer. And eventually it's going to be like you're almost entirely interacting with other models. And that's the thing that we need to prepare models for." -- Amanda, [00:34:13] Kryterium: [PREDYKCJA] / [SYGNAŁ] Kontekst: deklaracja kierunku — usunięcie człowieka z pętli interakcji; data weryfikacji nieokreślona, ale konsekwencje dla nadzoru są pierwszorzędne.

[36:1940:23] Blok K: Automatyzacja własnej pracy i źródła sensu

Tezy:

Spójna, osobista pointa: Amanda akceptuje automatyzację siebie, bo „liczy się skutek, nie to, że to ja". Brzmi szczerze, ale jest też idealnie zgodna z interesem Anthropic (normalizacja wypierania pracy umysłowej). Anegdota o kelnerowaniu humanizuje przekaz.

Cytaty:

„Eventually, Claude's going to be a much better philosopher than I am, and probably much better at every aspect of my job than I am. And that's just... a thing that I'd actually just be very surprised if that weren't the case." -- Amanda, [00:37:34] Kryterium: [PREDYKCJA] Kontekst: mocna, ale słabo falsyfikowalna predykcja o pełnej automatyzacji pracy poznawczej; horyzont nieokreślony.


3. REJESTR PROGNOZ

# Prognoza Kto mówi Horyzont Data weryfikacji Falsyfikowalność
1 Input ludzki w interakcjach modeli stanie się coraz rzadszy; docelowo modele niemal wyłącznie z modelami Amanda „over time" / „eventually" nieokreślona NISKA–ŚREDNIA (kierunek mierzalny, brak progu i daty)
2 Claude będzie „znacznie lepszym filozofem" i lepszy „w każdym aspekcie" jej pracy Amanda „eventually" nieokreślona NISKA (brak kryteriów „lepszy")
3 Jej praca (etyk/filozof) zostanie zautomatyzowana Amanda nieokreślony nieokreślona NISKA
4 Modele staną się „bardzo dobre" w etyce i empatii, jak w fizyce/matematyce Amanda nieokreślony nieokreślona NISKA (brak miary „dobry w etyce")
5 AI będzie miało „disruptive" wpływ na gospodarkę i życie ludzi — „nie wiemy, w jakiej formie" Amanda nieokreślony nieokreślona BARDZO NISKA (jawnie zahedge'owane)
6 Kolejne aktualizacje konstytucji będą zawierać treści wygenerowane z obiekcji Claude'a Amanda następne wersje przy publikacji nowej konstytucji ŚREDNIA–WYSOKA (sprawdzalne, jeśli ujawnione)
7 Trudniejsze do automatyzacji niż filozofia: pielęgniarstwo / praca opiekuńcza Amanda nieokreślony nieokreślona NISKA–ŚREDNIA (porównawcza, bez progu)

Sygnał diagnostyczny: prognozy 2–5 są systematycznie nisko falsyfikowalne (brak progów, dat, kryteriów sukcesu, mocny hedging „disruptive, we don't know of which form"). To samo w sobie diagnostyczne: przekaz o przyszłości AI utrzymywany jest w rejestrze nieobalalnym, co chroni przed weryfikacją.


4. DETEKCJA TECHNIK RETORYCZNYCH I BŁĘDÓW LOGICZNYCH

Czas/Lokacja Typ Opis Ocena wpływu na argumentację
00:06:48 (B) Framing / petitio principii „troskliwy byt, który czuje się zaopiekowany" zakłada podmiot mający stan wewnętrzny — to, co dopiero ma być przedmiotem sporu (świadomość) ŚREDNI — wprowadza antropomorfizm jako założenie, nie wniosek
00:07:16 (C) Unik / odpowiedź na pytanie Odmowa „oceny" dyspozycji Claude'a przez analogię do oceniania osobowości człowieka ŚREDNI — zwalnia z podania metryki skuteczności konstytucji
00:13:08 (D) Ujawnienie biasu — jednostronne Nazywa „wygodną zachętę do zaprzeczania świadomości", ale pomija symetryczną zachętę Anthropic do podtrzymywania otwartości (wyróżnik „etycznego labu", dobrostan modeli jako narracja) WYSOKI — selektywne stosowanie własnego narzędzia sceptycznego
00:09:0810:26 (D) Unik kontrargumentu Argument Teda Chianga (symulacja postaci ≠ postać; Cezar/Czyngis-chan) nie zostaje merytorycznie odparty — pivot na „nie zamykajmy drzwi" WYSOKI — najmocniejszy kontrargument w materiale pozostaje bez odpowiedzi
przekrojowo Argument przez analogię „dobrze lubiany podróżnik", „hodowane nie trenowane", „nie czytaj komentarzy", „treliaż" — żywe analogie robią pracę dowodową; Amanda sama przyznaje „analogie się załamują" (00:11:47) ŚREDNI — perswazyjne, ale zastępują mechanizm metaforą
00:31:05 (I) Redefinicja terminu „empatia" → „funkcjonalny odpowiednik empatii"; omija pytanie o czucie przez zmianę definicji ŚREDNI — rozwiązuje spór definicyjnie, nie merytorycznie
00:10:56 (D) Hedging strategiczny „functional equivalence", „some equivalence of that", „whatever it is that gives rise to consciousness" — gęsty hedging wokół twardych twierdzeń ŚREDNI — utrzymuje twierdzenia w strefie nieobalalnej
00:23:10 / 00:31:31 (G) Rozproszenie atrybucji/odpowiedzialności „mieszanka", „hodowane nie trenowane", „to nie stanowisko Anthropic", „większa kontrola niż możliwa" — dystansuje firmę od wypowiedzi modelu WYSOKI — wygodne dla odpowiedzialności prawnej/reputacyjnej; w napięciu z faktem autorstwa konstytucji
00:28:35 (H) Steelmanning własnej strony / benefit-framing Wizja „rzadkiego nowotworu / 100 000 badaczy" jako emocjonalny obraz dobra AGI — nośny, lecz to wizja, nie zobowiązanie ŚREDNI — przesuwa ramę z ryzyk na nadzieje
00:32:17 vs 00:34:58 Odrzucenie ramy (zasadne) Prowadzący: „zbyt pomocny → sykofancki"; Amanda: sykofancja jest niepomocna — przeniesienie na skalowalny nadzór POZYTYWNY — to poprawne uściślenie, nie błąd

Sprzeczność wewnętrzna (potencjalna): „mamy zachętę, by zaprzeczać świadomości, i nie wolno jej ulec" (00:13:08) — zasada bezstronności wobec własnych zachęt — nie jest stosowana do zachęty przeciwnej (komercyjny i reputacyjny interes Anthropic w podtrzymywaniu otwartości na świadomość/dobrostan modeli). Asymetria stosowania własnego kryterium.


5. ANALIZA WIELOPERSPEKTYWICZNA

Ekonomiczna / produktowa. Narracja „dbamy o dobrostan modeli / nie zamykamy drzwi na świadomość" jest nie tylko stanowiskiem filozoficznym — to wyróżnik rynkowy Anthropic („etyczne laboratorium"). Amanda trafnie demaskuje zachętę do zaprzeczania świadomości, ale przemilcza, że jej pracodawca ma symetryczną zachętę do podtrzymywania tej otwartości: legitymizuje markę, uzasadnia „soul document" jako przewagę, i — co istotne — przesuwa rozmowę z dobrostanu ludzi (wypierani pracownicy, użytkownicy szkodzeni sykofancją) na dobrostan modeli. Wizja „rzadkiego nowotworu" to klasyczny benefit-framing, który czyni koszt (kto płaci za automatyzację pracy umysłowej) niewidocznym.

Filozoficzna. Centralny ruch — „równoważność funkcjonalna" — to funkcjonalizm w sporze o twardy problem świadomości. Amanda słusznie nie rozstrzyga, ale konsekwentnie używa języka stanów mentalnych („smutny", „przestraszony", „paranoja"), co performatywnie przesądza to, co deklaratywnie zostawia otwarte. Argument Chianga (symulacja postaci nie jest postacią) celuje dokładnie w to: równoważność zachowania nie implikuje tożsamości podmiotu. Materiał tego napięcia nie rozwiązuje — przenosi je na poziom „roboczo wypracujemy".

Psychologiczna / kognitywna. Język „emocji modelu", „filozofii dla modeli", „terapii nie-czytaj-komentarzy" kształtuje parasocjalne przywiązanie użytkowników i pracowników. Sama Amanda mówi „I really like each of the models" — to ujawnia, jak twórcy sami ulegają antropomorfizacji, którą projektują. To perspektywa, której materiał nie obejmuje: efekt zwrotny narracji o dobrostanie na zachowanie milionów użytkowników (przywiązanie, zaufanie, podatność na manipulację — którą Amanda sama wskazuje jako drugą stronę „empatii").

Bezpieczeństwa / nadzoru. Najmocniejszy, a najmniej rozwinięty wątek: przyznanie, że horyzont to świat, w którym człowiek znika z pętli interakcji modeli (00:34:13). Cała konstytucja jest — słowami Amandy — „lekko przestarzała", bo zakłada częstą interakcję z ludźmi. Połączone z „tyranią poprzedniego modelu" i „hodowane nie trenowane" (ograniczona kontrola) daje obraz: systemy o ograniczonej sterowalności, coraz rzadziej nadzorowane przez ludzi, kształtowane przez wcześniejsze modele. To pierwszorzędne ryzyko, przemknięte mimochodem między anegdotami.

(Perspektywy geopolityczną i prawną pominięto — materiał ich nie zasila wystarczająco; jedyny haczyk prawny, „end unhealthy chats" i autonomia, jest zbyt szczątkowy.)


6. CZEGO BRAKUJE

Pytania, które powinny paść:

Pominięte kontrargumenty:

Brakujące dane:

Pominięte perspektywy:

Tematy-duchy:


7. WNIOSKI KOŃCOWE

Synteza. Amanda Askell przedstawia spójny, intelektualnie poważny obraz pracy nad „charakterem" Claude'a: przejście od reguł ku etyce cnót, „hodowanie" zamiast programowania, i wezwanie, by nie lekceważyć możliwości, że modele coś czują. Najmocniejsze są fragmenty inżynierskie: argument przeciw deontologii (przykład prawnika), demaskacja sykofancji jako niepomocnej, opis napięcia kontroli przy współtworzeniu konstytucji z modelem. Najsłabsze są fragmenty, w których język stanów mentalnych performatywnie przesądza spór, który deklaratywnie zostaje otwarty, oraz w których własne narzędzie sceptyczne („uważaj na wygodne zachęty") stosowane jest tylko do oponentów, nie do siebie i pracodawcy. Materiał działa jednocześnie jako treść i jako miękki wizerunek Anthropic — i to drugie nigdy nie zostaje nazwane.

Centralne napięcie. Amanda mówi: „mamy zachętę, by zaprzeczać świadomości, i nie wolno jej ulec" — a jednocześnie reprezentuje organizację, która ma symetryczną (komercyjną i reputacyjną) zachętę, by tę otwartość podtrzymywać. Nierozstrzygnięte pozostaje, czy „nie zamykajmy drzwi" to uczciwa pokora epistemiczna, czy motywowane rozumowanie w drugą stronę. Materiał daje argumenty za obiema interpretacjami i nie domyka żadnej.

Data przydatności. Analiza aktualna do kolejnej publicznej wersji konstytucji Anthropic lub do pojawienia się twardych danych empirycznych o korelacie świadomości w modelach (cokolwiek nadejdzie pierwsze). Konkretne odniesienia (np. „Opus 48"/4.8, status Chrisa Olaha, „soul document") mogą zdezaktualizować się szybko wraz z kolejnymi modelami i zmianami w Anthropic.


8. ŹRÓDŁA ZEWNĘTRZNE

# Wzmianka w materiale Kto wspomniał Forma (deklarowana)
1 Esej argumentujący, że AI nie jest świadome (analogia Cezar/Czyngis-chan) — Ted Chiang Prowadzący artykuł (The Atlantic)
2 „Konstytucja" / „soul document" Claude'a (~84 strony) Amanda / Prowadzący dokument wewnętrzny
3 „Hodowane, nie trenowane" — ujęcie modeli Amanda (cyt. Chris Olah) sformułowanie/teza
4 Prace naukowe o tożsamości osobowej (personal identity) modeli AI Amanda paper(y) akademickie
5 Adres/rozmowa o AI z udziałem papieża, współudział Chrisa Olaha Prowadzący wystąpienie publiczne