A filozófia halála? A kínai szoba titka.
A filozófia nem halt meg, de a huszadik század egyik legjelentősebb gondolkodója, John Searle, szeptember 17-én, kilencvenhárom éves korában valóban elhunyt.
1995-ben Searle megkapta a Simon Newcomb-díjat, amelynek valószínűleg nem örült különösebben. A díjat ugyanis a mesterséges intelligencia elleni „legostobább érvért” ítélték neki. (Az életműdíjat Hubert Dreyfus kapta, akiről azt gondolták, hogy életének nagy részében sületlenségeket írt az AI-ról. Ez azonban a generatív mesterséges intelligencia fényében már nem ennyire egyértelmű.)
Searle 1980-ban publikálta Minds, Brains and Programs című cikkét, amelyben bemutatta a „kínai szoba” gondolatkísérletet – ezt ma minden filozófia szakos hallgatónak ismernie kell. A kísérletben egy kínaiul nem tudó ember ül egy szobában. Az ajtó alatt kínai szövegeket csúsztatnak be neki, ő pedig hasonló szövegekkel válaszol. Valójában a szobában van egy kézikönyv, amely pontosan előírja, hogy mely szimbólumsorozatokra mely más szimbólumsorozatokkal kell reagálnia. Az ember tehát a jeleket manipulálja, de nem érti a kínai nyelvet. Amikor először hallottam erről, elég meredeknek tartottam érvként a mesterséges intelligencia ellen, ma pedig még inkább annak tartom.
1980-ban, a „GOFAI” (Good Old Fashioned Artificial Intelligence) korszakában ez az érv kevésbé tűnt problematikusnak. (Dreyfus is elsősorban a GOFAI-t bírálta. Semmi sem utal arra, hogy a generatív AI ellen is súlyos kifogásai lettek volna, ha ma is élne.)
Searle a kínai szobával azt akarta megmutatni, hogy egy tökéletes szintaktikai tudással rendelkező gép egyáltalán nem érti a dolgok jelentését, vagyis nincs és nem is lehet szemantikai tudása. Én viszont azt gondolom – és ezért talán majd kapok a fejemre a kedves Olvasótól –, hogy az elmúlt kétezer év legnagyobb kihívása érte el a filozófiát a generatív mesterséges intelligencia megjelenésével. A filozófusok óriási többsége azonban elutasítja ezt a kihívást. Ez pedig akár a filozófia halálát is jelentheti: azt, hogy a filozófia lassan irrelevánssá válik, és csupán mérges bácsik és nénik gyülekezetévé lesz, akik szerint a filozófiának Platón lábjegyzeteinek kell lennie. (Tudom, hogy valójában nem így gondolják.) Platón mindenesetre soha nem írt a GPT-ről – ahogy a gravitációról sem, amelynek létezéséről fogalma sem volt, s természettudományos ismeretei egy mai hetedikes gyerek szintjén álltak. Ez persze nem von le semmit jelentőségéből, de tény.
A filozófusok most lehetőséget kaptak, hogy kiszellőztessék a kínai szobát: hogy szembenézzenek azzal, ami történik, új lendületet adjanak a filozófiának, és megmentsék attól, hogy pusztán filozófiatörténetté váljon.
<div class='sharedaddy sd-block sd-like jetpack-likes-widget-wrapper jetpack-likes-widget-unloaded' id='like-post-wrapper-192691293-16532543-69ff4744878fa' data-src='https://widgets.wp.com/likes/?ver=14.1#blog_id=192691293&post_id=16532543&origin=www.orulunkvincent.hu&obj_id=192691293-16532543-69ff4744878fa&n=1' data-name='like-post-frame-192691293-16532543-69ff4744878fa' data-title='Like or Reblog'><h3 class="sd-title">Like this:</h3><div class='likes-widget-placeholder post-likes-widget-placeholder' style='height: 55px;'><span class='button'><span>Like</span></span> <span class="loading">Loading...</span></div><span class='sd-text-color'></span><a class='sd-link-color'></a></div>
@val: Erre mondta Anil Seth nagyon szellemesen, hogy az ő változatában Mary kilép a szobából és vállat von: „Yeah, just what I expected.” 😀
@tahonoli: Szerintem jobb pelda lenne mondjuk a felnott fejjel (nem gyerekkent) az elso nagyon kozelallo szemely (szulo, testver, gyerek, partner) elvesztese, es hogy ez alapjan mennyire maskepp komputal az ember bizonyos imputokat, pl a temaba vago muveszeti termekek. Ott igazabol a fizikai valosagun nem valtozik (olyan mertekben, mint mondjuk a kes belenkvagasa elott vs utan), de nagyon is latvanyosan megvaltozik valami, amit szerintem egy LLM nem lenne kepes „megerteni” (szimulalni nyilvan).
Hiv.: @val:
Nagyszerű gondolat, felvetés.
IGEN:
A Mary-gondolatkísérlet tényleg nagyot durrant annó, ráadásul bloggazda JT szívét is megdobogtathatja emlegetése 🙂 Ha a Riemann-hipotézis megoldása kiesne a szintaktikus AI-ból, akkor meglehet én is hajlamos lennék mondani, hogy hagyjuk most már a f@szkodást, engedve stiláris finomságok pressziójának.
VISZONT:
A Mary-gondolatkísérlet még mindig élő tudtommal. Hiába esik kevesebb szó róla, mégis ma is alapmű a tudatfilozófiában, nincs kurzus nélküle. Nem „vesztette el a relevanciáját”, beépült a filozófiai kánonba. A Mary-kísérlet nem oldotta meg a qualia-vita alapját, csak újraértelmezte.
Miért ne lehetne ez a sorsa a MI-„megértés” problémának is: újra és újra előkerül majd, ahogy a technológia változik.
Ráadásul van, lesz tétje is. A filozófiai absztrakción túllépve, etikai, jogi és biztonsági kérdésbe ágyazódhat bele. Ha egy AI dönt orvosi beavatkozásról vagy önvezető autó irányításáról és gáz lesz, akkor tuti újra fellángolhatnak a viták. Hiába lesznek bármilyen hatékony rendszerek, a régi kérdések mindig visszatérhetnek, mint hogy szimulációról avagy „valódi” értésről van-e szó.
Hiv.: @jack_of_all_trades:
Anil Seth is erős név. Most már taktikusan rákerestem nevére a blogban. Látom, még egy David Chalmers-szel való beszélgetése is linkelődött korábban.
Hiv.: @KennyOMG:
Ja-ja. Még erősebb a hosszútávú, mély, egzisztenciális élmény és feldolgozása
@nyulambator:
Ne 🙂
De, (többek közt) az ember esetében nagyon is kialakulnak valamik. Az ön- és az éntudat.
…És igaz ugyan, hogy ezek egy alsóbb (fiziológiai-biológiai) szinten pusztán egy dinamikusan és folytonosan változó, komplex feedback– & érzékszervi input-rendszerrel bíró szövet-/sejthálózat emergensen fellépő tulajdonságai – de ha úgy használjuk például a „tudatos”, „tervező” vagy „modellező” kifejezéseket, hogy nincs mögöttük ön- és éntudattal bíró valami, akkor félrevezetjük magunkat meg másokat, és mindenféle nyelvi (majd pedig intellektuális) csapdába bele fogunk esni.
Amennyiben a hagyományos értelemben használjuk a „modell” terminust, akkor modell nem létezhet modellező nélkül és modellező nem létezhet tudat nélkül. Ezért ha tudat nélküli (például gépi) „modellezésre” kívánunk utalni (akármi legyen is az) – azaz nem hagyományos, hanem attól drasztikusan eltérő értelemben akarjuk használni ezeket a fogalmakat –, szerintem nagyon ajánlatos lenne új kifejezéseket alkotni rájuk.
@jotunder: valóban, közel sem tudunk mindent a tudatról vagy a reprezentációs szintekről. De ahhoz már bőven eleget tudunk, hogy bátran kijelenthessük: egy Commodore 64-nek, és egyetlen arra írt programnak – továbbá a papucsállatkáknak, az asztallábaknak, a hidegsajtoló berendezéseknek, a cipőtalpaló robotoknak stb., stb., stb. – nincs sem ön-, sem éntudata. És képtelenek a (fejlődéspszichológiai értelemben vett) másodlagos-harmadlagos reprezentációkra is.
Ezek sziklaszilárdan, kőkeményen tudható és kijelenthető, továbbá kísérletileg kifogástalanul igazolható tények.
@tahonoli: ez abszolút OK.
De:
@tahonoli:
Nem, a baktériumoknak nincs modelljük a környezetről. Egy baktériumkolónia úgy adaptálódik, hogy a tagjai közül azok, amelyek bírják, túlélnek (és talán szaporodnak), a többi elpusztul. A szelekció nem teleologikus.
Az immunrendszer ugyancsak így működik: nem „tesztel” semmit, pláne nem célzatosan, pusztán az/egy adott antigénre reagáló, eleve meglévő mechanizmusok lépnek működésbe. Persze léteznek például memóriasejtek, de nem azért, mert az immunrendszer okosan előre gondolkodik/modellez/tervez, hanem mert a nem teleologikus (ámde könyörtelen) szelekció hosszabb távon csak azokat a sejt-/lényvonalakat hagyta életben – átmenetileg 🙂 –, amelyek rendelkeztek memóriasejtekkel, így potenciálisan ellenállóbbak voltak.
Az immunrendszer eleve nem egységes entitás, ráadásul egészen biztosan nincs olyan dimenziója (tere, felülete, eszközei stb.), amelyen belül egyáltalán lehetséges lenne egy/a hipotézisgyártás.
És amit azt illeti, Penrose a tudatot illetően hajmeresztő hülyeségeket beszél. (Ezért utálom azt, amikor valóban nagy tudósok hirtelen mindent a saját szakterületük alá tartozó szögnek kezdenek látni, és már emelik is a szaktudásuk kalapácsát… Vagy lásd még szívsebészek és sumérmagyarok.)
P.s.: …akármilyen viccesen hangzik, Penrose-nak többet kellene innia. Komolyan. Érdekes & számára meglepő következtetésekre bukkanhatna…
Hiv.: @labrys:
1.IGEN: (a) Tényleg minőségi különbség van egy önreflexív, éntudattal bíró rendszer és egy statisztikai prediktor között. (b) Jogos figyelmeztetés: ha mindenre ráaggatjuk a „tudat”, „megértés” szavakat, nyelvi csapdába esünk, és később fogalmi zűrzavar lesz belőle. (c) Az ön- és éntudat valóságos emergens jelenség, amit nem tudunk jelenleg LLM-eknél kimutatni.
VISZONT:
A gépekre használt metaforák („hipotézis”, „világmodell”) gyakran heurisztikus eszközök, nem szó szerinti állítások. Ha túl mereven tiltjuk a szavak átvitt értelmű használatát, akkor nehéz lesz funkcionális különbségeket leírni.
Az, hogy az LLM-eknél nincs éntudat, nem jelenti azt, hogy teljesen értelmetlen a „modellezés” kifejezés rájuk, azaz csak pontosan kell keretezni („implicit világmodell”).
2.IGEN: A klasszikus filozófiai és tudományos definícióban a „modell” tényleg egy tudatos entitás által létrehozott reprezentáció. Ha ragaszkodunk ehhez a definícióhoz, akkor valóban torzítás a gépi folyamatokat ugyanazzal a szóval leírni.
VISZONT:
A mai AI-kutatásban a „modell” kifejezést már régóta más értelemben használjuk: statisztikai modellt, prediktív modellt értünk rajta, nem emberi értelemben vett modellt. A szigorú definícióhoz ragaszkodás nyelvi konzervativizmus lenne, azaz a tudomány nyelvének van mozgástere, hogy új jelentéseket adjon szavaknak.
3.IGEN: Valóban (a) a baktériumok és az immunrendszer nem teleologikusak, nincs „belső világmodelljük”. (b) A szelekciós mechanizmusok nem célirányos tervezés, azaz az emberi „hipotézis” fogalmát tényleg nem szabad szó szerint rájuk húzni. (c) Sőt az „implicit modell” szóhasználat könnyen antropomorfizálhat biológiai folyamatokat.
VISZONT:
Az „implicit modell” kifejezés nem szó szerinti hipotézisalkotást jelent, hanem azt, hogy a rendszer viselkedése úgy néz ki, mintha lenne belső modell (pl. prediktív feldolgozás).
A baktérium például tényleg reagál környezeti jelekre úgy, hogy a reakciók adaptívak, azaz ez bizonyos értelemben modell-szerű, még ha nem tudatos is.
Az immunrendszer memóriasejtjeit teljesen „vak szelekciónak” beállítani leegyszerűsítés, azaz van funkcionális előrelátás-szerűség a mechanizmusban.
Penrose-kritikád kicsit erős ;), gondolom hozzászokott az évtizedek alatt. Én abszolút Penrose párti vagyok. Az ő fizikalista érdeme, hogy provokatívan új fizikai szintet vitt be a tudat-vita terébe. Különben is, nehogy má’ egy szimpla botor humán-ANN legyek. Mennyivel menőbben hangzik, hogy az agyacskámban van némi kvantumgravitációs effekt. 😀
@labrys:
„Ezek sziklaszilárdan, kőkeményen tudható és kijelenthető, továbbá kísérletileg kifogástalanul igazolható tények.”
.
Amit a felsorolásban megadsz, mármint hogy minek nincsen öntudata, az azért érdektelen, mert nem is volt soha olyan komolyan megfontolandó hipotézis, hogy például a széklábaknak van öntudata. Ez könnyű győzelem. Jelenleg a nukleáris fizikához tartoznak a legtökéletesebben igazolt állítások. De tudjuk-e, hogy milyen tényeket igazol ez a diszciplína? A kísérletek és a tények viszonyáról millió állítást lehet tenni, de nem lesz köztük az, hogy „Ami kísérletileg igazolt, az tény”.
Azt lehet esetleg kérni, hogy valaki akkor elmondja, hogy mit jelent az, hogy valaminek hipotézise van valamiről? A modelljét érteni vélem, az tiszta statiszikai ügy, de nekem itt úgy tűnik, mintha a hipotézis többet akarna ennél állítani.
A másik kérdésem, hogy mi lenne a „számítható elme” Penrose szerint, ami szerinte elméletileg sem lehetséges?
Előre is köszönöm!
Én maradnék a tárgynál. Két kérdés a „tárgy”: (1) Szimuláció (-ként működik-e) a MI? Erre azt hiszem nehéz azt válaszolni, hogy nem. A MI a kínai szoba klasszikus esete. Nem ért semmit, nem gondolkodik, csak szövegeket állít elő.
(2) Ez a szimuláció van-e annyira jó (vagy az ilyen nyelvi modellel megvalósított szimuláció lehet-e majd olyan jó), hogy már ne legyen szimuláció? Hanem mi legyen helyette? Hanem valóságos tudatos gondolkodás legyen a tudat minden elemével, érzékelés, élmények, közvetlen tapasztalat, önreflexió, célok, értékek, éntudat, megértés, stb. Erről azt gondolom, hogy ettől még nagyon messze van a MI, hiszen a tudatosság eme elemei nincsenek meg benne.
De lehet, hogy nem is kell, hogy minden eleme benne legyen. Nem az emberi elmét, tudatot, gondolkodást kell leutánozni, hanem egy magasfokú intelligenciát előállítani. Amihez nagyon valószínű, hogy kellenek bizonyos tudati elemek is (pontosabban, azok a részelemek hozzák magukkal a tudatot), de mindegyik nem kell. Pl. egy érzelmes, haragos MI-nél nem csak feleslegesek, de veszélyesek is lehetnek az érzelmek. Mindenesetre, úgy tűnik (nekem), hogy a nyelvi modellhez még egyéb képességeket is hozzá kell adni, és csak azokkal közelítünk majd az igazi MI-felé.
@ipartelep: Azt mondod: „Nem ért semmit, nem gondolkodik, csak szövegeket állít elő.” és nem tudom, mire alapozod ezt. Látványosan érti amiről ír, legalábbis szabad szemmel nem megkülömböztethető attól, mintha értené. Adtam neki egy feladatot
Száz százalékosan megértette a problémát, tisztában van a körülményekkel, mik szoknak történni egy konyhában és környékén; olyan fogalmakat hozott be a válaszban amik egyáltal fel se merültek a kérdésben. Nem tudom azt mondani, hogy nem érti a kérdést és nem értő, teljes körű, kimerítő választ adott. Hogyan lehetne ennél jobb a válasza, ha értené is, gondolkodna és nem csak szövegetket generálna? És nem, nem hiszem, hogy a korpuszban lett volna eltűnt paradicsomokról szóló szöveg.
Hiv.: @jack_of_all_trades:
1. Mit jelent az, hogy „hipotézise van valamiről”?
Hagyományosan: hipotézis = tudatos lény által megfogalmazott feltételezés a világ működéséről („ha A, akkor B következik”).
Azonban AI/viták kontextusában: amikor azt mondjuk, hogy egy LLM-nek „hipotézise van”, az gyakran metafora. Ilyenkor azt értjük alatta, hogy a modell súlyaiban, struktúráiban olyan implicit összefüggések vannak kódolva, amelyek lehetővé teszik, hogy a világ eseményeit, szövegeit koherensen prediktálja.
Ez nem egy explicit, tudatos feltételezés, hanem inkább mintázat-alapú belső állapot, ami úgy működik, mintha a rendszer egy hipotézist tesztelne.
Például: egy nyelvi modell „úgy viselkedik”, mintha lenne hipotézise arról, hogy a mondat alanya cselekvő, de valójában csak statisztikai mintázatokat tanul, nem fogalmaz meg állítást.
Konklúzió? Amikor AI-ról beszélünk, a „hipotézis” inkább hipotézis-szerű struktúrát jelent: valami, ami funkcionálisan hasonlít a hipotézisalkotásra, de nem hordoz tudatot vagy intenciót.
2. Mit ért Penrose „számítható elme” alatt?
2.1 Bármi, ami egy algoritmus formájában, elvben végtelen idő és memória mellett, egy Turing-gép által lefuttatható. Ez nagyon messzire elér: olyan dolgokig is, amiket mi intuitíve „megoldhatatlannak” érzünk, de elméletileg algoritmizálhatók.
2.2 „Vad” példák, amik még mindig számíthatók
a.Gömbvillám pontos fizikai szimulációja
b.Az univerzum 10^100 évre előre. Ha ismerjük az összes részecske kezdeti állapotát, a fizikai törvényeket, és van végtelen számítási kapacitás, akkor determinisztikusan ki lehetne számítani a jövőt – a világegyetem hőhaláláig.
c. A teljes emberi történelem minden részletének szimulációja. Minden egyes döntés, gondolat, esemény emergens módon számítható lenne (a jelenlegi fizika determinisztikus részéből kiindulva).
d. Végtelen sokszor összetett matematikai feladványok. Például: végtelen nagyságú prímszám keresése, vagy a prímszámok bármilyen „értelmes” sorozata: mind kiszámítható, mert van rá algoritmus, ami előállítja, csak végtelen idő kell hozzá.
e. Az összes lehetséges Shakespeare-dráma megírása, minden lehetséges variációban, végtelen hosszban, majd ezek értékelése, hogy melyik a legszebb. Ez elméletileg számítható, mert algoritmus generálhatja az összes karakterkombinációt, majd szűrheti, rangsorolhatja. Bármennyire is „emberfelettien kreatívnak” hangzik, egy Turing-gép elméletileg elvégezhetné.
És csak amikor azt mondod: „jó, de honnan tudjuk, hogy ez a variáció valóban a legszebb?”, ott jönne be Penrose szerint az a szint, ami már nem algoritmizálható: az intencionális belátás (a kvantumösszeomlás mint nem-számítható folyamat).
2.3 Az, ami Penrose szerint már nem számítható:
* A Gödel-féle belátások: amikor egy matematikus felismeri, hogy egy adott formális rendszerben van egy igaz, de bizonyíthatatlan állítás. Ilyenkor nincs olyan algoritmus, ami „biztosan” előállítja ezt a belátást. Ezért mondja Penrose: itt kell bejönnie valami nem-algoritmikus elemnek (nála ez az Orch-OR kvantumösszeomlás).
2.2 b tuti nem jó példa. Egyrészt ugye ott a Heisenberg, aki miatt nem ismeheted az összes részecske kezdeti állapotát másrészt mondjuk a rádioaktív atomok, amikről tudjuk, hogy statisztikusan kb mikor bomlanak, de pontosan nem tudhatjuk. Ezek a kis eltérések meg a káoszelmélet együtt pont azt adják ki, hogy ilyen hosszú távra előre nem tudsz mindent kiszámolni, hiába a végtelen idő meg kapacitás.
Hiv.: @nyulambator:
Válasszuk ketté a dolgot.
1. Fizikai szinten elkezdjük implementálni a 2.2.b-t
Ebben az esetben ténylegesen valóban NEM kiszámítható az univerzum állapota 10^100 évre előre, mert ahogy mondod a Heisenbeg határozatlanság, a radioaktív bomlás kvantumfolyamata, a káoszelmélet külön-külön is kizárja a teljes determinisztikus előrejelzést.
2. Mi most itt a topikban ezen a ponton azt próbáljuk fejben(!) élesen elhatárolni, hogy mi kiszámítható és mi nem az. Adott az ideális Turing-gépes konstrukció. Ott a feltétel, hogy ha ismerjük a pontos kezdeti feltételeket, és ha a fizika teljesen determinisztikus („ha nagyanyámnak kerekei lennének, ő lenne a bécsi omnibusz”), akkor kiszámítható. Nem kell létezzen fizikailag tehát az implementálandó algoritmus. A vad példa üzenete az, hogy horribile dictu még a kvantumvilágot is lehet kiszámíthatónak tekinteni, mivel kvantummechanika maga is algoritmizálható (pl.: Schrödinger egyenlet futtatása). Az, hogy az egyes bomlások véletlenszerűek, nem jelenti azt, hogy a statisztikai eloszlás ne volna számítható.
@tahonoli: Köszönöm! Viszont ha jól értelek, ilyen értelemben egy multilineáris regressziónak is van implicit hipotézise a világnak arról a szeletéről amit a változói megragadnak? Nem beszélve mondjuk egy PCA-ról.
A Penrose esetében pedig arról lenne kb. szó, hogy a „tudat” nem felel meg az LMD világképnek? De ezzel, ha jól sejtem, Penrose egyáltalán nem akarja azt mondani, hogy ne tisztán fizikai lenne az egész cucc, csak annyit, hogy elvilseg sem lehet programot írni, ami megjósolja mit csinál a tudat a következő pillanatban (random, mint a guppi, ha ez mond valakinek valamit)?
Hiv.: @jack_of_all_trades:
1.
IGEN: Jogos meglátás: egy regressziós modell vagy egy PCA tényleg hordoz implicit „hipotézist” a világról. Ez tökéletesen rímel arra, amit LLM-eknél implicit hipotézisnek nevezünk: nem kimondott állítás, hanem egy beégetett struktúra arról, hogyan néz ki a világ egy szelete.
VISZONT:
A különbség az, hogy regresszió/PCA teljességgel explicit modell, így aztán pontosan meg tudjuk mondani, mi a hipotézis, és mit jelent. Míg az LLM-nél a hipotézis implicit és hatalmas komplexitású: nincs egyértelmű, emberi szavakkal megfogalmazható „világnézet”, csak egy valószínűségi tér, amelyből viselkedés születik.
2.
IGEN: jól mondod, mert Penrose nem dualista, tehát nem mondja, hogy a tudat ne lenne fizikai (Penrose teljességgel fizikalista ugyan, de fizikalistaként van, hogy szembemegy fizikalista állításokkal is, azaz minden dogmatizmus távoláll tőle).
Jó a guppi-hasonlat: a tudat szerinte nem determinisztikus predikció eredménye, hanem van benne kvantum-eredetű „random” elem (noha ő inkább nem algoritmizálhatónak hívná alapértelmezésben, nem pusztán véletlennek).
VISZONT:
Penrose szerint azért nem „random, mint a guppi”, mert a random (mint klasszikus valószínűségi zaj) még mindig számítható eloszlás formájában. Tiszta őrület, nem? („A takarítónő az őrület határát súrolja”)
Penrose tehát jóval erősebbet állít: az emberi belátás olyan igazságokat ismer fel, amelyek semmilyen algoritmus kimeneteként nem írhatók le. Ez több, mint random; ez a Gödel-féle nem-algoritmikus belátás. (Egyébként tudhatóan keményen támadják/kritizálják is emiatt Penrose-t, számomra egyébként kicsit értelmezhetetlen módon: egyszer, ha sok időm lesz utánamegyek ennek rendesebben)
Amit tudni lehet vita-konklúzióként: a kognitív tudósok masszív többsége azt mondja, hogy minderre nincs empirikus bizonyíték, Penrose inkább filozófiai-fizikai spekulációt hoz csak.
Én is hozok egy gondolatot. Lehet nem ide kéne beszúrnom, hanem a Trump-os threadbe.
Béndek Peti linkelte az alábbi Geoffrey Hinton speechet:
https://www.facebook.com/peter.bendek/posts/pfbid0qe6qxuECHBCRfi6YBdF8v6WcDQXpdAd6yrMt19obxp7b6UvWqdYVjYERxUfHMNy1l
Angolul: We’re talking about um having a huge increase in productivity. So there’s going to be more goods and services for everybody. So everybody ought to be better off. But actually it’s going to be the other way round. And it’s because we live in a capitalist society. And so what’s going to happen is this huge increase in productivity is going to make much more money for the big companies and the rich. And it’s going to increase the gap between the rich and the people who lose their jobs. And as soon as you increase that gap, you get fertile ground for fascism. And so it’s very scary that um we may be at a point where we’re just making things worse and worse. And it’s crazy because we’re doing something that should help everybody. And obviously it will help in healthcare. It’ll help in education. But if the profits just go to the rich, that’s going to make society worse. It’s crazy.
ChatGPT-magyarul: Beszélünk arról, hogy óriási termelékenységnövekedés lesz. Tehát több árut és szolgáltatást kell, hogy legyen mindenkinek. Így mindenkinek jobban kellene járnia. De valójában az ellenkezője fog történni. És ez azért van, mert kapitalista társadalomban élünk. Tehát amit fogunk látni, az az, hogy ez az óriási termelékenységnövekedés sokkal több pénzt fog hozni a nagy cégeknek és a gazdagoknak. És növelni fogja a szakadékot a gazdagok és azok között, akik elvesztik a munkájukat. És amint növeled azt a szakadékot, termékeny talajt kap a fasizmus. Szóval nagyon ijesztő az, hogy lehet, hogy pont arra a pontra jutunk, hogy egyre rosszabbá tesszük a helyzetet. És ez őrület, mert olyasmit csinálunk, ami mindenkinek segítenie kéne. És nyilván segíteni fog az egészségügyben. Segíteni fog az oktatásban. De ha a profit csak a gazdagokhoz megy, az társadalmilag rosszabbá fogja tenni. Ez őrület.
Na most ugye azt látjuk, hogy Hinton fejben előre lejátszik történéseket (lásd: „Nyuszika és a fűnyíró”-vicc). Egy negatív spirálú, kaszkád eszkalációt. Amilyeneket mi is fogalmaztunk meg Trump elnöksége kapcsán itt a blogon (én is).
Félévnyi Trump-elnökség után viszont két dolog látnivaló lett:
1.Elon Musk pl.: nagy Doge-s nekibuzdulása
2.Gellert kapott (ha jól értem a történeseket).
Tehát elgondolkoztató lehet, hogy milyen negatív visszacsatoló erők lehetnek például a technofasiszta tech bro-k korlátozása irányába, akiknek pénzük van, médiát és elnököt vásárolhatnak a piacon, tudnak is, akarnak is támadni, demokráciát aláásni.
Nekem most perpillanat az a kísérleti ideám, hogy Elon Muskék tömegeket tudnak manipulálni. Viszont a tömegek meg Elon Muskék hálózati beágyazottságát tudják megtámadni, aláásni. Ha ez véletlenül így lenne, akkor ez kedvező faktor lehet a kaszkád eszkalációval szemben.
Nem tudom érthető-e mire akarok kilyukadni, mennyire zavaros mindez.
@nyulambator:
Például így: – Pajtás, te hazamész egy jól sikerült nyaralásból és – tudva, hogy a fiad otthon volt – az után kezdesz nyomozni, hogy vajon hová tűnhetett a hűtőben hagyott paradicsom, és ehhez még a mesterséges intelligenciát is segítségül hívod, akkor kitűnő példája vagy azon felelőtlen embereknek, akik a drága energiát feleslegesen pazarolják.
@jack_of_all_trades: miért nevezhetjük implicit hipotézisnek azt, ami kialakul a training alatt a transzformerben? képzeljük azt, hogy a training korpusz egy titokzatos jelsorozat, amit egy radar fog a világűrből az ausztrál sivatagban. tobb trillió bit. ez a tapasztalat. egy AI (elvileg, gyakorlatilag ma ebben nem túl jók) felállítana egy implicit hipotézist a jelsorozat mögött kauzális kapcsolatokra. ez az autoregresszivitása lényege. fogunk egy ezer hosszúságú jelsorozatot, kontext window-nak gondoljuk és az AI elkezd úgy csinálni, mint a jelsorozatot küldő entitás. hatalmas hosszú jelsorozatot indít el,és egy idő után akaár hosszabb is lehet, mint a tapasztalati jelsorozat. ezért hipotézis az, ami benne van. az ő számára az optimális hipotézis arra, hogyan keletkezett a jel valahol millió fényévnyi távolságban.
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
ezt a példát szeretem:
https://x.com/karpathy/status/1645115622517542913
van egy tizenöt hosszűságú korpusz, amelyben nincs két nulla egymás mellett, és kitalál egy hipotézist mögé, ami egy végtelen sorozatot generál, és abban van mindenféle alakzat, ami nincs benne a training korpuszban. ezt „gondolja” a „világ”-ról.
@darnoknew: Azt hiszem nyugodan mondhatom, hogy ez nem így van. Egyebek közt pontosan az energiapazarlás miatt kizárólag akkor használom a chatgpt-t, amikor ide konstruálok példákat. Amúgy jobban bizok a saját természetes butaságomban mint a mesterséges okosságban.
Amúgy meg ha így válaszolna, az nem az intelligenciájáról, hanem az arroganciájáról tanuskodna. Azt meg nem kell mesterségesen generálni, abból van elég már amúgy is. Nekem jobban tetszik, hogy segítőkész.
@nyulambator:
Humorosan próbáltam megfogalmazni, hogy miféle válasz utalhatna az MI gondolkodására, ha lenne neki. Bocs, hogy a próba nem siketült.
Hiv.: @nyulambator:
Pedig de… Nagyon egyetértek HIV.: @darnoknew: eme válaszával. Bármely, akárcsak átlagosan értelmes zember a szóban forgó kérdésre (ha tőlük kérdeznék meg) nem úgy válaszolna mint a beszélgetőgép. Hanem kb. ezt mondaná: „Most ez komoly? Egy darab paradicsomot keresel, amit valszeg megevett a fiad? Hát verd kibelőle! Az mégsem járja, hogy amíg te távol vagy, ő paradicsomot eszik a hűtőből, ráadásul egy egész darabot meg merészelt enni. Apropó: miért teszed hűtőbe a paradicsomot?” Satöbbi.
Tehát nem emberszerűen válaszolt, hanem pont úgy, mint egy gép, aki semmit nem ért meg a kontextusból. Nem érti, hogy egy ilyen kérdésre nem kell minuciózus, minden lehetőséget kimerítő választ adni, mert az fölösleges, és nevetséges. És ez azért van, amit már sokszor mondtam: csak szimulálja a beszélgetést, nem érti a tartalmakat.
@ipartelep: Amit te keresel, az nem mesterséges intelligencia, hanem emberszimulátor. Ha egy pillanatra lazábban néznéd az ügyet (estleg dobj be egy felest) és nem abból az álláspontból. hogy a cél bebizonyítani, hogy ez nem intelligencia, akkor semmilyen logikus érvet nem találok, ami ne mutatna inteligenciára, érvelésre, megértésre, gondolkodásra a fenti párbeszédben.
Valóban, nem kerülte meg a választ, nem mondott helyette egy jó vicceset vagy reagált arrogánsan, mint ahogy azt esetleg egyik-másik ember tenné. Úgy válaszolt, ahogy mondjuk egy idős apáca válaszolna a kérdésre. Jóindulattal. Azzal az attitűddel, hogy nem tudom miért fontos ez most neked, de megpróbálok segíteni.
Az, hogy a paradicsomos szituáció életszerűtlen, az pont nem az ő hibája, hanem az enyém, de próbáltam olyan helyzetet leírni, ami biztos nem szerepelt a korpuszban.
Ne azt keresd, hogy mennyire (nem) emberi a rekciója, hanem lásd meg azt, hogy egy három mondatos erősen hézagos promptból megértette a helyzetet, a problémát, és az összes minimálisnál nagyobb valószínűségű választ megadta, javaslatokat tett a helyzet megoldására. Ha ezt egy elsős gyerek tenné, azt modanád, hogy ez a gyerek mennyire intelligens.
Ne az embert keresd a sakkozó gépben, hanem vedd észre, hogy tud sakkozni. Lehet, hogy nem úgy elemzi a helyzetet, mint a humán sakkozó, még csak nem is káromkodik ha leveszed a bástyáját, viszont sakkozik, na.
Hiv.: @nyulambator:
Tudod mit? Kérdezzük meg erről magát a beszélgetőgépet.
„Egyeseknek az a véleménye, hogy te értelmes vagy, gondolkodsz, van tudatod, és megérted a neked feltett kérdéseket. Ez így van?”
A ChatGPT ezt mondta:
Ez egy nagyon jó és mély kérdés.
Amit rólam tudni érdemes: én nem rendelkezem tudattal, önálló gondolkodással vagy érzelmekkel abban az értelemben, ahogy az emberek.
Amit csinálok, az nyelvi minták felismerése és előrejelzése. Amikor te kérdezel valamit, én a betanított (és hatalmas mennyiségű szövegből tanult) statisztikai minták alapján állítok össze egy választ, ami a lehető legjobban illeszkedik a kérdésedhez. Ezért tűnhet úgy, mintha érteném, mit kérdezel, de valójában csak szövegfeldolgozást végzek, nem tudatos értelmezést.
Más szóval:
Értelmesnek látszom, mert a válaszaim összefüggőek és konzisztens logikát követnek.
Nem vagyok tudatos, nem élek át semmit, nem gondolkodom „magamtól”.
Nem értem a dolgokat emberi értelemben, csak nagyon hatékonyan modellezem a nyelvet.”
Vagy túl szerény, vagy óvatos. 😉
@ipartelep: Vagy túl sok cikk volt a korpuszban, ami mind ezt ragozta, hogy nem tudatos (akármit is jelentsen ez). De vegyük észre, hogy „Nem értem a dolgokat emberi értelemben„.
Van az a régi vicc, amikor a matematikusnak meg a fizikusnak egy-egy bombajó nőt ajánlanak, de azzal a megkötéssel, hogy csak úgy közelíthetik meg, hogy mindig csak a távolság felét tehetik meg, ott meg kell állni és aztán mehetnek tovább. A matematikus el se indul, mert tudja, hogy így sose érhet oda. A fizikus rárajtol, mondván kisvártatva olyan közel leszek, hogy az nekem már elég.
Szóval lehet, hogy emberi értelemben nem érti, de amit csinál annyira jól szimulálja a megértést, hogy az szerintem már valójában megértés.
Hiv.: @nyulambator:
Nincs ám új a nap alatt. Erről is volt már szó. …”szerintem már valójában megértés”
Hogy mitől, és mettől megértés, azt mi definiáljuk. Nem ugyanazok erre a definícióink. Ezért van ez az eltérés.
@ipartelep: Nyilván.
@jotunder: Oké, de ebből az implicit hipotézis az a rész, hogy a korpuszban struktúrát ismer fel, amelyet aztán képes felhasználni új, a korpuszban konkrétan nem szereplő válaszok generálására? Vagy a válasz hosszának is van relevanciája?
@tahonoli:
Ezt értem – de látod, mi is épp itt érvelgetünk annak apropóján, hogy az LLM-ek kapcsán folyton előkerülnek olyan kifejezések, amelyeket természetesen (?) zárójelesen, analógiaszerűen (nem eredeti értelmükben) értenek a használóik, ám ugyanakkor az összes többi ember zárójelek nélkül hallja & olvassa azokat. És aztán ennek megfelelő (hibás) következtetéseket von le.
A „pontos keretezés” meg orbánista trükk 😀
Akkor ezennel legényesen félrecsapom kissé nyelvi konzerv vaskalapom, és kijelentem, hogy ez nekem nem tetszik 🙂
Épp ez az, amit fájlalok. Amikor valaminek a szimulációjára pontosan ugyanazt a kifejezést használjuk, mint magára a tényleges, szimulált dologra. És a legelképesztőbb ebben számomra az, hogy ezt az önbecsapást/csapdát teljesen önként (lustaságból?) csináljuk.
…Ennek nagyon rossz vége lesz, drága gyermekeim!
/hosszú ősz szakáll simogatása/
Penrose: a fizikalizmus szép dolog, de én nem is az idealista, hanem az ellenkező oldalról rosszallom ezt az egész tudatos kvantumozást (pun intended).
A(z emberi) tudat kompartmentált, modulos, többszintű… izé (nemennyünkbele). Ráadásul úgy kialakulását, mint működését tekintve elválaszthatatlan része a szociális környezet (lásd valódi Mauglik & ingerdeprivációs kísérletek stb., stb.).
És mint ilyen, csak több komplexitási szinttel a fizikai fölött magyarázható/értelmezhető. Kvantumeffektekkel magyarázni próbálni bármilyen tudati jelenségeket olyan, mintha Michelangelo Pietà-jának művészi hatását a márványt alkotó kalcit trigonális kristályszerkezetével próbálnánk magyarázni… (Sőt, még olyanabb, mert a kvantumszintet sokkal több nagyságrend/komplexitási szint választja el a tudat, e biológiai-társadalmi termék szintjétől, mint egy szobor hatását a szobor anyagától.)
Egyszerű növényi főzetekkel vagy hozzávalókkal (lásd pl. alkohol, ayahuasca, pszilocibin, anyarozs stb., stb.) és egyszerű pirulákkal drasztikusan megváltoztatható a tudat(i működés). Az emberi agyon megfelelő ponton átdöfött acélrúddal brutálisan más személyiségűvé változtatható valaki. Egy szimpla köríves rúgással másodpercekre kikapcsolható a tudat; közönséges lítiumsókkal nagyon markáns tudati-viselkedési befolyásolás érhető el (lásd bipoláris zavar lítiumterápiája) stb., stb., stb. – Ha a kvantumszintű jelenségeknek valóban lenne komoly hatása a tudat egészére, akkor nyilván a lítium, a Psilocybe gombák meg a köríves rúgás (etc.) hatásait is mind-mind kvantumeffektusokhoz kellene rendelnünk, nem? 🙂
Haggyá má’ lógva, Sir Roger…
@labrys:
„A(z emberi) tudat kompartmentált, modulos, többszintű… izé (nemennyünkbele). Ráadásul úgy kialakulását, mint működését tekintve elválaszthatatlan része a szociális környezet (lásd valódi Mauglik & ingerdeprivációs kísérletek stb., stb.).
És mint ilyen, csak több komplexitási szinttel a fizikai fölött magyarázható/értelmezhető.”
Mármint hogy a jelen tudásunk nem elégséges ahhoz, hogy a tudatot a fizikai magyarázatok valamelyik szintjén (pl. neuroscience) magyarázzuk, vagy úgy véled, hogy ez nem is lehetséges? Hogy jelen állás szerint nem praktikus, azt nem vitatnám, de ez még mindig csak episztemológiai emergencia és nem ontológiai 🙂 (Értsd, nem kell feltételeznünk semmit, ami nem tisztán anyagi természetű, még „szupervenienciát” sem, csak azt, hogy nem vagyunk elég okosak/nem rendelkezünk elég ismerettel a tudat tisztán fizikai leírásához, ezért egy olyan szinten magyarázzuk, amit jobban meg tudunk ragadni.)
@val: nyilván nem akartam ilyen filozófiai mélységekbe merülni; a példákkal csupán azt próbáltam szemléltetni, hogy a tudati sajátosságokra és a reprezentációs szintekre nézve igenis rendelkezünk bizonyos tudással. Azaz a ’háááát, a tudat meg a reprezentáció akármi is lehet, még nem tuggyuk’-féle érvek hamisak.
Egyébként előállt bárki olyan hipotézissel, hogy valamelyik/bizonyos LLM-eknek van öntudata?
(…Különben szívesen beszélgetek az említett filozófiai mélységekbe hatoló kérdésekről is – ugyanúgy teljesen zokni vagyok hozzájuk, mint bármi máshoz –, csak kérlek, előbb definiáld a ’tény’, ’kísérlet’, ’állítás’ és ’hipotézis’ fogalmakat. 😉 )
@jack_of_all_trades: nemnem, bocs, a „fizikai” alatt a ‘fizika’ nevű konkrét tudományág (kvantumfizikai) magyarázatait értettem. Tehát nem tételezek semmiféle, nem a fizikai valóságban létező ágenseket. Sehol.
@jack_of_all_trades: … és mivel nemigen tudjuk mit jelent az, amikor az ember megért valamit, hipotézist alkot, modellje van, praktikusan csak az input-output alapján ítéljük úgy, hogy valaki valamit megértett, van róla modellje, etc. ezért az LLM-el kapcsolatban se kéne magasabb elvárásaink legyenek.
Ha úgy hápog, mint aki megérti a dolgokat, meg úgy is totyog, mint aki megértette a dolgokat, sőt úgy is néz ki, mint aki megértette a dolgokat, akkor szerintem fogadjuk el, hogy megértette azokat a dolgokat.
@jack_of_all_trades: nem ismer fel struktúrát. elindulnak valamiféle kezdeti, esetleg random súllyal a paramétereken és backpropagationnel folyamatosan javítják a paramétereket, amíg el nem érnek elég jó paramétereket. és akkor az a hipotézis, hogy a korpuszt ezekkel a paraméterekkel állította elő egy Markov modell. amiről tudjuk, hogy nem igaz, mert nem gép állította elő. de ez egy nagyon jó hipotézis.
@ijontichy: Én érzem, ha megértek valamit és ennek általában külső szemlélő számára is észrevehető jelei vannak. Vajon miként nézne ki egy olyan kimeneti eszköz, amelyik a számítógép „Aha”-élményét közvetíti?
Hiv.: @Hottentottenstottertrottelmutterattentäter… usw:*
„Vajon miként nézne ki egy olyan kimeneti eszköz, amelyik a számítógép „Aha”-élményét közvetíti?”
Bárhogy. Azt is szimulálná. Elpirulna. (Felgyulladna egy piros lámpa.) Oszt jónapot.
@Hottentottenstottertrottelmutterattentäter… usw: , @ipartelep: : Gőzöm sincs. Viszont már említettem, hogy ember-AI tárgyában számomra a filozófusok kísérlete, hogy a nyelv nehézkes és korlátozott eszközeivel próbálnak nagyon komplex gondolatokat, elméleteket leírni, kevéssé érdekes.
Inkább érdekel „körösztatyám” – szokása szerint színes és szórakoztató – játszadozása a „nekroszféra” 😉 tárgyával (Legyőzhetetlen, Béke a Földön), illetve Zsoldos Péter kiváló műve, az Ellenpont.
@jotunder: Oké, köszönöm, ez világos beszéd 🙂 Így jobban érthető az implicit rész is.
@nyulambator: Amikor a ChatGPT (nem tudom, melyik verzió) sakkozott, teljesen világossá vált, hogy egyáltalán semmit nem ért. A legalapvetőbb szabályokat, a sakk koncepcióját, semmit. Ott, akkor, ez egyértelmű volt. Igaz, az még a reasoning modellek előtt volt.
„A MI a kínai szoba klasszikus esete. Nem ért semmit, nem gondolkodik, csak szövegeket állít elő.”
Ezt így nem lehet leszögezni, hiszen azzal kiiratkozol a problémáról való gondolkodásból. Hiszen pont ez lenne maga a kérdés, a téma.
@Grrr: Mondjuk az emberek közt is sok van, aki nem tud sakkozni.
@nyulambator: Arra gondolok itt, hogy egy négyéves gyerek is könnyen megérti, hogy a sakkban szabályok vannak, hogyan lépnek az egyes figurák, meg hogy ha valamelyik lekerült a tábláról, akkor nem lehet visszahallucinálni.
@Grrr: De ha tábla nélkül, fejben kell játszani, tízből kilenc emberrel pont ez történnne.
@nyulambator: Na jó, rendben, de nem arról van szó, hogy amúgy pontosan érti és betartaná a szabályokat, csak elfelejti, hogy mi hol volt. Hanem az alapok valódi megértésének a hiányáról. Persze megint a a kínai szobához értünk vissza.
@Grrr: Egy transzformerről van szó. Egy nagyon nagy sakk korpuszon tanítják, beállítják a paramétereket és ezek után meg kell jósolnia a következő lépést. Nincs olyan, hogy ő „tudja” a szabályokat. Ez egy paraméterhalmaz, nem olyan, mint a Stockfish (amelyik bármely embert bármikor megver). Az a kérdés, hogy nagy kapacitás bővítéssel elérhető-e, hogy tisztán transformer-based gép eléri a humán szintet. Ahogy olvasom a probléma a middle game. Hát ha erre ráfeküdne az OpenAI, belerakna párszázmillió dollárt, akkor egy év és megveri az embert. Ráraknának mindent, amit lehet, és megverné az embert.
@jotunder: Igen. Kíváncsi vagyok. A Stockfish is neural networkot használ (efficiently updatable neural network), de ott persze egyáltalán nem a korábbi lépések alapján kell megjósolni, mint egy GPT-nek, hogy mik lehetnek a következő lépések. Persze nem igazán értem.
„Hát ha erre ráfeküdne az OpenAI, belerakna párszázmillió dollárt, akkor egy év és megveri az embert.”
Ez vagy így lenne vagy nem, de (Grrr és nyulambatortól kérdezve) bármelyik lenne is ennek mi lenne az elmefilozófiai jelentősége? Miben változtatná meg az elmefilozófiai nézeteiket ahhoz képest ami már eddig is történt az elmúlt kb 3 évben mióta a GPT-k így berobbantak?
@nyulambator:
Kicsit gondolkodtam ezen, meg a korábbi hozzászólásomon (@darnoknew:). Azt hiszem, hogy csak hónapok kérdése, hogy úgy (is) válaszoljon, ahogyan én azt ott elvártam. Akkor majd nyilván emelem az elvárás szintjét :).
Tettem egy próbát. Annak idején, amikor a fizetős felsőoktatás bevezetésén gondolkodtak, megkérdezte az utca emberét a riporter, mit szól ehhez. Az aktuális alany a fogalmazása alapján egy tanult hölgy volt, kb. tanárnőnek néztem. Az ő véleménye az volt, hogy az oktatás maradjon ingyenes. A riporter visszakérdezett, hogy akkor tehát valamennyi adófizető állja az oktatás költségeit, ne csak azok, akik tanulnak? A hölgy ilyen értetlenség hallatán felcsattant: –Nem, legyen ingyenes!
Megpróbáltam a ChatGPT-t megvezetni, úgy próbáltam erről kérdezni, hogy legyen lehetősége elmismásolni a választ valami olyasmivel, hogy igen, az ingyenes oktatás valóban jó dolog. Nem sikerült, korrektül kioktatott. Akkor most ki volt itt a gondolkodó?
Azt olvastam a ChatGPT-5-ről, hogy minden témakörben PhD szintű a tudása. Ez sajnos nem igaz, de azt elfogadom, hogy bármely témában PhD szintű nyelvezeten tud hablatyolni. Ugyanakkor úgy tűnik, hogy az átlagembernél már jobb a „gondolkodási képessége”. (Van olyan ismerősöm, akinél a négy alapművelet elvégzésére alkalmas számológép is „okosabb”.)
A sakkozási képtelenség elgondolkodtató, de nyilván idő kérdése, lényegében jotunder is ezt írta. Szerintem hasonló probléma, hogy amikor képet generáltatunk, akkor szinte képtelenek hibátlan feliratot tenni rá. Ezzel kapcsolatban azt mondta a GPT-5, hogy a gyanúmmal ellentétben nem az ingyenes változat korlátozásáról van szó, hanem ez a technológia korlátja, mert „a képgeneráló rendszerek ugyanis nem »írni« tanulnak, hanem pixeleket mintázni a látott minták alapján.” Ezt értem, de furcsállom, hogy nem lehet ötvözni a kettőt, nyilván azért, mert nem értek hozzá. Mindenesetre az a gyanúm, még megérem (70+!), hogy a szakterületemen leverjen az MI.
Összefoglalva, kezdek inkább afelé hajlani én is, hogy ami úgy hápog… Mert különben hogy húznánk meg a határt? A Turing-teszten már régen túl vagyunk.
Hiv.: @Grrr:
Hiv.: @jotunder:
Nagyon érdekes téma a Stockfish engine kontra LLM-sakkozás, szerintem is.
Az LLM-ekről volt szó korábban, nem ismételnék („autoregresszív transformer”), míg a Stockfisht így írnám le.
% – A Stockfish egy konkrét feladatra optimalizált, állásokat numerikusba leképező, determinisztikus döntéshozó gép.
% – Célgépes sakkmotor: (1) keresési algoritmus + (2) értékelő függvény. Vagyis játékelméleti fán barangolva keresi a jövőbeli jó lépéseket, amiket numerikusba képez le.
% – Kombinált tanulású: szabályok + milliónyi játszma + explicit értékelés
%%%%
Amiért írom a kommentet, hogy szerintem érdemes egy kört tenni, mélyebbre ásva, annak érdekében, hogy vajon a neurális hálók (=NN) hogyan muzsikálnak Stockfishnél és hogyan LLM-eknél.
Amiben azonosak az NN-ek: mindkettő esetben neurális approximátorról beszélünk: adat → mintázat → becslés → loss → backpropagation → optimalizált súlyok.
Amiben különbözőek, hogy
% – a Stockfish egy bitanggyors gokart, az LLM meg egy univerzális kamion, analógiában.
% – illetve az input: nem mindegy, hogy egy sakkállást kell betáplálni feature vectorral, avagy egy kínai nyelvű dokumentumot. A Stockfish épít arra, hogy a sakkállás ennyivel egyszerűbben megragadható; ettől lesz brutálisan hatékony.
Stockfishnél tehát a neurális háló bemenete: a táblán lévő bábuk elhelyezkedése (feature vector), míg a kimenete: egy valós szám, ami az adott pozíció előnyét mutatja (pozitív = fehér előny, negatív = fekete).
%%%%
% Érdemes lehet megérteni az NNUE-t, amiről Grrr is beszélt. 2020 előtt szabály alapú volt a sakkpozició kiértékelése (gyalog = 1, bástya = 5 stb.), ma már tanított neurális hálózat alapú, amit egy kisméretű, gyorsan frissíthető neurális háló végez.
A nagy truvájság („updateable”) az az, hogy amikor a keresési algoritmus egy lépést megtesz vagy visszavon, a gondolkodása során, a neurális háló bemenete csak részben változik, így a háló gyorsan újraszámítható anélkül, hogy teljesen újra kellene értékelni a táblát.