Az AI esete a matematikai diákolimpiával
Nemrég fejeződött be a Nemzetközi Matematikai Diákolimpia Ausztráliában. A magyar csapat tizennegyedik lett, ketten aranyérmet szereztek, és ez egy nagyon szép eredmény. A poszt azonban nem erről szól.
A versennyel párhuzamosan több top reasoning AI-modellt is beizzítottak. Köztük a nemrég bemutatott Grok-4-t és a Gemini-2.5-pro-t. Egy ilyen nyelvi modell összességében a sokszorosát költi el az érvelésre, mint azok a változatok, amelyek a kereskedelmi forgalomban vannak. A pontos adatot nem tudom, de szerintem több mint ezerszer annyiba került egy output token, mint amikor valaki kérdez a GPT o2-minitől előfizetéssel, a Grok-4-nál ez kb ötszáz dollár volt a teljes feladatsorra. Ez sokkal többnek tűnik, talán van olyan szakember kommentelő, aki ehhez ért. (chatGPT hatezerszeresre becsülte az egy output tokenre eső költséget)
A Gemini-2.5 pro 13 pontot szerzett (31 százalék) a lehetséges 42-ből (a versenyben a hatodik példa volt messze a legnehezebb, a kínai csapat minden tagja megoldotta az első ötöt, egyetlen AI sem szerzett pontot a hatodik példán). A Grok-4 csak 11.9 százalékot szerzett, a Deep Seek-R1 0528 meg 6.85-t. A 31 százalék is kevés az éremhez, a bronzéremhez 45 százalék kell.
Az Open-AI azt állítja, hogy egy egyelőre nem nyilvános nyelvi modelljük aranyérmet szerzett, de ezt nem tudják egyelőre ellenőrizni.
Nem tudom, hogy ez pontosan mit jelent, de én azt gondolom, hogy a „2025 végére itt AGI lesz” esélye valamennyivel csökkent.
P.S jogi képviselőnk kérésére nem kommentálom Palkovics akadémikus úrnak, hazánk mesterséges intelligencia ügyi kormánybiztosának értékes gondolatait.
„Tudja, le szeretném egyszerűsíteni a mesterséges intelligenciát, mert sokan úgy gondolják, hogy ez valami misztikus dolog. Pedig ez nem agysebészet. Ez egy matematikai eszköz, ami a múltbeli adatokból megtanulja, hogy mi hogyan függ össze, és ennek alapján segít dönteni vagy feladatokat elvégezni. Szorzás, összeadás, függvények – ennyi az egész. Persze kell hozzá számítási erő, ha bonyolult a feladat. De amikor elkezdjük használni, akkor azonnal látszanak az eredmények. „
Tilesch György professzor úr minap Friderikusz úrnak magyarázta el a mesterséges intelligencia lényegét, és jogi képviselőnk konkrétan belém csípett, amikor csak pajzán gondolat futott át az agyamon, hogy megposztoljam.
<div class='sharedaddy sd-block sd-like jetpack-likes-widget-wrapper jetpack-likes-widget-unloaded' id='like-post-wrapper-192691293-16532476-69ff456666dac' data-src='https://widgets.wp.com/likes/?ver=14.1#blog_id=192691293&post_id=16532476&origin=www.orulunkvincent.hu&obj_id=192691293-16532476-69ff456666dac&n=1' data-name='like-post-frame-192691293-16532476-69ff456666dac' data-title='Like or Reblog'><h3 class="sd-title">Like this:</h3><div class='likes-widget-placeholder post-likes-widget-placeholder' style='height: 55px;'><span class='button'><span>Like</span></span> <span class="loading">Loading...</span></div><span class='sd-text-color'></span><a class='sd-link-color'></a></div>
elég régen nem írtam a magyar politikai gusztustalanságokról, igyekszem bepótolni.
Nem látom be, hogy az AGI és a Nemzetközi Matematikai Diákolimpia feladatainak megoldása közt hol az összefüggés. Nem láttam a feladatokat, de van egy olyan érzésem, hogy talán én se tudnék 13-nál több pontot elérni ott. De hogy az emberiség 90%-a tuti nem arra nagy összeget tennék. Ha az AGI csak az emberiség 90%-ánál okosabb, de nem nyerne aranyérmet a diákolimpián, az szerintem már good enough.
Az olimpiai feladatokhoz épphogy nem általános, hanem nagyon is speciális intelligencia kell.
Allitolag a Gemini DeepThink is megoldott 5 feladatot: https://xcancel.com/GoogleDeepMind/status/1947333836594946337
.
@nyulambator: Ezert: „Besides the result itself, I am excited about our approach: We reach this capability level not via narrow, task-specific methodology, but by breaking new ground in general-purpose reinforcement learning and test-time compute scaling.” Plusz nem volt nekik leforditva Leanbe, hanem angolbol angolba dolgoztak.
Hiv.: @nyulambator:
Ekőször is túlbecsülöd a zemberek matematikai tudását. A zemberek eléggé jelentős része még csak nem is tud papíron osztani, mert ha tanulta is az iskolában, már régen elfelejtette, mivel nem volt rá szüksége. Tehát elég kézenfekvő, hogy a mostani MI matematikai tudása felülmúlja a zemberek (hasraütéses becslés) 99.9999%-ának matematikai tudását.
Aztán pedig alábecsülöd az általános emberi intelligenciát akkor, amikor azt mondod, hogy az MI (merthogy ugye AGI még nincs, nem is tudjuk, mikor lesz olyan, mitől lesz olyan, stb.) az emberiség 90%-nál okosabb. Itt az „okosságon” nyilván általános intelligenciát értve. Ez azért nincs így, mert az általános intelligencia nagyon összetett valami, sok(féle) képességgel, és annak csak egy nagyon pici részét teszi ki a matematikai tudás. A sakkozógépre se mondjuk, hogy intelligens, pedig legyőzi a világbajnokot.
Szerintem az MI-nek még sokat kell okosodnia, hogy AGI legyen belőle, és utolérje az átlagos zemberi intelligenciát.
Es egy kicsit offtopik: „Abel founder claims Meta offered $1.25 billion over four years to AI hire — ‘person still said no’ despite equivalent of $312 million yearly salary”
.
Nem kacsa.
@KennyOMG: Fordítva se biztos, szóval simán el tudok képzelni olyan modelt, ami az olimpiai feladatokon ügyes, de AGI-ként azonnal lebőg, amint a fradi-MTK meccsre terelődik a szó. De amit mondani próbáltam, hogy egy a legtöbb ember intelligenciájával minden téren a versenyt felvenni képes AGI még egáltalán nem biztos, hogy a matek olimpián is érmet nyerne, hiszen erre az emberek túlnyomó többsége sem képes.
Most ránéztem a feladatokra. Az emberiség túlnyomó többsége nem érmet, hanem pontot se kapna ezekre a feladatokra. Egyet se. Ha az élete múlna rajta, akkor se.
@nyulambator: Nyilvan, nemreg volt hir pl hogy a modellek, amik programozasban egyre jobbak, a sakkban, ami a logikai jatekok kozul nagyjabol a tic-tac-toe utan all egyszerusegi sorrendben, nem hogy nyerni nem kepesek, de 10-30% nemletezo mozgast csinalnak (pl futoval egyenesen lepnek, stb). De programozni ugyesebben programoznak, mint az elozo, sakkozni jobban sakkozo modellek.
.
Es felre ne erts, en mint laikus nem az LLM-ekben latom a jovot, illetve pontosabban fogalmazva ezekben nem latom a jovot.
@KennyOMG: FIDE mester szinten van a jelenlegi legjobb LLM alapú sakkprogram. a klasszikus AI-k közül is van, amelyik nem hallucinál lépést, de azért az furcsa lenne, ha nagyon jók lennének.
Szerintem nehéz itt tippelgetni mikor mi lesz. Ha úgy vesszük ez az „MI forradalom” (idézőjelben, mert ugye se nem MI, se nem forradalom) jóformán a semmiből jött (jó, nyilván akik ezzel foglalkoztak azoknak nem). Szerintem az emberek többségét (beleértve az IT szektort, de talán még az elméleti szakembereket is) erősen meglepte mekkorát szólt ez az egész. Persze most fókuszban van, de azt hiszem megint váratlanul fog jönni a nagyobb ugrás. Lehet nem a közeljövőben, lehet igen, de azt hiszem kissé kiszámíthatatlanul és nem előre jelezhető módon.
[x] De örültem a posztnak, mégha a jogi képviselő bele is köpött a levesbe, ami nem volt túl szép tőle.
[x] Jó sok téma is előkerült.
[x] Nagyon könnyen előkerülnek 1000- meg 10000-szeres szorzók output tokenekre. Kezdjük ott, hogy se input, se output oldalon nem nagy tokenszámokról beszélünk (IMO-feladatnál), ha 1000-1000-et mondok, akkor már símán meglehet, hogy fölé is lőttem. Ugye IMO-versenyben résztvenni, dedikált hardverrel, nem publikált finomhangolt modellel (kettővel hárommal előrébb járva a publikus modellekhez képest), véve ezek training költségét: pikk-pakk összejön a nagy tokenszorzó.
[x] A Google Deepmind ugye nem vett részt, ha jól értem az eddigieket. A Google Gemini Pro 2.5 általános célú LLM vett részt a vadiúj DeepThink-kel.
[x] Az OpenAI egyrészt nem vett részt hivatalosan az IMO-n. Nem is tudhat résztvenni, mert nincsenek meg a precíz keretei annak, hogyan lehet validálni egy IMO-aranyérmet. Más az, ha gyerekek egy nagy tanteremben papír és ceruzával dolgoznak és más az, ha blackbox LLM-ek csatáznak. Az nem kérdés, hogy az OpenAI elérte az IMO-aranyérmet, egyedül az a kérdés, hogy fair körülmények között-e (amit senki emberfia a Földön nem tud ellenőrizni és garantálni).
Tehát itt analógiában a Magnus Carlsen és Hans Niemann vezeték nélküli rezgő análgyöngyös csalásos sztorira kell gondolni (Ezt nem lehet se pro, se kontra bizonyítani AI-kra)
[x] „A „2025 végére itt AGI lesz” esélye valamennyivel csökkent.” nagyon finom disztingvált és így aztán helyes mondat, szvsz. Azt azért érdemes figyelembevenni, hogy (1) AGI van-e illetve (2) publikált AGI van-e az két külön dolog (hiszen vissza is tarthatják pl.: Sam Altmanék, ha pl.: már most van nekik). Mármint azon felül, hogy konkréten mi is az AGI. 😀 Csak azt tekintve is, hogy hadigazdasági aspektusa is van a témának.
[x] Lean és angol nyelv.
Igen angolul kapta az IMO-feladatokat az OpenAI LLM. Ez bizony qrva nagy dobás, időben nagyon gyorsan bekövetkezően. Erről beszélgettünk többet is itt a blogon. Arról beszélünk, hogy korábban hónapok kellettek IMO-feladatok Lean-be fordításába. A Riemann-sejtés formalizálása Lean-be is nagy projekt volt (100+KB Lean-kód a Githubon). Terence Tao is ezerrel Lean-ezik, mint hallhattuk a minapi 3 órás interjúban. Mindez azért előrevetít valamit az OpenAI képességekről. És az EpochAI FrontierMath stikli után Sam Altmanék is lehetnek óvatosabbak. Másik szál a 10 órás Atcoders 2025 versenyen (NP-nehéz feladattal), az OpenAI általános modell 9 órán meggyőzően vezetett, csak az utolsó 1 órában szorította második helyre egy célraorientáltan dolgozó, tapasztalt, hatékony kódoló ember.
[x] Sakk:
Stockfish 16, 3600 ÉLŐ (ennél nincs nagyobb jelenleg)
DeepMind AlphaZero 3500 ÉLŐ
GPT4 1000-1200 ÉLŐ
GPT4o 1400-1600 ÉLŐ
o3ALPHA/GPT5 1800-2000 ÉLŐ
És akkor külön kommentben, ha nem lenne elég, hogy mekkora fejlődésen ment keresztül az OpenAI (lásd fentebb), ittvan még az is, hogy, ha jól értem, megoldották a CoT-mérgeződés problémáját (értsd „tetszőlegesen” (?) fel tudják skálázni a CoT hosszát, mérgeződés veszélyének nullához való konvergálásával).
Ez annyira durva sztori, hogy külön nagy posztban kéne foglalkozni vele, egyáltalán rákeresni arxiv.org-on, van-e már publikált cikk belőle.
Az viszont már most látszik, hogy a Google DeepMind-nál esküdöztek (itt is beszéltük korábban), hogy a kínaiak által preferált Reinforcement Learning önmagában kevés az üdvösséghez. Nagyon úgy tűnik, hogy Sam Altmanék megtalálták a módját, hogy kellő mértékben megtámasszák, körbebástyázzák ezt az RL-dolgot.
Palkó elképesztő … ezt akár Kövér László is mondhatta volna.
Amúgy a környezetemben sokan szkeptikusak ezekkel a matolimpiás MI tesztekkel kapcsolatban. 99% tréning és 1% százalék „gondolkodás”.
@jotunder: Nem az a kerdes, hogy vannak-e jol sakkozo LLM-ek, hanem az, hogy azok a modellek, amik (peldul) programozasban jobban teljesitenek, ami elvileg egy logikai problema, ugyanazok (mondjuk) sakkban, ami egy abszolut logikus jatek, teljesen csecsemo szintre tudnak visszabutulni, es alkamasint szo szerint veletlenszeruen tologatnak veletlenul kivalasztott babukat.
.
Szerintem ez pontosan oda fut vissza, amit te mini-gpt cimen posztoltal regebben, es el voltal ajulva attol, hogy nullat is ad kovetkezo tokennek, mikozben olyan nem is volt. Hat valahogy igy, a hallucinacio alapjai, amit be lehet tamogatni otletes absztrakcios retegekkel meg szofisztikalt if…then fakkal (lasd meg: reinforced learning esatobbi), de melyen legbelul ez tovabbra is ugyanaz marad, ami mindig is volt.
Hiv.: @csingiz:
Pontosan 398 db IMO-feladat van eddig (1980-ban nem volt verseny és volt 7 feladatos verseny is: így csak 66 versenyről beszélünk 1959-2025 között). Ez egyrészt ultrabrutál kevés a traininges betanításhoz. Csepp a tengerben a 100 milliárdos trainingkorpuszon belül. Másrészt az IMO feladatok nagyrésze egyedi kombinációt, újszerű trükköt igényelnek, amikhez kevés az LLM-es felidézés, még akkor is, ha létezhetnek családfa típusú feladatok (kvázi ugyanazzal a mögöttes trükk igényével).
Azaz azt gondolom, hogy az általános célú LLM-ekben ma már kőkemény gondolkodós matekozás is folyik és IMO-szinten már tavaly (Google Deepmind) óta nagyon érett az IMO-aranyérem. A baj „csak” annyi, analógiával élve, hogy az OpenAI durván túltolhatta a biciklit, például 100 méteres síkfutásnál mini-helikopter nem megengedett segédeszközként.
(Zárójel: ebben különböznek az IMO-feladatok a valódi tudományos életbeli matek problémáktól. Hiszen nem cél a diákokkal 50 oldalas feladatmegoldást csináltatni, mint mondjuk pont a Riemann-sejtésnél, ahol kvázi csak a sejtés kimondása is 50 oldal. Erről volt 2024 végén egy filozófikus vita matekosok között, hogy a sikeres IMO-megoldásból nem következik a valódi matekra felskálázás. Erről JT többet tudna mesélni)
A szkepticizmus megfejtése, szerintem, a grounding hiánya és a belőle fakadó hallucinálási problémák. De az agent érában ezeket egyre könnyebb, hatékonyabb kezelni, másrészt még mindig nincs a fasorban sem a valódi grounding (még matekben sem) és még így is jöhet össze IMO-aranyérem, feltételezve, hogy az OpenAI fair volt a nem hivatalos verseny során.
Hiv.: @KennyOMG:
Az alapfelvetés jogos (mi a rákért ennyire gyenge az általános LLM a sakkban). Hiszen egyszerű nyelv, mint a matek vagy programozás és bár vannak hallucinációk (szintén grounding hiánya miatt), de ezek kezelhetők lennének. Annál mindenképpen jobban, mint, hogy 1000 ÉLŐ legyen a teljesítményük (hogy még én is megverjem őket, azért az már nagyon gáz).
Azonban a megfejtés ott lehet, szvsz, hogy: a programozás LLM-kompatibilis → statikus, példázott, determinisztikus. Programozás LLM-esítéséhez nem kell világmodell és grounding, csak sok példány és jó pattern matching. Nagy létező korpusszal jól lehet tanítani és aztán ennek eredményét használni.
Na a sakknak hiába van nagy korpusza mert nem LLM-kompatibilis (egy végjátékban alig-alig párat léphetnek csak a játékosok). Mert sakkban már “gondolkodni kell”, pont mint az IMO-feladatoknál, és ez eddig nem volt megoldott. A nagy korpusz jótékony hatása nem terül szét a training során.
Na de majd most. Jön az OpenAI. És a fejünk felett lebegő O3Alpha pont ebben hozhat fejlődést, mind az IMO-matekos, mind a sakkos gondolkodás terén (jobb is a „kiprojektált” ÉLŐ-je: azért az idézőjel, mert ugye ezt még nem nagyon volt tér kimérni, ha jól gondolom. Bár semmi sem kizárt).
Az FB-AI Hírek csoportban most jelezték, hogy tegnap publikálódott, a DeepMind úgy lett IMO-aranyérmes, hogy az övét validálták. Vélhetőleg jobban ismerték a dörgést, mert régebb óta benne vannak az IMO-témában (is).
https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/
@tahonoli: OFF „1980-ban nem volt verseny” … én pont akkor voltam kerettag. azért rendeztek egy nemzetközi matematikai és egy fizika versenyt Finnországban (Aland szigetek), azt hiszem Krausz Ferenc akkor volt a fizikacsapatban, de nem emlékszem, hogy találkoztam volna vele.
Én az MI másfajta alkalmazásaira várok. Pl. ha megtanulna inget vasalni, remek köztársasági elnök lehetne, és még a felmenőit se kellene letagadnia. Ha előtte diákolimpián is nyer egy-két aranyat, az megbocsátható ifjúkori kilengés.
https://hvg.hu/tudomany/20250722_google-deepmind-gemini-mesterseges-intelligencia-nemzetkozi-matematikai-diakolimpia
Most akkor ha az OpenAI és a Gemini is aranyérmes eredményt ért el, hogy változtatja ez meg a „2025 végére itt AGI lesz” esélyére vonatkozó állítást?
Hiv.: @nyulambator:
Tüzijátékra, csinnadrattára, Telex-címlapra én nem fogadnék, de ettől még lehet.
Polymarketes fogadást nem tudom lehetne-e szervezni a témára, mert pont azért problémás ez, amit régóta feszegetek a magam részéről: az, hogy AGI/ASI az egy definiálatlan fogalom. Az, hogy lesz-e IMO-aranyérem 2025 év végére, arra lehet fogadni pro vagy kontra és ezt el lehet dönteni korrekten.
Én azt mondom régóta, hogy benne vagyunk a technológiai szingularitásban (lassan 3 éve) és az AGI már régóta megvan benchmarkok és az „ember közeli” minősítés miatt. Mondjuk evvel tök névtelenül, totál egyedül vagyok a világban. „Who the fuck cares?” 🙂
Ha szigorúbbra csavarjuk a mércét, akkor az IMO-arannyal, meg az AtCoder 2025 ezüstéremmel szintén megvan az AGI, „mindössze” annyi a probléma evvel, hogy ezek nem publikus LLM-modellekkel lehozott eredmények: tehát van AGI, csak nem publikus AGI.
Sam Altman 2025 végére ígért AGI-t, ha jól emlékszem: nagyot nem kockáztatott evvel az állítással.
Egy definiálatlan fogalmon meg vég nélkül lehet pro és kontra vitatkozni a világban. Ezt lekövetni gusztus kérdése, én biztos kihagyom. Számomra az jelent földrengés jellegű információt, hogy angol szabad szöveggel adták be a feladatokat az LLM-nek. (Állítólag egyébként már Google Deepmind/Gemini DeepThinknek is, nemcsak az OpenAI modellnek)
PS: nagyon jó volt a HVG-s cikk, lehetett a sorok között olvasni….
Lehet, hogy az én hibám, de a második bekezdés teljesen értelmezhetetlen a számomra. Az utolsó „Grok4-nél”, ez egy hasonlítás (de akkor mi a 6000-szerese a Grok4 §500-jának? Az ilyen nyelvi modellek költsége, pld a Grok4 $500-ja?), vagy ez birtokos rag (és akkor a Grok4 $500-ja a 6000-szerese a kurva drága nyelvi modelleknek)? Vagy csak arról van szó, hogy a poszt által tényként írt Grok4 $500 valójában nem lehet igaz, a valóság ennek 6000-szerese, szóval amolyan felelőtlen krimiként kell olvasni a posztot?
Palkó gondolatait pozitívan is lehetne olvasni: azt magyarázza el, hogy az AI nem valami zagyva humbug, asztrológia, speciális magyar hagyomány, hanem kőkemény matek. Csak a következtetés megfogalmazása kicsit suta nyelvileg. Úgy tűnik, mintha nem azt mondaná, hogy a matek oktatásra és kutatásra fordítjuk ezentúl a GDP 2%-át, pedig azt akarta mondani.
@nyulambator: : @ipartelep: @KennyOMG: @tahonoli: Én egy viszonylag sikeres matematikusnak számítok most, de anno az olimpiai csapatba bejutni se volt soha esélyem se, nem voltam annyira se okos, se képzett. Biztos lehet azt mondani, hogy valamifajta matematikai intelligenciám van a számítási kapacitáson túl, de, hogy ez egy LLM által tanulható humbug, vagy valódi tudományos intelligencia, azt nem tudom.
Mindenesetre, ha az AI most el tud érni az IMO-n aranyérmet, ami az emberiség matematikai képességeinek kb felső 1 / 100 000-edje (67 aranyérmes volt; mondjuk, hogy 1000-en képesek rá a világon a korcsoportban; mondjuk hogy 8*10^9 ember 1/80-ad részéről beszélünk), akkor elképzelhető, hogy nemsokára elérünk a felső 10^{-10}-hez is, ami sokkal magasabb szint, mint Isaac Newton vagy Albert Einstein vagy Terry Tao, mondjuk. És ez egy konzisztens számítási kapacitás, arra állítod rá, amire akarod, nem arra, amit ő akar csinálni, de ha megkéred, hogy ő találjon ki valami érdekeset, olyat, ami Terry Taónak vagy Novák Katalinnak vagy Miles Davisnek tetszik (három véletlenül választott konkrét ember), akkor azt is megcsinálja. Nem hiszem, hogy lenne olyan kérdés, ami érdekli az embereket (isten, szex, közjólét, jazz, foci, you name it), és ne tudna sokkal jobbat csinálni, mint amit eddig bárki ember, vagy a természet maga. Persze, a matek meg a szerelem meg a művészet is egészen különleges, törékeny, egyedi, gondoljuk, de a lófaszt az, attól tartok.
Hiv.: @Mister Gumpy:
Érdekes és fontos gondolat, megérdemelhet egy alaposabb vitát.
Én onnan indulnék, hogy ha már az AI-t például IMO-aranyérmekhez hasonlítjuk, akkor ezek a feladatok valóban megoldhatók volnának csupán szorzással, osztással és függvényekkel, múltbéli adatok alapján?
A szorzás osztás tetszőleges mélységű alkalmazásának lehetnek-e etikai vonzatai (mint az AI-nek)?
A baj nem a leegyszerűsítő hangütéssel van — az AI-nak valóban van matematikai alapja, és jó lenne, ha ez nem tűnne misztikumnak a laikus számára.
Csakhogy itt nem egy kommentelő, hanem STEM akadémikus Palkovics fogalmaz, aki a magyar AI-stratégia intézményes arca (sok milliárdnyi közpénzzel a „zsebében”).
Ez már nem egy „magánvélemény a klubban” (forum.index.hu-n), hanem irányadó nyilvános kommunikáció, ami hosszú távon formálhatja a közgondolkodást.
Egy dolog közérthetően magyarázni, és más dolog fogalmilag elhazudni azt, hogy a mesterséges intelligencia nem egyszerűen matek (és bitek sorozata), hanem:
[a] statisztika és optimalizáció,
[b] modellek tanulása torzított világképből,
[c] predikciók következménykezelése,
[d] validáció és generalizáció közötti feszültség,
[e] és egy sor társadalmi, etikai, transzparencia- és kockázatkezelési kérdés.
És akkor a világmodellről, groundingról egy szót sem szóltam még.
Ha a „szorzás-összeadás-függvény” a teljes AI, akkor kérdés: milyen gondolati térbe jut el a jövő magyar közszereplője vagy vállalati döntéshozója, aki ezen a redukált pályán próbálja értelmezni az MI-t?
Nem lesz-e belőle önmagát megerősítő félreértés, ahol a leegyszerűsítés termeli újra a stratégiai hozzá nem értést?
@tahonoli: Nem vagyok biztos benne, hogy a kormányban van 5 olyan ember, aki legalább közelítőleg jó meghatározást tudna mondani arra, hogy függvény. Ezen a bázison kell értelmezni Palkovicsot. A megismerhető matematika az átlagember számára az egy ismeretlenes egyenletnél ér véget. A másodfokú egyenlet megoldóképlete az a misztikum, amit már csak a kiválasztottak tudnak befogadni.
Hiv.: @Mister Gumpy:
Nem biztos, hogy pontosan értem amit írsz, de érdekesnek tűnik. Lerövidítve, és leegyszerűsítve, mintha két állításod lenne: (1) Az intelligencia (okosság) a számítási kapacitás, vagy „matematikai képesség” függvénye. (2) Az elég nagy számítási kapacitás szinte bármit meg tud csinálni, ki tudja tágítani az emberi horizontot, akár a nem ismert területekre is.
Mind a kettőben lehet valami, de egyik sem ilyen egyszerű, vagy egyenesvonalú. Az (1) re azt mondható, hogy az intelligencia/okosság mindenképpen valami összetett, komplex képesség, aminek csak egy összetevője lehet a „számítási kapacitás”. Egyebek is kellenek még oda, és még nem is tudjuk részleteiben, hogy micsodák. Mindenből több? Vagy mindenféléből több? Vagy nagyon fontosak az arányok is, a kiegyensúlyozás, hogy aztán a mennyiségekből valami minőség álljon össze, és ne valami moslék. De a dolog mindenképpen összetettebb annál, mintsem hogy csak „számítási kapacitással” el lehetne intézni.
A (2)-re az mondható, hogy talán, meg a fene tudja. Itt ugye egyszerre két dologról van szó. Az egyik az, hogy új dolgokat hogyan lehet felfedezni/feltalálni, ill megcsinálni. Az biztos, hogy ha nem az analitikus dolgok (matematika, és logika) feltalálásáról van szó, hanem a külvilág felfedezéséről (márpedig itt ebben a pontban most leginkább erről van szó), akkor oda önmagában nem elég sem a nagyon nagy „számítási kapacitás”, sem az annál még sokkal komplexebb „okosság”. Oda az kell, hogy a versenyző, nagyon élénk interakcióban legyen a külvilággal, attól rendkívül sok információt kapjon, és ezeket jól dolgozza fel. Ha ez nincs, akkor a számítási kapacitásával elmehet a sóhivatalba. Ha meg megvan, akkor tényleg kitágulnak a határok, és ha nagyon okos, akkor sok mindent meg tud csinálni.
No de a másik dolog az, hogy amit megcsinálna, az vajon a te szavaddal: tetszene-e az embereknek? Ez a része teljesen bizonytalan, és attól függ, hogy micsoda az, amit csinál, hogy az a dolog mennyire objektív, vagy szubjektív. Példát mondok: „objektív jó” (sok minden más között) az, ami növeli az emberek élethosszát, és életminőségét. Erre mindenki azt mondaná, hogy fasza, okés, jöhet. Meg tud ilyet csinálni egy nagyon okos MI (ha akar)? Nyilván. És szubjektív jó pl. az megint csak a te példáddal, hogy Miles Davis, Bitches Brew, vagy Kind of Blue c. lemeze a jobb? Ugye, ezek különböző műfajok, és kinek hogy. Hogy kinek melyik tetszik, az azért szubjektív, mert nem valamiféle legalábbis közvetlen tények határozzák azt meg, hanem a személyes szocializáció. Ezért itt eléggé meddő kérdés lenne az, hogy a nagyon okos MI tud-e jobb zenét csinálni, mint Miles Davis (vagy a King Crimson, vagy a National Health). Kinek hogy…
Mindenesetre az biztos, hogy mind a kettőben (a pontokban, amiket tárgyaltam) nagyon nagy perspektíva van, rendkívül izgalmasak. Nem csak az a része, hogy a nagyon okos MI hogyan fogja megváltoztatni az emberiség életét (ha akarja, és ha el nem basszuk), hanem engem pl. az is nagyon érdekelne, hogy mi lehet jobb zene (nekem) a Soft Machine: Third c. lemezénél. Ha az MI (a majdani nagyon okos) annál jobbat csinál, akkor azt megsüvegelem.
Hiv.: @ipartelep:
Hogy lényegi kérdéseket feszegessünk, Mike Oldfield már csapattag volt a Soft Machine-ban, Third album idejében? 😀
@Mister Gumpy: kicsit átírtam. ezer token előállítása 80 dollárba kerülhetett a Grok-4-nek. ez egy becslés, honnan tudhatná pontosan.
Hiv.: @tahonoli:
Nem, nem, Mike Oldfield soha nem volt tagja a Soft Machine-nek. Annyi köze volt a Soft Machine-hez, hogy A SM-ből a 4. lemez után kivált, majd a Matching Mole-t megalapító, majd a 4. emeleti ablakon kieső, és megbénuló, majd a szerintem minden idők egyik legjobb progrock lemezét, a Rock Bottom-ot elkövető Robert Wyatt említett lemezének 6. számában gitározott kicsit. Ezenkívül a SM-ból korábban kivált Kevin Ayers zenekarában is játszott, de direktben soha nem volt tagja a SM-nek. De ezek persze akkoriban haverok voltak, keresztbe-kasul ismerték egymást., és végül is, félig-meddig Mike Oldfield is a procrock Canterbury-nek nevetett alműfajába tartozott.
Morfondíroztok itt a tudomány(ok) meg a játékok kapcsán, holott az AI-nak nevezett izét értelemszerűen elsősorban katonai feladatokra fogják bevetni/használni, illetve választói/tömegmanipulációs célokra (lásd Cambridge Analytica + Brexit etc.).
Minden más csak cizella & melléktermék leszen.
(Egészen addig, amíg – szokásos módon – meg nem szalad valamelyik gépi rendszer evolúciója, mert onnan zokni az emberiségnek. Épp ezért szakítsuk le minden óra csokiját, én aszondom.)
@labrys: Nekem matematikusként igen érdekes volt az Oppenheimer film. Ott ugye nem volt annyira világos, hogy a fizika volna a „csak melléktermék”. Most is lehet (kis valószínűsége van, de lehet), hogy pár matematikusnak kulcsszerepe lesz az emberiség jövőjében.
@jotunder: Az az igazság, nem tudom, hány token kell az IMO feladatsorhoz, emiatt a kommentbeli válaszod nem segít, de a poszt szövege, ami nekem még mindig nem magyarul van, most azt sejteti, hogy a Grok4-nek $500 volt az IMO, míg ha valami híg publikusat eresztesz rá, akkor az 10-20 centből csinálja meg, csak persze nagyon rosszul. Ez kb az állítás? (Kb logikusan hangzik. Persze egy ilyen fontos dologra, mint egy IMO, tőlem $50 000-t is rászánhat egy cég, az se sok. )
@ipartelep: @tahonoli: Ugye föltehetem, hogy az Asimov Alapítvány trilógia első öt kötetét (Alapítvány és Föld az ötödik) olvastátok már gimiben? Ha nem, akkor melegen ajánlom mindkettőtöknek, arról szól mind a 2000 oldal, kalandregényként, hogy a matek (konkrétabban a statisztikus fizika) hogyan használható történelemre és pszichológiára. Persze sok tízezer év múlva, ha már elég fejlettek lesznek ezek a tudományok. (A legérdekesebb konfliktus az 5 könyv alatt amúgy az, hogy az egyik tudós-közösség rosszul becsli meg egy másik tudományág fejlődési sebességét.)
Majd válaszolok külön is a kommentjeitekre, de ami közös, hogy szerintem végső soron minden visszavezethető valamilyen matekra, csak még nem értjük őket (a „minden”-t) eléggé. Ezt régen, gimis koromban, ideológiai alapon mondtam, mennyire fantasztikus a matek; most már, kiégett öregként, tapasztalati alapon is, nagyon sok mindent elmond rólunk, minden egyes emberről is, a statisztika. A kísérleti pszichológia gyerekcipőben jár, a legnagyobb úttörői, attól tartok, a Cambridge Analytica és társai.
Mindegy, a lényeg, hogy nem gondolom, hogy egyszerű matekra, ember számára felfogható (nem elvégezhető, de felfogható mennyiségű) számítási kapacitással, most létező pszichológiai, neurobiológiai, közgázos módszerekkel, vissza lehetne vezetni igazán lényeges dolgokat. De attól tartok, hogy a felfoghatón túl csak egy-két nagyságrenddel nagyobb kapacitással, pár év múlva, már olyan dolgokat lehet létrehozni, amiktől istenélményünk, merevedésünk, akármink lesz.
Már évtizedekkel ezelőtt is, amikor az AI még nem volt napirenden, a legjobb barátaim hagytak cserben, azt mondván, hogy a Star Wars Episode III, meg az Avatar nézhető, sőt jó, filmek. Őnekik a CGI egy olyan látványszintet ütött meg a rajzfilm és a valóság között, ami működött, hihető volt, míg nekem ezek a legrosszabb kombinációi voltak a két világnak. Mindenki máshogy működik, de senki sem működik NAGYON különlegesen, vagy hát csak hét ember a Földön, de őket elengedheti a GAI.
Az nagyon furcsa, hogy a Spotify mennyire nem találja el, hogy én milyen zenét szerethetek, két év alatt kétszer tudott értelmes tippet adni, az egyik „Ezt a Thom Yorke lemezt mintha nem ismernéd”, a másik „Ezt a Jack deJohnette lemezt minta nem ismernéd” volt. Na jó, van még egy zenekar, Bremer/McCoy, akikről a Spotifytól tudok, és két számukat is el tudom viselni.
Hiv.: @Mister Gumpy:
Imádom a kommentjeidet. Elgondolkodtatóak, inspirálóak, analógiáid átélhetők.
Az Asimov-párhuzam nagyon kemény. 🙂 A pszichohistória nyilván lenyűgöző ötlet, és ha úgy nézzük, ma is sokan vágynak arra, hogy az AI olyan legyen, mint egy „aktualizált modern Seldon-terv”: modellezze, előrejelezze, irányítsa a világot. Viszont épp itt érzem a problémát is: a mai AI nem ilyen. Se nem konzisztens, se nem determinisztikus, se nem „tiszta matek”, pl.: black box effectek miatt. A valóságban az AI: adatokat torzító világképből tanul (akárhogy is végzi ezt perfektül), így aztán predikciókat torzított valóságra alkalmaz, és az eredményei nem reprodukálható igazságok, hanem valószínűségi szimulációk (világmodell és grounding hiányában többek közt).
Palkovics mondata engem nem azért zavar, mert „matekos”, hanem mert az AI komplexitását úgy fordítja le egyszerű matekra, hogy elhagyja az értelmezés, következmény, torzítás és kockázat dimenzióit — és ezek nélkül az MI nem mérnöki eszköz, hanem illúziógyár, ami ellen én személy szerint „lázadok”. :D:D:D:D
A Spotify példád nagyon is rímel erre: ott is egy redukált modell próbál meg téged megérteni, több-kevesebb sikerrel. És akkor jön a kérdés, hogy „Palkovics evangéliuma” alapján: mihez kezdünk, amikor az MI nem ért meg minket — és mégis dönt rólunk?
Ultrabrutál durva cikk/poszt Gary Marcuséktól, FB-AI Hírek csoportnak köszönhető link kapcsán.
Elnézést kérek előre is a matekosoktól, hogy kéretlenül és pofátlanul beleokoskodok a témába.
(1) Mégis mik ezek a túlzott elvárások?
Mi ez a feszkó, hogy azonnal publikáljon az OpenAI?
Mióta kell kutatási eredményt, mondhatni eredmény előtt publikálni? Ráadásul AGI-nál, geostratégiai, hadigazdasági kapacitási okok tudhatóan nehezítik a publikálási pályát.
Mit számít a költség, hogy 100 USD, vagy 1000 USD?
Mi az, hogy extrapolálva miért nem bizonyította már be az AI a Riemann-sejtést, csak valami „ócskaságot” még 1996-ban?
Mi az, hogy PR, meg médiahack? (Nyilván értem, hogy az OpenAI nagyon gusztustalanul járt el az IMO-val)
Miért nem lehet örülni, hogy az AI egyedül ekkora előrelépést tett. Vagy pláne matekosokkal human-in-the-loop-ban mekkora perspketívák lehetnek?
Miért baj, ha az AI később lesz kreatív, de már most hasznos partner a matekban, „not replacing, but augmenting” narratíva jegyében?
(2) Az jogos, ha védhetetlen manipuláció révén ömlik majd esélyesen tőke az LLM-ekbe, a fékezett habzású IMO-aranyérmek nyomán, a matematikusok kárára. Illuziógenerálásos „research-washing” és társai, itt perzselnek a nyakunkon.
(3) Harmadfelöl én érzek némi pánikos, hisztériageneráló identitásválságot a matematikusoknál (cinikus szarkazmus süt a 60+ kommentből). Kvázi, aki most hiszterizálódik, valójában már elhitte az AGI narratívát? Ha nem hinné el, nem pánikolna, nem? 🙂 Nyilván az egész nem csoda, abszolút emberi. És ezt a fájdalmat sokan élik át manapság, a matekosokon kívül is.
(4) Óriási dolognak tartom a magam részéről, hogy
[x] Általános célú LLM-ekről beszélünk, nem célgépről (sakknál nem mindegy, hogy Stockfish 16, vagy GPT 4.1)
[x] Természetes nyelven közlödtek az AI-jal az IMO-feladatok. Nálam a csoda kategóriája, hogy az AI hatból ötször nem tévedt el az erdőbe, feladatfelfejtés során. Ez analógiában olyan, mintha egy külföldi sakkozótól azt kérnéd, hogy egy rejtvényes szöveg alapján rekonstruálja a sakktáblát, értse meg, hogy mattot kell adni három lépésből, és ne csak játszon egyet, hanem magyarázza is el, miért az a legjobb lépés – mindezt úgy, hogy a szöveg kicsit homályos , és még a bábu nevét sem mindig pontosan írja le.
[x] Túl kicsi IMO-korpusz miatt kell gondolkodás, nem elég a síma CoT. Szó nincs statikus tanulásról, dinamikus gondolkodás, következtetés van.
[x] Így aztán a nyelvi feladatmegértés + stratégia + proof generation hármasa vadonatúj minőség. Új IMO-feladatok, nulla prompttrükkel az nagyon nem trivialitás.
[x] Mindezt úgy, hogy nincs világmodell, grounding. Kvázi a mondásbeli majom dobálgatja a számokat és betűket, majd kiesik a végén az IMO-aranyérem.
[x] A DeepMind / Gemini (DeepThink): Implicit world-model planning, sketch-level planning, self-consistency tuning, dinamikus koherenciával dolgozott. Az OpenAI: új technikák a CoT lánc mélyítésére, a mérgeződés ellenében. Skálázott tesztidős számításokkal operált végig. Mindezt nulláról zöldmezősen, röptiben, elsőre csinálta meg. Vegyük észre, hogy a Google anti RL+CoT stratégiát alkalmazott. Míg az OpenAI a kínaiakkal párhuzamosan az RL+CoT mellett tette le a voksát. És mindketten célt értek.
[x][x][x][x]
DeepMind and OpenAI achieve IMO Gold. What does it all mean?
What we know, what we would like to know, and what it may take years to know
https://garymarcus.substack.com/p/deepmind-and-openai-achieve-imo-gold
@Mister Gumpy:, @tahonoli:: azért az a régi kérdés jó kérdés, ami azt feszegeti, hogy egyáltalán létezik-e – objektív, valódi entitásnak megfeleltethető módon – a matematika? 🙂
Vagy az egész csak a
matematikusok csínyeaz emberi tudat inherens világértelmező-képességi korlátainak némiképp (Szent Gödel, imádkozz érettünk!) koherens rendszer(ek)be foglalási kísérlete.(Persze, még ha az utóbbira is szavazunk, az sem zárja ki valamiféle pszichohistória értelmes működtetésének lehetőségét, lévén az emberi – tömeges – viselkedés, ami nyilván nagyon emberi, valószínűleg elég jól modellezhető/manipulálható/előrejelezhető egy ugyancsak nagyon emberi eszköz, például a matematika segítségével.)
@tahonoli:
Ez azért is lehetetlen, mert az emberek, cégek, spekulánsok, politikai vezérek elolvassák, hogy mit mond a pszichohistorikus AI, majd direkt mást tesznek. Az emberek sajnos nem tudatlan atomok vagy bolygók.
@Grrr: Asimov is megírta, hogy a pszichohistória működésének alapfeltétele, hogy a népek ne tudjanak róla.
Ez ésszerű gondolat
Ha már beindult az IMO-aranyérem termelése a mai LLM-eknél :D, akkor szakítottam időt arra, hogy dr.Miskolczi Ferenc Klíma-/Üvegházelméletét, amit perdöntően a NASA-nál dolgozott ki 2005/6-ra, azaz lassan éppen 20 éve, hogyan kezeli a mai modern AI. Tud-e róla bármit, tud-e érvelni vele kapcsolatban pro- vagy kontra. Számomra meglepő lett a végeredmény, de símán lehet, hogy evvel egyedül vagyok.
Nyilván nem a termodinamikai kondenzátorfluxus hiperbolikusan transzcendens negatív integrálja felöl érdeklődtem a ChatGPT-nél, hanem próbáltam ott keresni fogásokat, ahol üzen a mának a Miskolczi modell, így 20 év eltelte után.
Nyolc darab AI-szimulált beszélgetést kértem a ChatGPT-től (61+ KB terjedelemben), a magam eszköztelen módján, erős korlátaim függvényében. Ez így sikerült. Valaki más majd jobb minőségben újragondolja. 😀
Share-elem a linket, hogy látszódjék, semmit nem nyúltam bele semelyik ponton. Ami itt olvasható az 100% vegytisztaságú AI. Érdemes lementeni, akit érdekel a téma, mert semmi garancia, hogy örök életre élni fog a share-link.
https://chatgpt.com/share/6884dbba-4a20-8012-a3a4-5813ddeca4bc
Minden napra jut durva AI-fejlemény. FB AI Híreken most került ki egy poszt, Reddit hír alapján.
* Tooliense csapata és az o4‑mini‑high + Crux ágensek. Reddit bejegyzések szerint a Tooliense csapata kifejlesztett egy Self‑Evolve IC‑RL rendszert, ami az o4‑mini‑high modellt használja. Ez az ügynökrendszer elérte az ~90 %-os átlagteljesítményt a 2025‑ös USAMO problémáin, szinte nulla kezdeti pontszámból kiindulva
* Ismeretes, hogy az egész framework (Crux) nyílt forráskódú, akár más LLM-ekre (model‑agnosztikusan) is rá lehet csatlakoztatni; GitHub‑on elérhető
* Levette mindenki? Az OpenAI és Google Deepmind zárt, nem publikált modellekkel nyert IMO-aranyat. Pár napra kijön egy Github-os open source repo, ugyanerre a problémára.
* A Github repoban van mp4 videó a TTLR-működésről. Ha jól értem ezt a TTLR-t, nulla/zéró alapról (aka cimkézetlen adatokkal) indulnak és Reinforcement Learninggel (konszenzust kergetve) oldanak meg matek feladatokat.. Ez a besza-behu minősített esete az olvasatomban így első ránézésre, már megint. Lassan át kell értékelni amit tudunk, sejtünk az RL-ről.
* Itt jegyezném meg, hogy az OpenAI IMO aranya is – egyébként drágának mondott – „Test‑Time Compute és Reinforcement Learning”-gel operált.
Az elég biztosnak látszik, hogy ezek közös tőről fakadnak, de hogy kinek volt előbb ez az ötlete, kit mit csinált egymás után, sorrendben, az egyelőre rejtélynek látszik.
* Van egy MOHS-mérés, ami alapján össze lehet vetni az IMO és USAMO feladatok nehézségi szintjét. Mindkettőnél nehezednek a feladatok, és a 6-feladat a legnehezebb. IMO-nál, idén, mind az OpenAI, mind a Google Deepmind elhasalt a 6.feladatnál. A 600 versenyzőből talán éppen hatan oldották meg hibátlanul.
Na most az IMO / USAMO 6.feladat 9,5-10M-es nehézségűek. A két verseny között az a különbség, hogy az USAMO már a 3.feladattól kezdve ilyen nehézségű, az IMO-nál, csak az 5.diktől.
A mostani AI által megoldott legnehezebb USAMO 6.feladat így hangzik magyarul:
* Legyen m és n két pozitív egész szám úgy, hogy m≥n. Van m darab különböző ízű cupcake (édesség/muffin), amelyek egy kör mentén vannak elrendezve, valamint n ember, akik szeretik a cupcake-eket.
Minden személy minden cupcake-re egy nemnegatív valós számot rendel hozzá, annak megfelelően, hogy mennyire kedveli az adott cupcake-et.
* Tegyük fel, hogy minden egyes személy P esetén lehetséges az m cupcake-et a körön n darab egymást követő cupcake-ekből álló csoportba osztani, úgy, hogy P minden egyes csoportban szereplő cupcake-ekre adott pontszámainak összege legalább 1.
Bizonyítsd be, hogy lehetséges az m cupcake-et úgy szétosztani a n ember között, hogy minden személy P legalább 1 összpontszámú cupcake-et kapjon a saját értékelése szerint.
A feladat lényege:
* Intuitív jelentés: a feladat azt vizsgálja, hogy ha mindenki külön-külön képes „megtalálni” magának a körön belül egy olyan elrendezést, amelyben elég „ízpont” van szétosztva, akkor vajon létezik-e egy közös elosztás, amely egyszerre kielégíti mind a n személyt — úgy, hogy senki nem marad éhes (azaz 1 alatt).
* A feladat mélyebb szerkezete: ez egy olyan típusú probléma, amely:
– a fair elosztás kérdését vizsgálja: elég jót kap-e mindenki a saját mércéje szerint,
– folytonos értékeket és egész számú objektumokat kombinál (valós pontszám vs diszkrét cupcake),
– a körkörösség miatt periodikus struktúrájú (nem lineáris intervallum, hanem zárt ív).
A kulcsgondolat: lokális „fedezetből” következtethetünk-e globális kioszthatóságra?
* Összefoglalás egy mondatban: ha mindenki látja a lehetőséget, hogy elég jót kapjon a körből (a saját szempontjai szerint), akkor létezik egy olyan valós kiosztás, ahol mindenki ténylegesen kap is elég jót – egyszerre, konfliktus nélkül.
Hiv.: @tahonoli:
* Ma reggelre kigyártottam egy konteót. Semmi felelősséget nem vállalok azért, ha legminimálisabban bármi köze is van a valósághoz. 😀
* Ha én vagyok Sam Altman és OpenAI, mennek el tőlem az emberek nagy pénzekért, például a Metához. Amihez biztos van köze annak, hogy autoriter sggfejnek látszom néha. Akkor (is) bizony megpróbálok profitálni, a lehető legnagyobb mértékben abból, hogy a legnagyobb (pénzes) felhasználó táborom van. Különösen fókuszálni fogok olyan témákban a szintentartás követelményének okán, amilyen a matek is (amiben a Google Deepmind több látványosat produkált az elmúlt hónapokban).
* Mik ezekhez az eszközök? Log-ok, kérdések, válaszok, webes keresések. Mindezt házon belüli felhasználó és egyéb profilozással megfejelve. És még biztos van más is, most legyen ennyi elég. Eleve csak egy konteóról beszélünk ugye. 😀
* OpenAI-n nagy a nyomás a GPT5 és O3 konzisztens nagy hatású egyesítésének irányába, mindezt megfejelve az AGI kontextussal. Miközben matekből az EpochAI FrontierMath stikli után lényegi fejlemény nem történt. Az is hónapokkal ezelőtt, tavaly év végén.
* Az én konteóm az, hogy ez a mostani TTLR-es – egyébként bizonyíthatatlanul, de szerintem kínai gyökerű Crux, Self‑Evolve IC‑RL agent-rendszer -, a logokból vélhetően kimutathatóan, NEM előzmény nélküli gondolat. Főleg, hogy az o4-mini-high van ugye a középpontjában. Ha nem előzmény nélküli, és tényleg van releváns nyom a logokban, akkor az bizony rekonstruálható is tud lenni az OpenAI számára. Márpedig az OpenAI tudhatóan és bizonyíthatóan TTLR-es cuccal operált az IMO 2025-ön, nem látszik, hogy a feltételezetten kínai módszertanra ortogonális vadiúj saját módszertant fejlesztettek ki zöldmezősen.
KONKLÚZIÓ: Ha ez igaz lenne, akkor a kínaiak, nagyon könnyen, gyorsan, olcsón, jól párhuzamosítottan, hatékonyan fejlesztenek. Előbb-utóbb eljöhet az a pillanat, amikor a kínaiak bezárják az open source vonalat, meg leszakadnak az OpenAI csöcsröl. Ha innen is nézzük a teljes sztorit, akkor a Google Deepmind nemcsak korrektebb volt IMO-konetxtusban, de ráadásul ortogonális is a kínai AI-módszerekre, több laufot adva a nyugatnak a nagy geopolitikai versenyben, miközben az OpenAI küzdhet az illuziók démonaival.
@tahonoli: És a bizonyítás azt is megmondta, hogy hogyan lehet ezt az elosztást megvalósítani vagy „csak” annyit, hogy létezik ilyen? Esetleg, hogy legalább hány különböző megoldásnak kell lennie, amik között aztán egyéb szempontok szerint lehet választani?
Hiv.: @Hottentotten…
Crux Self‑Evolve IC‑RL agent generálta a teljes bizonyítást és publikálta is, lásd a linket, formális levezetéssel, indukciós lépésekkel, Hall’s lemma-alapú algoritmussal és részletezett deletion‑induction érvekkel.
A bizonyítás nem csak létezésről beszél, hanem konkrét konstrukciót is ad:
(1) Pip nevű személy válaszát, és az ő n kör-intervallumát használják.
(2) Bipartite gráf építése: az n ember és Pip n árka között.
(3) Hall’s marriage lemma, majd iteratív „rossz halmaz” eltávolítás → végül perfect matching.
(4) A kiválasztott matching szerinti elosztás már konkrétan megfelel mindenkinek ≥ 1 ponttal.
(5) Az agent-rendszer a többiekre már indukcióval dolgozik: amikor eltűnik egy arc, merge-elik Quinn arcs-val, és az összpontszámot ellenőrzik, így biztosítva, hogy továbbra is kielégítő a végeredmény
Konklúzió: igen, van explicit algoritmus (matching + delete‑induction), nem pusztán létezés a bizonyításban.
Ugyan számszerű alsó- és felső korlát információt nem adnak a különféle elosztások számosságára. De implicit módon: legalább egy perfect matching létezik (amilyet az algoritmus előállít), illetve adott Pip-intervallumokkal vannak különböző Hall-kompatibilis match-ek. Az algoritmus során különböző „bad set” szakaszok eltávolítása változtathatja a gráf-struktúrát → ezért többféle matching is lehetséges, viszont sem konkrét szám, sem garancia arra, hogy pontosan k különböző elosztás létezik.
Közösségi megoldás:
https://artofproblemsolving.com/wiki/index.php/2025_USAMO_Problems/Problem_6
Crux Self‑Evolve IC‑RL agent megoldása:
https://github.com/Royaltyprogram/Crux/blob/main/2025USAMO/2025_USAMO_p6.pdf
Hiv.: @tahonoli:
Nyilván nem saját kútfőből vagyok okos, hanem a ChatGPT-t promptolgattam és ollóztam össze legolvashatóbbra a válaszait.
A HRM-ről kommenteltem egy hosszabbat Káncz Csabánál:
https://www.facebook.com/kancz.geopolitika/posts/pfbid0g5AjxA3ksW98HJxF3rAdY19qhDKFAjMcAPMSceiHwj3kfuQKxNKNB3GqXv6522ugl?comment_id=1072424324870120&__cft__%5B0%5D=AZVWMScNaRwKxOkGKEloGT_LxNesXklRmnaDL5eKk9qlAjYgHEmS920pXhy7jRJaKsl3cX1F77hznZtA0X0z46fFLqosYodpYLF8lTaABC5g0c90IvOLAVWvrJzQFlHE7F3PcIga4V5yaI5jk3wwq02Q1_MGLuklxK72S6ZqEbQBIQ&__tn__=R-R