Szélhámosság-e a hálózatelmélet?
Eredeti szerző: jotunder
Nem, nem hiszem, hogy a hálózatelmélet szélhámosság, de úgy gondolom, hogy itt lenne az ideje annak, hogy a tudományos közösség komolyabban kezd foglalkozni a hálózatelmélettel kapcsolatos kijelentésekkel.
Egy Aaron Clauset nevű kutató (tulajdonképpen maga is hálózatelmélész) és Ph.D diákja Anna Broido feltett egy cikket az arXiv-ra (ez a világ legnagyobb preprintszervere). A cikkben egy nagyjából ezer adathalmazt vizsgáltak meg, amelyekben különböző hálózatok (biológiai, szociális, technológiai) vannak leírva. Alapvető megállapításuk az, hogy ezen hálózatok töredéke, összesen 4 százaléka az, amire jó szívvel azt lehet mondani, hogy nagyjából skálafüggetlenek. Annak ellenére van ez így, hogy minden idők egyik legidézettebb dolgozatában Barabási és munkatársai azt állították, hogy a hálózatok nagy hányada skálafüggetlen.
A cikkről beszámolt a Quanta Magazin is, és ennek kapcsán kisebb vita alakult ki a Twitteren Barabási-Albert László és Aaron Clauset között. Egészen világosan látszik, hogy a hálózatelmélet alapító atyái közült hárman: Mark Newman, Steve Strogatz és Duncan Watts támogatják Clauset-t. (Newmannak van egy sokat idézett közös cikke Clauset-val, amelynek a témája hasonló a Broido-Clauset cikkhez). Alessandro Vespignaniról azt mondanám, hogy elemében van….
Megpróbálom összefoglalni a kételyeimet a hálózatelmélettel és különösen a skálafüggetlenség definíciójával kapcsolatban.
1. A skálafüggetlenség definíciója tisztázatlan, de alapvetően a fokszám approximatív “power-law” eloszlását jelenti. Ugyanakkor van bizonyos kísértés arra, hogy minden “heavy-tail ” fokszám eloszlású rendszert skálafüggetlennek nevezzenek. Abban is van némi igazság, hogy egy log-log diagramon aránylag sok heavy-tail eloszlás látszhat power-lawnak, különösen ha kicsit segítünk is neki. A lényeg az, hogy a fokszám-eloszlás szinte semmit sem mond egy gráfcsalád szerkezetéről. Egy Ito nevű japán számítógéptudós olyan totálisan skálafüggetlen hálózatokat konstruált és vizsgált meg, amelyek hipervégesek. Ez azt jelenti, hogy olyan messze vannak elemi tulajdonságaikban az erősen expandáló skálafüggetlen modellektől, amilyen messze csak lehetnek. Az ég és föld kategóriakülönbségről van szó.
2. Nagyon gyakran, amikor skála-független hálózatokról beszélnek, akkor valójában egy konkrét power-law családra a preferential-attachment hálózatokra gondolnak. Szó szerint azt történik, hogy a konkrét, egyszerűen generálható PA-hálózatra néznek, és közben nagyívű fejtegetéseket tesznek közzé skála-független hálózatokról, mintha a PA-nak valamiféle különös helyzete lenne a skála-független családban, és hát nincs neki. Az az igazság, hogy a PA nagyon könnyen vizsgálható, és érdekes tulajdonságokkal rendelkező hálózatcsalád. Azt sejtetik, hogy az összes hálózat a PA-hoz hasonló egyszerű metódussal jött létre. Ezt nem mondják ki, de sejtetik. Sőt, valójában ez a legfontosabb üzenete a Barabási-féle hálózatelméletnek.
3. A hálózatelmélet legklasszikusabb ígérete az volt, hogy az Internet skála-független. Ezzel szemben az Internet NEM skála-független. Pont. Mint azt Clauset-tól tudjuk az Internet ebben nincs egyedül. Nagyon nincs. Itt szeretném hozzátenni, hogy az elmúlt évtizedekben mindig volt egy hype a tudományos világban, és ezek a hype-ok egymásra épültek. Közvetlenül a katasztrófaelmélet bebukása után jöttek a fraktálok (Mandelbrot) majd a self-organizing criticality (Per Bak) és aztán skálafüggetlen hálózatok elmélete, ami jelen volt a Mandelbrot- és Bak- féle nyelvben is.
4. A hálózatelméletet nagyrészt fizikusok alapozták meg, akik egy szép, világos, egységes elméletet kerestek. A fizikusoknak ez a foglalkozásuk, szép, világos, egységes elmélet keresése. És amikor VAN egy szép, világos és egységes elmélet, akkor igen gyakran meg szokták találni. A relativitáselmélet egyszerűsége és pontossága szinte felfoghatatlan. A fizika félelmetes dolgokra tudja használni a matematikát. Minden arra mutat, hogy a matematika alkalmazhatóságának erős határai vannak a hálózatelméletben. Legalábbis a szép, világos, egységes keretek között.
5. Clauset és társai nem csak arra mutattak rá, hogy a valóságos hálózatok nem igazán skálafüggetlenek, hanem arra, hogy a hálózatoknak nincs egységes tudománya, legalábbis ma még nincs, és azok a módszerek, amelyekkel valódi tudást nyerhetünk ezekről a hálózatokról statisztikai jellegűek. Mégpedig a “tűrjük fel az inget és essünk neki egy excel file tisztításának” szintű hardcore statisztikai módszerek alkalmazásáról van szó. Ezek komoly dolgok, nagyon komoly dolgok, évekig készítenek fel rá embereket, de tiszta matematikai szempontból sokkal kevésbé vonzóak, mint egy két perc alatt leírható modell, amiről klasszikus kombinatorikai és valszám módszerekkel gyönyörű dolgokat lehet bebizonyítani, akár van közük a valósághoz, akár nem, és ugye kit érdekel a valóság.
A Clauset-Barabási féle twitter beszélgetésben Barabási olyan módszereket használt, hogy Gulyás Gergely megirigyelné (Barabási azért ezerszer okosabb, mint Gulyás Gergely, és itt hozzá kell tennem, hogy Barabási-Albert László példamutató módon viselkedett CEU-ügyben, nem gyávult be,az biztos, a tanítványai imádják, szóval emberileg nem olyan egyszerű ez az egész). Ez bizony egy sajátos válsághelyzet. Majdnem azt mondtam, hogy paradigmaváltásnak nézünk elébe, de én ilyet nem szoktam mondani. Az biztos, hogy eljött az ideje a komoly beszédnek a hálózatelmélettel kapcsolatban.
A twitteres eseményekre kérhetünk linket? Nem találom.
@Gattamelata lovasszobra 2: több thread is van, én erre gondoltam
twitter.com/barabasi/status/952920675592953856
@poszt: Paradigmaváltás, honnan? A matematikusok már korábban is eléggé kritizálták, most nem tudom megkeresni, de kb 2009-ben Willinger és még tsai jelentettek meg cikket a skálafüggetlen interenet mítoszáról (nyilván leginkább csak ezt a részt értettem belőle valamelyest), aztán 2011-ben Christakisék még határozottabn kritizálták stb., az előrejezethetőségről szóló dolgai Barabásinak pedig már leginkább csak mosolyt keltettek a társadalomtudományokban – márpedig ezek tíz évvel se voltak a Nagy Hálózetelméleti Paradigma kezdeti után, vagyis hol is volt itt a megszilárdult paradigma?
Nem inkább arról van szó, hogy egy erős heurisztikával bíró szemléleti eszköz (hálózatelmélet) egy amúgy kiváló és nagyon rendes ember (Barabási) vezérletével sok érdekes és hasznos belátáshoz vezetett, aztán megpróbált túlterjeszkedni a lehetséges hatókörén és paradigmává válni, de az már nem ment, például azért sem, mert az alapállításai is itt-ott problémásak?
Ha a paradigma terminust az eredeti értelmében használjuk akkor sztem itt nem használható, akkor inkább Lakatos versengő projektjei jobban illenek ide, de méginkább lehetne egy nagyon erős metafórának tekinteni a hálózatelméletet, ami sok jó dologhoz vezet el.
@fortin2: valójában többféle hálózatelmélet van, én a skála-függetlenségre alapozott hálózatelméletről beszélek. nem tudom mi az érdekes dolog, aminek a belátásához vezetett. ez egy ígéret. a megszilárdult paradigma az egyszerűen az volt, hogy a hálózatok skála-független jellegűek. a social networkok esetében emellett igen erős érvek is lehetnek, hiszen voltak bizonyos argumentumok amelyek miatt valóban erre lehetett következtetni. mondjuk a Facebook belépési hálózatáról gondolhatja az ember, hogy valamilyen PA mechanizmus van mögötte. de úgy tűnik a probléma magával az adatok kezelésével van. nem egyszerű megvizsgálni a hálózatokat, zajos és koszos az egész, lásd Clauset cikkét. fogalmam nincs, hogy mi maradna ebből az egészből, ha rendet vágnának benne. nem tudom kizárni, hogy valami értékes is nőhetne belőle, egyáltalán nem.
én most egy kicsit belefolytam ebbe a múlt héten egy workshopon, persze igyekeztem viselkedni, mert azért nem kell senkivel sem összeveszni. mondjuk úgy, elég kontroverzális ügyek vannak az “alkalmazzunk hardcore matematikát nagyon bonyolult hálózatokra” tematikában és hát nem Barabási van az élen a kontroverzalitásban…. nem tudom,
hol végződik az igazi tudomány és hol kezdődik a hype.
@fortin2: az internet skálafüggetlenségét a három Faloutsos testvér állította egy teljesen fals mérés alapján. ez a szerzők legidézettebb cikke, valamennyivel többen idézték mint a teljes magyar társadalomtudományt az elmúlt öt évben (lehet, hogy ez nem igaz, de nem lehet nagyon távol az igazságtól). egy teljesen fals állításról van szó, és nem a Doyle et. al. vette észre, ők csak írtak erről. a mai napig azzal reklámozzák a skálafüggetlenséget, hogy az Internet meg az Ezmegaz skálafüggetlen. és egyik sem az. az Internet nagyon nem az.
@jotunder: amennyire én látom a társadalomtudományokban a Barabási féle skálafüggetlenséget jobbára valóban a PA értelmében használják. A citációs hálózatokra például szerintem eléggé jól alkalmazható, legalább 1965 óta minden empirikus kutatás is alátámasztani látszik.
@harmadikszem: 1. ez nem igaz. már a 2007-es Clauset-Shalizi-Newman cikkben elmondták, hogy nem találtak erre bizonyítékot. 2. olyan nincs, hogy valaki PA-t “alkalmaz” egy valódi hálózatra. nincs is értelme. a citációs hálózat teljesen nyilvánvalóan nem hasonlíthat egy PA gráfra és ezt senki nem is állítja. a PA gráfok egyetlen tulajdonságára hasonlíthatna és az a skála-függetlenség. 3. még csak nem is ez a főirány ma a “hogyan csináljunk citation science-t” projektben.
Én csak azt nem értem, hogy mit jelentene, ha legalább egy bizonyos területen egy bizonyos közelítésben megállapítanánk, hogy a “valóságos” hálózatok skálafüggetlenek (azaz hatványeloszlást követnek a fokszámaik – nemcsak jótündér, hanem Barabási is ezt a definíciót használja már). Mi következne ebből? Mi érdekeset tudunk a skálafüggetlen gráfokról matematikailag?
Csak mellékesen: szerintem erre a posztra nem várható olyan sok hozzászólás, még akkor sem, ha kikerül az Index kezdőlapra…:-)
@Bogomil: pusztán a power-lawból semmi sem következik a gráfra nézvést. (itt nemcsak a power-lawról van szó, hanem arról is, hogy 2 és 3 közé esik a “power”). egymástól alapvetően különböző gráfoknak lehet hasonló fokszám eloszlása.
@jotunder: Akkor viszont azzal kellene foglalkozni, hogy leírják, milyen típusai vannak a power-lawnak eleget tévő gráfoknak, nem azt keresgélni, hogy hol vannak azoknak megfelelő “valós” hálózatok. Pl. ilyesmire számítanék: minden power-law gráf PA-val jön létre néhány kiinduló gráftípusból, stb. (Mintha amikor először olvastam valamit a témáról, Barabásiék kacérkodtak is ilyesmivel.) De nem látok mostanság ilyesféle – érdekes – tételeket.
@Bogomil: annak nincs értelme. egyszerűen minden lehetséges. bárki kézzel tud mindenféle faramuci power-law gráfokat csinálni. bármilyen önhasonlóság ilyesmihez vezet. éppen az nem triviális (Barabásiék csak beszéltek róla, de nem bizonyították be, Spencer, Tusnady, Bollobás, Riordan bizonyították), hogy a PA valóban power-law eloszlású.
érzésem szerint népszerűsíthető tudomány, több területen is a közmunkás kutató fantáziáját is megmozgató absztakció nemigen létezik egy kő egyszerű “minél nagyobb ez, annál nagyobb az” összefüggés nélkül. ezért a “pa” szerintem is a barabási jelenség mozgató rugója, és egy darabig még marad is, mert szerkezetileg alkalmas erre, olyan mint a newton törvény: kurva egyszerű és nagyon univerzális.
és a fizikusok (is) máshol is kitűnően elvannak azzal, hogy az átfogó, univerzális összefüggés absztrakt entitások közt áll fenn, a mérések értékelése ott sem egyszerű (lásd pl. a fénysebességnél gyorsabb neutrinók esetét, ahol évekbe tellett megtalálni a mérőeszköz hibáját, egyetlen mérés előkészítése kurva drága, sok idő, ember, eszköz, az értékelése egy elég nagy teória, és ott egy viszonylag nagy számítógépes programrendszer is – nautil.us/issue/24/error/the-data-that-threatened-to-break-physics ).
Akkor most bojkott, vagy nem bojkott?
A tudománynak mindig van néhány olyan határterülete, ahol a hatalmas hype miatt gyenge lábakon álló elméletek terjednek, amiket később cáfolni fognak…
@jotunder: a 2007-es cikk moderate supportról beszél a citációs hálózatokra mérve, ami egy egyébként eléggé kritikus cikk esetében nem egyenlő azzal, hogy nem találták bizonyítékát. Az új Barabási könyvben van sok más példa is, ami ennél erősebbet már, egyébként diszciplína függvénye is. A Price féle kutatások azt mutatták a hatvanas évek óta hogy a magas idézettségű szerzők száma sokkal lassabban nő, mint az egyébként közel exponenciálisan növő keveset citált szerzők száma, és ugyanez a különbség van a magas impakt faktoros (mondjuk SCI, SSCI Q1 indexált) illetve az “egyéb” folyóiratok száma között. Ez lefordítva az empíria nyelvére azt jelenti hogy a citációs univerzumba lépők sokkal nagyobb eséllyel fognak eleve sokat citált szerzőket citálni (és a a citációs Network ezen részéhez kapcsolódni), mint más, keveset citált (periferikus) szerzőket. Ugyanígy, a friss belépők (a hálózat igazán gyorsan szaporodó szögpontjai) elsősorban erős lapokra fognak hivatkozni és nem a frissekre. Szerintem ez egy matematikus számára sarlatánságnak tűnő módon, de mégis reálisan írja le azt, amiről egy absztrakt szinten a PA szól, és a saját kutatásaim például kivétel nélkül alátámasztják ezt a jelenséget. Természetesen ennek vajmi kevéssé vannak matematikai okai, sokkal inkább egynéhány tudományszociológiai törvényszerűség irányítja a folyamatokat.
@harmadikszem: itt pl mérték a PL-t a CN-re
physics.bu.edu/~redner/pubs/pdf/citation.pdf
@balmoral: Ez valami focis téma, nem? Háló meg ilyenek. Akkor bojkott.
@harmadikszem:
a PA egy random modell. ugyan miert gondoljuk azt, hogy pusztan a korabbi idezettseg vezerli a tovabbi idezettseget egy szuk tudomanyteruleten, es nem egy adott eredmenynek az eddigiektol teljesen fuggetlen RELEVANCIAJA. ha PA jellegu lenne a citacios graf (es nagyon nem az), akkor a minoseg egy random dolog lenne. ugyanis azt gondoljuk, azt kell gondolnunk, hogy a citaciok szama valamilyen kivulrol nehezen megfogalmazhato, de azert koherens minoseg fogalommal korrelal.
de ennel van kellemetlenebb hirem….
mit jelent az, hogy “exponencialisan novo keveset citalt szerzok”? eleve ilyet nem mondhatsz. az elso felteltel ugyanis az, hogyha Q(n,k) jeloli azon szerzok szamat, akiket az n-edik belepo szerzo idejen k-szor ideztek, akkor Q(n,k)/n konvergalni fog egy szamhoz, de legalabbis egy adott L(k) szam tizszerese es tizede kozott fog lebegni. az “exponencialisan novo keveset citalt szerzo ” azt jelenti, hogy ez a L(k) hatarertek exponencialisan cseng le. ertsd nincs heavy-tail!!!! a skala-fuggetlenseg eppen annak a FINOMITASA, hogy VAN heavy-tail ( a citacioknal esetleg tenyleg van, de meg azt sem olyan konnyu kis korpuszoknal biztonsaggal kijelenteni, ez a Clauset cikk vegebol is kiderul)
azt gondolom, hogy azt gondolod, hogy Barabási azt gondolja, hogy itt a network egy inherens és determinált tulajdonságáról van szó, amely nem is térhet el a PL-tól. Attól tartok ebben lehet valami, de szerintem Barabásinál ez egy tudománypolitikai húzás, sokkal eladhatóbba Network science ha úgy interpretáljuk, hogy ontológiailag van egy ilyen tulajdonsága a valódi Networköknek, és nincs mit tenni.
A tudománymetriában és különösen a tudományszociológiában viszont nem gondoljuk így, inkább arról van szó, hogy mindenféle nem-inherens tulajdonságok teszik a networköt olyanná, hogy többé-kevésbé adekvát rá az a minta amit a PA esetében látunk. Ezért írtam fent, hogy én azt hiszem tudományszociológiai tények teszik ilyenné a sci cit networköket, nem valamiféle meghatározott és módosíthatatlan absztrakt inherens feature.
Ezek közül a tudományszociológiai tények közül _egyik_ a minőség, valóban. De korántsem az egyetlen. Elég erős korrelációk vannak az affiliációval, az editorial board összetételével, a folyóirat citációs univerzumával stb, amire lehet anticipálni, és szoktak is. Ha igazad lenne, és a citációs érték egy az egyben megfelelne a minőségnek, akkor például ennek a posztodnak a tárgya is értelmetlen lenne, hiszen Barabási ma a világ egyik (ha nem A) legtöbbet citált szerzője, ezért a legjobb minőségű szerző is, tehát vele kapcsolatban a szélhámosság gyanúja fel sem merülhet(ne).
@harmadikszem: Barabasi relevans es kanonizalt szerzo. Fontosnak tuno, vagy fontosnak hitt dolgokrol beszel. Nem veletlenul lett o a Barabasi, nem egy szerencses ember egy preferential attachmentben…. Nem allitom, hogy kizarolag a minoseggel korrelal a magas idezettseg, de valamifele kanonizacioval egeszen biztosan korrelal, nem arrol van szo, hogy egy random processben o lett a lucky man.
megegyszer. megmertek a citacios networkoket es nem igazan skala-fuggetlenek, akkor ugye a kozeleben nem lehetnek a preferential attachmentnek. arrol van szo, hogy par evtizede, egyszeruen fogtak egy log-log diagramot es ranezesre azt mondtak, hogy ez olyan egyenes fele, tehat powerlaw. es hat amikor komolyabban elkezdtek merni, kiderult, hogy valojaban a log-normal jobban irja le neha, mint a powerlaw.
olyat, hogy a citacios network PA nem lehet mondani, nem is mondanak, es mostmar olyat sem mondanak, hogy scale-free.
az, hogy copy-paste-oljak az idezeteket teljesen megvaltoztat mindent, meg inkabb atalakitja a rendszert, ezt most kezdtek el kutatni, uj indexeket akarnak epiteni, amelyik probalja kizarni a copy-paste-ot. en nem hiszek a citation science-ban, de ha valakinek ez bejon, hat csinalja. csak csinalja jol.
@jotunder: szerintem nagyon érdekes terület, minél többet foglalkozik vele az ember annál inkább az. És szvsz annál távolabb kerül attól, hogy matematikailag leírható legyen. Nem lehet nem foglalkozni vele, hiszen ez alapján osztják az állásokat meg a granteket (nagy részben) tehát ez kivételesen egy olyan terület aminek hatása van az egész tudományra és ezen keresztül a társadalomra.
A kanonizációval egészen biztosan korrelál ezt senki nem vitatta tudtommal soha; azt azonban igen, hogy a kanonizáció bármiféle mérhető értelemben a minőséggel korrelálna. Ez hit kérdése, én nagyon erősen hiszek benne, hogy korrelál, de ezt nem lehet bizonyítani tekintettel arra hogy a minőséget igen sok helyen kénytelenek a citációs impakt alapján definiálni, és akkor ugye ez esetben ez egy tautológia.
Végül, ez megint csak területfüggő, szerintem a matematikában legalábbis a matematikusok meg tudják ítélni egy-egy cikk jelentőségét (nem a felfedezés hasznosultságát mondom, hanem pusztán matematikai szempontból vett jelentőségét). Ez minél távolabb megyünk az egzakt tudományoktól annál kevésbé megtehető. Szerintem a Derek Price például egy olyan dolgot kezdett el baszogatni aminek van valódi jelentősége. És nem tartom ilyennek például a Niklas Luhmann-t. Na mármost mindkettő erősen kanonizált, a Luhmann talán még jobban, és Európában nem tudsz elvégezni egy társadalomtudományi programot anélkül, hogy ne foglalkoznál vele, akkor pedig bizony a nebulók egy része szükségszerűen rá fog harapni, idézni fogja stb. És ez csak egy dinamika a sok közül.
@jotunder: + kis kiegészítés, nem igaz, hogy senki nem mondja a citációs networkokre hogy skálafüggetlenek. Barabási például most is azt mondja. A Network Science című 2016-os könyvében az y fokszámkitevőt 2.79-re számolja a CN-re, a skálafüggetlenség esetében ez az érték 2<y<3 tehát skálafüggetlennek mondja. Direkt utánanéztem hogy jól emlékeztem e.
Ha azóta revideálta ezt akkor persze tárgytalan, csak ez azért egy elég friss könyv, ráadásul ebből tanítják a Network science-t az egész világon.
@harmadikszem: nem, nem a Barabasi konyvebol tanitjak. sot, van olyan network science kurzus, ahol a Barabasi nevet nem is emlitik meg. ami talan nem egeszen helyes, de azert elofordul. Barabasi mindenrol azt mondja, hogy skalafuggetlen, most is kekeckedett Clauzet-val, de lathatoan ezt a partit el fogja vesziteni. errol szol a posztom.
nem arrol van szo, hogy Barabasi egy kokler, csak arrol, hogy szeret eroseket mondani a halozatelmeletrol.
a Barabasi konyvenek 5.4 es 5.5 fejezete mondja el, hogy miert skala-fuggetlen az altala Barabasi-Albert modelnek ( itt az Albert a Reka, de az biztos, hogy ezt joval Barabasi elott mar ismertek) nevezett PA model. egy matematikus szamara ez, mondjuk ugy… nem annyira meggyozo argumentum. vannak, akik ennel valamivel csunyabban fogalmaznak. Az 5.29-es formula log(n)-nel volt eredetileg publikalva, es mondjuk fizikusi-mernoki ertelemben tokmindegy.
barabasi.com/networksciencebook/chapter/5#degree-dynamics
@harmadikszem: ha tudnad, hogy egy 2.79-nek mennyire nincs ertelme ezeknel a korpuszoknal. 2.5 es 3 kozott nagyjabol minden ertek kijon, persze osszevissza kell tisztogatni az excel file-okat, es statisztikai modszerekkel sirnak ki egy erteket. errol mondja Clauset (es mar eleg regen), hogy ezt nem kellene eroltetni.
@harmadikszem: erdemes megnezni a konyvben a 9.2 reszben azt, amikor elmagyarazza, hogy mi az az NP-complete. amikor megmutattak alig hittem a szememnek. naaaa… ilyet nem irunk le egy tankonyvben.
@jotunder: nem a kurzusokat mondom hanem a PhD programokat és ott a Northeastern-en és a CEu-n is a Barabási könyvét használják. egyébként 2016-ban feltette a ppt-ket is amiket használ, de aztán levette (kicsit későn mert aki akarta az addigra már letöltötte, hehe).
Megnéztem a cikket amit idéztél meg az erről szóló újságcikket a vitáról és a twitteren is jól szórakoztam. Azt gondolom ez nincs lejátszva, messze még a vége, de jó hype volt a 2018-as netsci konferenciának az biztos. Ahhoz képest olvasni a twitter vitát, hogy mikről szoktak vitatkozni átlag magyar tanszékeken, azért sírhatnékom támad.
@jotunder: NP-teljesség 😀 😀 😀 oké, de szövegdobozban van, remélem ez enyhítő körülmény!
Nem tudom, mi az, hogy lejátszva. A matektól távolabb eső területeken úgy tudtam, hogy nem szokás elismerni, hogy valakinek igaza lenne a másikkal szemben egy elméleti állításban, sőt azt sem, hogy egyáltalán lenne olyan, hogy igazság. Mindenki publikál, jó esetben le is idézik egymást, aztán lesz valami uralkodó lokális nézet, valami ködös közvélemény-féleség meg más relatív tekintélyek nyilatkozatai alapján. Vagy nem így van?
Amúgy ismeri itt valaki a Russ Lyons féle történetet pontosan? Én csak sztorikat hallottam róla.
@harmadikszem: Ahol Barabási tanít, ott Barabási könyvét használják? Mintha szűk lenne a minta…
@jotunder: Sajnos van sok tudományterület, ahol a citációk jelentős része nem az adott cikk érdemeinek szól, hanem a szerző személyének. Sokan így akarnak jóindulatot vásárolni…
@Online Távmunkás: nem sok helyen van netsci phd nezz utana. Tudtommal o csinalta az elso kettot. Megkerulhetetlen figura.
@Strawdog: írtam róla posztot: orulunkvincent.blog.hu/2011/08/15/a_christakis_ugy
@Strawdog: Néha elég lassan ismerik el, hogy kinek van igaza, de azért a “hard” tudományokban a logika/bizonyítás (matek), vagy a mérések (fizika) azért előbb-utóbb helyreteszik a dolgokat.
Hogy néha elég lassan, arra egy sztori:
R. de Boer, The engineer and the scandal: A piece of science history, Springer, 2005.
Még a tudomány haladásáról egy érdekes cikk:
P. Azoulay, C. Fons-Rosen, J.S. Graff Zivin, Does science advance one funeral at a time? NBER Working Paper Series, 2015.
@szazharminchet: Egy Sokal nevű pasas (statisztikus fizikus) mesélte nekem, hogy mikor rendes fizikusok közé mennek konferenciára, és hoznak valami új eredményt, mindig az a reakció, hogy igen, persze, ezt már rég tudtuk, azért kösz hogy formalizáltad.
Egy idő után kissé megdühödött és legközelebb, mielőtt kimondta az eredményt, megszavaztatta a közönséget, hogy mit gondolnak, mi lesz a válasz. Vagy 80% rosszra szavazott. Mikor megmondta nekik, iszonyú dühös lett mindenki, hogy ez mennyire tudománytalan, övön aluli húzás volt.
Egy hortobágyi pásztortól megkérdezte egy botanikus: Ugye ezt a Festucetum vaginatae gyepet nagyon szeretik a birkák? Mire a pásztor bölcsen annyit mondott: Való!
@Strawdog: Alan Sokal? ő egyszer az egész bölcsésztársadalmat (in the whole world) magára haragította :))
@jotunder: Besokaltak tőle. (Bocs!)
@balmoral: en.wikipedia.org/wiki/Sokal_affair
meg weboldala is lett, akkora poen volt. hihetetlen, hogy sikerult neki.
@poszt: Amennyire én belelátok (nemigen), nekem úgy tűnik, hogy nem szélhámosság ez, csak pont olyan, mint a gráfos dolgok nagy része: matematika. Ergo van egy ilyen meg ilyen gráfunk, ezt meg ezt tudjuk róla mondani, aztán ha a valóságban is létezik olyan valami, ami kábé hasonlít erre a fajta gráfra, akkor jó, míg ha nem, hát akkor is jó. (És igen, tudom, hogy léteznek gráfalgoritmusok, Dijkstra, folyamproblémák etc., nem ezekről beszélek. A poszt sem ezekről beszél.)
Próbálom összerakni, mi van itt, és nagyjából ezt látom:
1) van egy matematikai kérdés, hogy a gráfokat célravezető-e azon keresztül jellemezni, hogy a fokszámuk power-law eloszlást követ vagy sem – úgy látom, egyértelmű, hogy nem célszerű, mert attól még más, fontos szempontból tökre eltérőek lehetnek egymástól
2) van egy tudománykommunikációs kérdés, hogy mennyire helyes a preferential attachment gráfokat összemosni azokkal a gráfokkal, amelyek fokszáma power-law eloszlást követ
3) van egy szociológiai-engineering-fizikai kérdés, hogy vajon a való életbeli hálózatok “többsége” hogyan néz ki – ha jól értem, Barabási azt sugallta, hogy ezek jellemzően preferential attachment gráfok, és ezért a fokszámuk power-law eloszlást követ
A 2) nyilván nem független a 3)-tól, hiszen ha a való életbeli hálózatok nagy része tényleg azért követ power law-t fokszámilag, mert preferential attachmenttel jön létre, akkor belefér az összemosás bizonyos kontextusokban (még akkor is, ha okos matematikusok sok fura gráfot ki bírnak találni, ami nem PA, és mégis power law).
Ha jól értem, most Barabási azért van igaziból bajban, mert kiderült, hogy:
a) a hálózatok többsége nem PA-módon szerveződik (persze hogy mit jelent a “többsége”, amikor tök más fajta hálózatokat nézünk, nem triviális)
b) bizonyos klasszikusan PA-módon szerveződőnek mondott hálózatokról (internet, citációk) kiderült, hogy mégse úgy szerveződnek
Őszintén szólva, én ezek közül egyiket se látom bajnak: az empirikus tudományok nagy része így működik, hogy X állít valamit tök újat, aztán több százan elkezdik vizsgálni, és kiderül, hogy amit X mondott, sok szempontból nincs pont úgy. De ettől még X nem követett el rosszat, és ő marad továbbra is ennek a kutatási ágnak az egyik kiindulópontja.
Szóval kicsi morális pánik szagot érzek.
@jan: azert egy lenyegeben teljesen elmeleti teruleten a “baj” szonak sincs nagyon ertelme. ugyan mi “baj” lehetne ebbol az egeszbol. mi az, hogy “rossz”? megis mennyire lehet rossz az, hogy valaki allit valamit egy aranylag absztrakt teruleten, amirol kesobb kiderul, hogy nem ugy van. ha ez valami kemenyebb technologiakozeli fizika lenne, vagy orvostudomany, az mas lenne, ez igy leginkabb az “erdekesseg “kategoriaba tartozik.
@jan: a citacios halozatokrol hol derult ki? A jt altal linkelt cikk moderate supportrol beszel barabasi 2016os konyve ugyancsak.
@jotunder: Egyetértek. Viszont szerintem amit Barabási állít, azért annyira nem absztrakt, vagy igen? Legalábbis nekem az jött le, hogy Barabási állításában nem az volt az igazán forradalmi, hogy bemutatta, hogy a PA algoritmussal szerveződő gráfok fokszáma power-law-t követ (ez egy absztrakt állítás), hanem hogy azt állította, hogy a való világbeli, jól ismert hálózatok többsége igen (ez viszont egy empirikus állítás).
Tehát, kicsit talán a saját hozzászólásomat is pontosítva, talán annyi történik, hogy Barabási elméletéről most kiderül, hogy nem “a Mindenség elmélete”, hanem csak “a Mindenség 5%-ának az elmélete”. Ami persze még mindig nem kevés, pláne, hogy ezt az egész field-et ő indította be, ha jól értem – az meg a dolgok velejárója, hogy a field-ek beindítóinak a nézeteiről kiderül, hogy nem mindenben voltak helytállóak. Chomsky ’70-es évekbeli nézeteit úgy ahogy vannak, már maga Chomsky se fogadja el egy az egyben, de ettől még ő alapította a generatív nyelvészetet.
@harmadikszem: Clauzet, Shalizi es Newman kimutatta, hogy a citacios halozatok fokszameloszlasa ugyanolyan kozel van a power-lawhoz, mint a lognormalhoz, vagy a Weibullhoz. ennel sokkal durvabb problema is van. Mostmar sokkal tobbet tudnak errol.
A PA-grafok expanderek, a valodi halozatok tipikusan nagyon nem azok. Tudod, hogy ez mit jelent? Hogyan mondhatod azt, hogy egy expandalo modell es egy kurvara nem expandalo modell az “majdnem ugyanaz”? (foleg, hogy meg az asszimptotikus fokszameloszlasuk is mas)
Olyan kicsik ezek a halozatok, hogy hulyere kell tisztogatni ahhoz, hogy az ember valamit is lasson beloluk (a nagyon nagy embereket pl. ki kell venni)
Egy grafnak nem lenyeges tulajdonsaga az asszimptotikus fokszameloszlasa. Semmit nem arul el rola. Semmit.
Annak, hogy 2.79-es faktor a citacios halozatokban annyira nincs ertelme, amennyire lehet. Tenyleg elhiszed, hogy kulonbozo citacios adatfile-okban UGYANAZT a konstanst merik? Ugyanabban a citacios fileben kulonbozo statisztikai modszerekkel (tisztitas nelkul semmi sem merheto) is mas konstanst mernek.
@jan: “bemutatta, hogy a PA algoritmussal szerveződő gráfok fokszáma power-law-t követ ” bovebben… nem mutatta meg. egy gondolatkiserletet mutatott ra. ez a gondolatkiserlet neha mukodik, neha nem. az atmero asszimptotikara pl. nem mukodott.
a valodi “bemutatas” Bollobas, Riordan, Spencer, Tusnady cikkben van leirva.
@jan: Az szerintem nyilvánvaló, hogy amit Barabási csinált, az nem matematikai elmélet; ahogy jótündér korábban írta, még azt sem ő bizonyította be, hogy a PA gráfok fokszámeloszlása a PL-t követi. Azt állította, hogy a PL (és/vagy) PA gráfok jól modelleznek bizonyos való világ beli hálózatokat (ami most részben hamisnak tűnik). Tulajdonképpen milyen nem-triviális állításokat tett a networkscience?
@jan: Barabasi “elmeletero”l az derul eppen ki, hogy nincs. Nincs elmelete a halozatoknak. Valoszinuleg sohasem lesz. Nem mindennek van elmelete. Vannak dolgok, amelyek osszeallnak, de nincs mogottuk egy darab egyseges szep elmelet, amit a fizikusok (mint a Barabasi) szeretnek. Az persze egyfajta valos tudas, hogy a halozatoknak nincs elmelete.
Nincs olyan valo vilagbeli halozat, amelyik valoban PA jellegu lenne. Olyanok vannak, nem tul sokan, sot kifejezetten kevesen, amelyek a PA halozatok egyik tulajdonsagara ti. a powerlaw fokszameloszlasra hajaznak.
Mondanal nekem egy olyan allitast, ami a PA-(BA)-tipusu halozatelmelet alkalmazasa a valo vilagra es 1. nem trivialis 2. nem teljesen teves?
@jotunder: a citation network nem ilyen bonyi sztem. A wos-bol szimpla java script alapu programozassal ki lehet venni az osszes adatot aztan gephivel vagy mas szoftverrel tobb millio nodeig tisztitas nelkul lehet szamolni. A vizualizacional szoktak tisztitani de ott is inkabb a kicsiket veszik ki mondjuk 5os citation (fokszam) alatt. Ez egy eleg egyszeru halozattipus es jo adatbazosok vannak hozza. Este linkelek mintat.
@harmadikszem: ne velem vitatkozz, hanem Clauset-val… a citacios networkokkel komoly problemaik voltak. irt rola. o csinalta a legkomolyabb statisztikai vizsgalatokat.
gondold meg, mekkora adatbazis kellene ahhoz, hogy te egy eloszlasra bekevel azt mondhasd, hogy 2.79.
100 a 2.79-edik hatvanyon az 380189.4
100 a 2.80-adik hatvanyon az 398107.3
100 a 3-adik hatvanyon 1000000
az a bizonyos C k^{-gamma} olyan ezekben a meresekben, hogy a C az egy tized es a tiz kozott lebeg. ergo semmilyen finomsagot nem merhetsz ki ilyen magassagon. ez van Clauset finom ironiaja mogott. ha valami ennyire vilagos, akkor talan nem kellene komoly detektivmunka az eszrevetelehez, plane ahhoz, hogy meg azutan se deruljon ki. Barabasi nem ert a matematikahoz. O egy fizikus.
de megegyszer…. a PA graf es a citacios grafok kozott dobbenetes strukturalis kulonbsegek vannak. ezek a legnagyobb kulonsegek, amelyek grafosztalyok kozott fellephetnek.
@jotunder: es az nem lehet hogy a barabasi metaforikusan hasznalja a grafok tulajdonsagaira a networkok tulajdonsagait tehat pl a pa alatt az empirikusan is merheto mate effektust erti?
@harmadikszem: az ugye vilagos, hogy nekem az lenne az erdekem, hogy minden ugy alakuljon, ahogy azt a barabasi eltervezte.
ezek az ugyek igen erosen az en vilagom fele konvergaltak, es talan egy kicsit konkretan felem is. ezek ugye nagy grafok, amelyek egyre inkabb hasonlitanak egymasra. a kommenteloink nem elhanyagolhato resze foglalkozik egyre nagyobb grafokkal, amelyek egyre jobban hasonlitanak egymasra. es ha tudnad, hogy miket kerdez ezekrol a grafokrol a barabasi. pont azt, amit a mifele nepek tudnak. most erre volt egy tokeletes pelda.
nincs nekem olyan szerencsem….