SzavazásE-könyvek a kínálatunkban...
KIT hírlevél évfolyamok2025
|
Könyvkalózkodás: a nagy MI-fejlesztők is előszeretettel használják a LibGent
Címkék: mesterséges intelligencia | kutatás + fejlesztés, k+f | innováció, szolgáltatásfejlesztés | adatbázis, elektronikus adatok elérése | kiadó(vállalat), kiadás | etika, fegyelmi kérdések |
A szerényen fizetett kutatók, oktatók szerte a világban előszeretettel gyűjtenek a munkájukhoz nélkülözhetetlen szakirodalmat olyan repozitóriumokból, ahol a feltöltött anyag jogtisztaságáról nem adnak az egyes művek mellé nagypecsétes igazolást - igaz, a használók közül nem is kér ilyet senki. Ezek a jelentős méretű gyűjtemények - amelyek közül a legnagyobb, de mindenképpen a legismertebb a legendás LibGen - különös megítélési kettősségben élik életüket. A nagy könyv- és tudományos folyóirat kiadók szemében ezek a könyvkalózok súlyosan veszélyeztetik, károsítják a világ tudományos publikációs iparát. Mások azonban - köztük a sokszor végletes mértékben kihasznált szerzők - egyfajta intellektuális Robin Hoodnak tekintik az ilyen könyves helyek üzemeltetőit, a tudomány szabadságharcosainak, és az emberi progresszió igazi támogatóinak. Anélkül, hogy egyik, vagy másik oldal pártjára, igazsága mellé állnánk, azt nyugodtan kijelenthetjük: a Globális Délnek nevezett fejlődő világ tudományos élete, köz- és felsőoktatása ma nem lenne ugyanaz ezek nélkül a tudományos kincsestárak nélkül.
Azonban nem csupán az intellektus szegénylegényei (és -leányai) fordulnak előszeretettel ezekhez a repozitóriumokhoz a munkájukhoz, fejlődésükhöz nélkülözhetetlen szakmai nyersanyagért. Ahogy az utóbbi időkben egyre-másra pattant ki, a dollár százmilliókkal kistafírozott gazdag és hatalmas technológiai óriások is előszeretettel dézsmálgatják a tudás és információ eme ingyenes éléskamráit. E mögött nyilván erős profitoptimalizálási törekvések is állhatnak, de ami egyértelműen erre a sajátos beszerzésre ösztönzi a nagy MI-fejlesztőket, az a még elérhető "szűz" adatkészletek rohamos fogyatkozása. Márpedig, ahogy az közismert még a laikusok számára is, az adat (méghozzá emberi ésszel szinte felfoghatatlan mennyiségű adat) nélkül lényegében aligha létezhetne a szédítő karriert befutó LLM-technika. A problémán egyelőre nem változtat érdemben számos ígéretes törekvés és fejlesztés, a radikálisan kisebb adatkészlettel is elboldoguló kis nyelvi modellektől a szintetikus tréningadat előállításon át a már meglevő nagymodelleken történő LLM-betanításig. Az illegális könyvrepozitóriumokból kinyert adatokon olyan csúcscégek nevelgették új modelljeiket, mint például a Facebook mögött álló Meta. Ahogy az azóta megindult szerzői jogi perek tanúsítják, a cég nagyon sikeres nyílt forrású nyelvi modellje, a Llama kiképzésében jelentős mértékben használt fel például a LibGen-től megszerezhető szakmai adatkészleteket. Jogi szakértők azt gyanítják, hogy az ilyen tréningadat-szerzési gyakorlat sokkal elterjedtebb, mint ahogy azt gondolnánk. A Zuckerberg-vállalkozás ilyen irányú gyakorlata csupán a jéghegy csúcsa. (ref.: MI Újság) |
![]() FeliratkozásA heti ingyenes KIT Hírlevelet megrendelheted a kit@gmconsulting.hu-ra írt "Megrendelés" tárgyú levéllel, név és intézmény megadásával, mellyel jelzed az Adatkezelési tájékoztatóban foglaltak elfogadását. A hírlevél lemondása: ugyanígy, de „Lemondás” tárgymegjelöléssel. KIT - hírcsokrok
Néhány tematikus gyűjtemény a lapból
HírlevélrőlA hírlevél hetente (júliusban, augusztusban kéthetente), térítésmentesen, csak elektronikus formában jelenik meg. A KIT nyomtatott példányai megtalálhatók a Könyvtörténeti és Könyvtártudományi Szakkönyvtárban is (Könyvtári Intézet, Budapest). A KIT tulajdonosa: GM Info Consulting Kft. |
impresszum | szerkesztők | észrevétel e portálról |