Keresés a KIT archivumában:  
Könyvtár Információ Társadalom
Heti hírlevél információs és könyvtári szakemberek számára - Szemlék, hírek, kommentárok    angol zászló english flag  

Könyvkalózkodás: a nagy MI-fejlesztők is előszeretettel használják a LibGent

A szerényen fizetett kutatók, oktatók szerte a világban előszeretettel gyűjtenek a munkájukhoz nélkülözhetetlen szakirodalmat olyan repozitóriumokból, ahol a feltöltött anyag jogtisztaságáról nem adnak az egyes művek mellé nagypecsétes igazolást - igaz, a használók közül nem is kér ilyet senki. Ezek a jelentős méretű gyűjtemények - amelyek közül a legnagyobb, de mindenképpen a legismertebb a legendás LibGen - különös megítélési kettősségben élik életüket. A nagy könyv- és tudományos folyóirat kiadók szemében ezek a könyvkalózok súlyosan veszélyeztetik, károsítják a világ tudományos publikációs iparát. Mások azonban - köztük a sokszor végletes mértékben kihasznált szerzők - egyfajta intellektuális Robin Hoodnak tekintik az ilyen könyves helyek üzemeltetőit, a tudomány szabadságharcosainak, és az emberi progresszió igazi támogatóinak. Anélkül, hogy egyik, vagy másik oldal pártjára, igazsága mellé állnánk, azt nyugodtan kijelenthetjük: a Globális Délnek nevezett fejlődő világ tudományos élete, köz- és felsőoktatása ma nem lenne ugyanaz ezek nélkül a tudományos kincsestárak nélkül.

Azonban nem csupán az intellektus szegénylegényei (és -leányai) fordulnak előszeretettel ezekhez a repozitóriumokhoz a munkájukhoz, fejlődésükhöz nélkülözhetetlen szakmai nyersanyagért. Ahogy az utóbbi időkben egyre-másra pattant ki, a dollár százmilliókkal kistafírozott gazdag és hatalmas technológiai óriások is előszeretettel dézsmálgatják a tudás és információ eme ingyenes éléskamráit. E mögött nyilván erős profitoptimalizálási törekvések is állhatnak, de ami egyértelműen erre a sajátos beszerzésre ösztönzi a nagy MI-fejlesztőket, az a még elérhető "szűz" adatkészletek rohamos fogyatkozása. Márpedig, ahogy az közismert még a laikusok számára is, az adat (méghozzá emberi ésszel szinte felfoghatatlan mennyiségű adat) nélkül lényegében aligha létezhetne a szédítő karriert befutó LLM-technika. A problémán egyelőre nem változtat érdemben számos ígéretes törekvés és fejlesztés, a radikálisan kisebb adatkészlettel is elboldoguló kis nyelvi modellektől a szintetikus tréningadat előállításon át a már meglevő nagymodelleken történő LLM-betanításig. Az illegális könyvrepozitóriumokból kinyert adatokon olyan csúcscégek nevelgették új modelljeiket, mint például a Facebook mögött álló Meta. Ahogy az azóta megindult szerzői jogi perek tanúsítják, a cég nagyon sikeres nyílt forrású nyelvi modellje, a Llama kiképzésében jelentős mértékben használt fel például a LibGen-től megszerezhető szakmai adatkészleteket. Jogi szakértők azt gyanítják, hogy az ilyen tréningadat-szerzési gyakorlat sokkal elterjedtebb, mint ahogy azt gondolnánk. A Zuckerberg-vállalkozás ilyen irányú gyakorlata csupán a jéghegy csúcsa. (ref.: MI Újság)

legyenek kit hírei saját honlapján

Feliratkozás

A heti ingyenes KIT Hírlevelet megrendelheted a kit@gmconsulting.hu-ra írt "Megrendelés" tárgyú levéllel, név és intézmény megadásával, mellyel jelzed az Adatkezelési tájékoztatóban foglaltak elfogadását.

A hírlevél lemondása: ugyanígy, de „Lemondás” tárgymegjelöléssel.




Hírlevélről

A hírlevél hetente (júliusban, augusztusban kéthetente), térítésmentesen, csak elektronikus formában jelenik meg. A KIT nyomtatott példányai megtalálhatók a Könyvtörténeti és Könyvtártudományi Szakkönyvtárban is (Könyvtári Intézet, Budapest).

A KIT-archívum tartalma:
Közel 28.000 hír, 2002-től
A KIT-et az EPA (Elektronikus Periodika Adatbázis) is archiválja.

A megrendelők száma kb.:
700 fő

Olvasói létszám:
kb. 1000 fő

Adatvédelem
A KIT szerkesztői a birtokukba kerülő használói adatokat bizalmasan kezelik, azt csak az eredetileg megjelölt célra használják, harmadik fél részére nem adják át. A használati adatokat csak az egyedi adatközlőket (ha tudomásukra jut) nem visszafejthető módon, összegezve teszik közzé. Pl.: összes olvasói létszám, vagy felmérés eredményeképpen: a KIT-olvasók x%-a vezető beosztású. A használói felmérésekben a válaszadás anonim.
A szerkesztők a KIT-tel kapcsolatos visszajelzéseket egymás között megbeszélik, és visszajeleznek a levélírónak.
Adatkezelési tájékoztató

A KIT tulajdonosa:

GM Info Consulting Kft.
www.gmconsulting.hu


impresszum | szerkesztők | észrevétel e portálról