Keresés a KIT archivumában:  
Könyvtár Információ Társadalom
Heti hírlevél információs és könyvtári szakemberek számára - Szemlék, hírek, kommentárok    angol zászló english flag  

A Kongresszusi Könyvtár crowdsourcing-gal (használóinak tudásával) tanítja a gépi tanulás eszközét (olvasóink szavazatára)

Megjelent egy riport a Kongresszusi Könyvtár gépi tanulással folytatott kezdeményezéséről. Egy projekt keretében a könyvtár innovatív részlege bevonta a használókat, hogy digitális gyűjteményének egy részét dolgozzák fel a gépi tanuló algoritmust is segítő formában.
A projekt (Humans-in-the-Loop, röviden HITL) végére egyúttal egy keretrendszer is elkészült a közösségi támogatást (crowdsourcing) használó gépi tanulásról. A módszertan kidolgozásába több szakértőt bevontak. Vizsgálták, milyen módon lehet a két területet összekötni. Ezáltal a használhatóságot, kereshetőséget fejleszteni és a felhasználókat jobban elkötelezni a digitális gyűjtemények mellett. A közzétett eredmények más könyvtárak és kulturális intézmények számára is használhatók.

A gépi tanulás segíthet feldolgozni az adatokat olyan mértékben, amire a szakértő csapatok nehezen lennének képesek a nagy mennyiségű adat miatt. De a dobozos piaci megoldások nem működtek, mert az emberi szakértelem fontos a kulturális örökség képeinek és szövegeinek elemzésekor. A gépek emberi tanítása viszont bevált a projektben.
Egyrészt a felhasználók összeállíthatják a tanuló algoritmus számára az adatokat. Másrészt korrigálhatják a gépi tanulás kezdeti eredményeit, amelyből az algoritmus szintén tanul. A fejlesztők három fontos megállapítást tettek a projektben:
- A felhasználóknak olyan tartalmat kell adni, amihez közel érzik magukat.
- A gyűjteményből kikerülő adatoknál figyelembe kell venni az adatvédelmi szempontokat.
- Olyan gyűjteményeket kell a közösséggel elemeztetni, amely széles körben elérhető. A folyamat más projektekben is használható lesz. Az eredményként felhasználható adatok a gyűjtemény felfedezhetőségét támogatják.

A gyűjteményválasztást szavazás előzte meg. Plusz egy workshopon sorra vették az elemzést végző felhasználók, az olvasók és a dokumentumkészítők előítéleteinek torzító hatásait is. Végül a mikrofilmről digitalizált, 15 államra kiterjedő, az egész 20. századot lefedő Telefonkönyv-gyűjteményt választották ki a közösségi elemzéshez. Ezt gyakran használják, például családfa- és jogi kutatáshoz. A csapat használati eseteket is kidolgozott, hogy a választható gyűjtemények közül a felhasználók mit és mi miatt fognak majd igénybe venni. Azaz: melyik éri majd meg a ráfordított erőforrást?
A gépi tanulás szempontjából előnyt jelentett, hogy a telefonkönyvek nagyrészt egységes formában jelentek meg. Az adatok elég strukturáltak a teszteléshez, viszont nem olyan bonyolultak, hogy ne lehetne befejezni. Az önkéntes csapatok azonosították az egyes információtípusokat, pl. üzleti csoportokat, hirdetéseket, a telefonos tippeket. Minden típusról leiratokat készítettek, hogy a gépi tanuló algoritmusnak mintát adjanak a feladat befejezéséhez. A teljes riport: link (ref.: Habók Lilla)

legyenek kit hírei saját honlapján

Feliratkozás

A heti ingyenes KIT Hírlevelet megrendelheted a kit@gmconsulting.hu-ra írt "Megrendelés" tárgyú levéllel, név és intézmény megadásával, mellyel jelzed az Adatkezelési tájékoztatóban foglaltak elfogadását.

A hírlevél lemondása: ugyanígy, de „Lemondás” tárgymegjelöléssel.




Hírlevélről

A hírlevél hetente (júliusban, augusztusban kéthetente), térítésmentesen, csak elektronikus formában jelenik meg. A KIT nyomtatott példányai megtalálhatók a Könyvtörténeti és Könyvtártudományi Szakkönyvtárban is (Könyvtári Intézet, Budapest).

A KIT-archívum tartalma:
Közel 28.000 hír, 2002-től
A KIT-et az EPA (Elektronikus Periodika Adatbázis) is archiválja.

A megrendelők száma kb.:
700 fő

Olvasói létszám:
kb. 1000 fő

Adatvédelem
A KIT szerkesztői a birtokukba kerülő használói adatokat bizalmasan kezelik, azt csak az eredetileg megjelölt célra használják, harmadik fél részére nem adják át. A használati adatokat csak az egyedi adatközlőket (ha tudomásukra jut) nem visszafejthető módon, összegezve teszik közzé. Pl.: összes olvasói létszám, vagy felmérés eredményeképpen: a KIT-olvasók x%-a vezető beosztású. A használói felmérésekben a válaszadás anonim.
A szerkesztők a KIT-tel kapcsolatos visszajelzéseket egymás között megbeszélik, és visszajeleznek a levélírónak.
Adatkezelési tájékoztató

A KIT tulajdonosa:

GM Info Consulting Kft.
www.gmconsulting.hu


impresszum | szerkesztők | észrevétel e portálról