Gigantikus szuperagy lesz az internet következő keresője?

Bitport2021.05.19.Cloud & big data

Keresni olyan lesz, mintha egy mindentudó könyvtárossal beszélgetnénk. De nem borítja fel, hanem megerősíti a világ rendjét, mert ezen is a Google dolgozik.

Több mint 20 éve megjelent egy cikk a Computer Networksben, amely egy új típusú keresőmotor működési elvét mutatta be. A cikket a Stanford két diákja jegyezte: Segey Brin és Larry Page. A szerzők azt ígérték, hogy keresőjük minden korábbi motornál hatékonyabban térképezi fel a internetet, hogy az online térben információt keresőknek releváns találatokat adjanak (a cikk itt érhető el PDF-ben).

Az ötleten épült fel a Google, és azóta is működik a Brin-Page páros PageRank nevű csodafegyvere, amely segít rangsorolni a felhasználó kérése szempontjából releváns oldalakat, tartalmakat.

Itt a folytatás – a Google-től

A közelmúltban azonban felmerült egy radikális újítási javaslat – írja a MIT Technology Review. Egy csapata a hipertexuális kapcsolatok vizsgálata helyett csupán egy mesterségesintelligencia-alapú nyelvi modellt használna mint Google BERT-je – amit egyébként a Google tavaly óta hivatalosan is használ a PageRank találtatainak pontosításához – vagy az OpenAI híres-hírhedt GPT-3-ja. A történet pikantériája, hogy az ötletet a Google Research kutatói publikálták az arXiv-on egy a szakirodalmi jegyzékkel együtt 12 oldalas tanulmányban [PDF].

Az elképzelés szerint az MI-alapú kereső is úgy működne mint egy rendkívül tájékozott könyvtáros: a felhasználó kérdéseket tesz fel neki, az MI pedig válaszol, ahogy teszi most például a digitális asszisztens is. Csak itt a válasz egy találati lista, ahogy a könyvtáros is sokszor csak orientál, ha a kérdés sem válaszolható meg egzaktul. A kutatók szerint a keresőmotorok az MI révén sokkal gyorsabbá válhatnak, és nem fog számukra nehézséget okozni az internetes információk robbanásszerű növekedése.

A Google-tanulmány egyik szerzője, Donald Metzler szerint az elmúlt húsz évben azért nem volt szükség a keresés újragondolására, mert az alaplogika (robotok indexelik az weblapokat, az algoritmusok rangsorolnak, és ez alapján jelenítenek meg találatot a felhasználónak) tökéletesen kielégítette az internetezők igényeit. Ma viszont a felhasználók nem listákat akarnak, hanem válaszokat a kérdéseikre. A jelenlegi technikák azonban arra már nem képesek, hogy több forrásból szintetizáljanak releváns választ. Metzler szerint ez olyan, mintha valaki egy hosszú olvasmányjegyzéket kapna az orvosától, akitől csupán tanácsot kért.

Ez lenne a internet szuperagya?

Metzlerék viszont a virtuális "orvost" szeretnék előállítani, amely több forrást feldolgozva természetes nyelven adja meg a kérdésre a választ, és összegyűjti azokat a hivatkozásokat, melyekből a választ szintetizálta. A leghatékonyabb MI-modellekkel – a GPT-3-mal is – egyelőre az a baj, hogy nem tartják nyilván a feldogozott forrásokat, így nem is ellenőrizhető, hogy megbízható információkat ad, vagy csak saját maga gyártotta hülyeségeket locsog.

A kutatók szerint itt lehetne megfogni a problémát: a jövőben a természetes nyelvi MI algoritmusokat úgy kellene tanítani, hogy a válaszoknál azt is ellenőrizni lehessen, milyen forrásokból dolgozott.

Egy brit kutató szerint a Google elképzelésében az az újdonság, hogy egyesítene minden olyan törekvést, ami eddig az internetes információk keresése kapcsán felmerült: képes lenne konkrét kérdésekre választ adni, több dokumentumot összefoglalni, információhalmazokat strukturálni. Ha jól belegondolunk, akkor Donald Metzlerék egy közepesen kreatív, de végtelen memóriával rendelkező szuperagyat képzelnek el, ami minden kérdésre tudja a választ – amire az interneten megvan a válasz.

Ugyanakkor itt hatványozottan merül fel az előítéletes tanítás problémája. Az például, hogy a nyelvi modellek elsősorban az angol nyelvhez készülnek (kivéve, amiket Kínában fejlesztenek, de rajtunk, bábeli világban élő európaiakon azok sem segítenek). Másrészt a tudás univerzalitása is sérül: míg például e-kereskedelemről számolatlanul sorakoznak a neten az információk, míg a kvantummechanikáról sokkal kevesebb valóban releváns szöveget találunk.

Ennyi nem elég? Iratkozzon fel hírlevelünkre!

Cloud & big data

MI-vel védenék a britek az internetre szabadított óvodásokat

Az illetékes hatóság felmérése szerint egyre több kisgyerek jelenik meg a világhálón, akiknek a szülei is egyre nagyobb szabadságot engednek a digitális térben.

Hirdetés

Adathelyreállítás pillanatok alatt

A vírus- és végpontvédelmet hatékonyan kiegészítő Zerto, a Hewlett Packard Enterprise Company platformfüggetlen, könnyen használható adatmentési és katasztrófaelhárítási megoldása.

A hónap témája

A jó adatmentés ismérvei

Hol, milyen adatokat és hányszorosan tároljunk ahhoz, hogy biztonságban tudhassuk szervezetünk működését egy nem várt adatvesztési incidens esetén is?

a melléklet támogatója az EURO ONE Számítástechnikai Zrt.

CIO KUTATÁS

TECHNOLÓGIÁK ÉS/VAGY KOMPETENCIÁK?

Az Ön véleményére is számítunk a Corvinus Egyetem Adatelemzés és Informatika Intézetével közös kutatásunkban »

Kérjük, segítse munkánkat egy 10-15 perces kérdőív megválaszolásával!

LÁSSUNK NEKI!

Vendég cikk

Régen minden jobb volt? A VMware licencelési változásai

Amióta a VMware a Broadcom tulajdonába került, sebesen követik egymást a szoftvercégnél a stratégiai jelentőségű változások. Mi vár az ügyfelekre? Vincze-Berecz Tibor szoftverlicenc-szakértő (IPR-Insights) írása.

Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak

CIO Podcast

CIO Podcast #59: A megoldásszállítók is készülnek a NIS2-re

CIO Podcast #58: Valóban mindenre (is) jó az MI?

MÉG TÖBB CIO PODCAST »

CIO Klub

Az IT-projektmenedzsment új varázsszava: proof of concept

Különösen az early adopter vállalatoknak lehet hasznos. De különbözik ez bármiben az amúgy is megkerülhetetlen tervezéstől és pilottól?

Sok hazai cégnek kell szorosra zárni a kiberkaput

MI-vel védenék a britek az internetre szabadított óvodásokat

A jó adatmentés ismérvei

Régen minden jobb volt? A VMware licencelési változásai

CIO Podcast #59: A megoldásszállítók is készülnek a NIS2-re

Az IT-projektmenedzsment új varázsszava: proof of concept

CIO Hungary 2024 konferencia