HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) Twitter (18) twitter (15) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Baidu-zz egy kicsit, és máris megtudod! - a Google-verő kínai kereső bemutatkozik

2011.09.13. 12:00 Szerző: Zoltán Varjú Címkék: keresés kínai baidu

Chouwen, a  豆腐块-欢迎欢迎! blog szerzőjének vendégposztja

 

Bǎi​dù yī​xià, nǐ jiù zhī​dào! (百度一下,你就知道!) –vagyis „Baidu-zz egy kicsit, és máris megtudod!- szól a Baidu - Bǎidù (百度) - 2000 januárja óta jegyzett pekingi központú, vezető kínai keresőportál szlogenje. Az Alexa Internet, Inc., az internetes oldalak forgalmának megbecsülése és rangsorolása alapján 2011 júniusában összesítésben a Baidu 6. helyen végzett, ami nem meglepő – pusztán a kínai internetfelhasználók rohamosan növekvő számából adódóan sem, mely mára kalkulációk szerint a négyszázötvenmilliót is meghaladta. A Baidu Kína vezető internetes keresőmotorja, a Google kivonulását követően folyamatosan növekvő piaci részesedéssel rendelkezik, 2011. márciusi adatok szerint már 75,5%-os dominanciával.

 

Számos szolgáltatással bír, ezek közül a legfontosabb a kínai nyelvű keresőmotor, mely által weblapokra, képekre, videókra kereshetünk rá. Néhány adatot tekintve a Baidu 740 millió weboldal, 80 millió kép, és közel 10 millió multimédiás fájl indexét jegyzi. Emellett a Baidu az első szolgáltató Kínában, mely mobilspecifikus kiegészítésként WAP és PDA alapú böngészést tesz lehetővé.

 

A Baidu elsősorban kínai nyelvre optimalizált keresőmotorjában kínai írásjegyekkel, illetve az azok latin betűs átírására használt fonetikus abc-vel – pinyin-nel - egyaránt rákereshetünk a kívánt tartalomra. A kínai nyelv sajátosságait tekintve az egyes szótagok meghatározott zenei hangsúllyal (a putonghuá-ban, vagyis a köznyelvben összesen néggyel) rendelkeznek, melyekhez eltérő írásjegy, illetve eltérő jelentés társul. Így a pinyin bevitelét követően a kereső felkínálja a lehetséges változatokat a keresendő szóra, vagy szóösszetételre:

 

 

A fenti példán látható hao szótag keresése alatt – a keresési gyakoriság értelmében - megjelenítődött a hármas tónusú hǎo (好) - „jó, szép, kiváló”, illetve az azzal képzett szóösszetételek: hǎokàn (érdekes, jól néz ki); ebből adóadóan hǎokàn de diànyǐng (好看的电影) – „jó mozifilmek”, hǎokàn de xiǎoshuō (好看的小说) – „érdekes regény”, hǎolèmǎi (好乐买), a www.okbuy.com, egy különböző márkájú cipőket kínáló kínai e-kereskedelmi website, hǎo​yǒu yìn​xiàng (好友印象) - „barátságos, jó benyomás” választási opciói. További lehetséges alternatívákként jelenítődött meg a négyes tónusú hào​ (号) – „szám, méret”, hào​mǎ összetételben szintén számot jelöl, valamit az ehhez tartozó leggyakoribbi keresés: hào​mǎ guī​shǔdì chá​xún (号码归属地查询), vagyis egy online telefonos tudakozó; vagy éppen az ugyancsak negyedik hangsúllyal rendelkező hào (浩) írásjegye, mely a kínai online játszható játékok tárházának nevében, a Hàofāng-ban (浩方) szerepel.

 

Az írásjegyek bevitele során szintén a keresési gyakoriság értelmében jegyzett legnépszerűbb találatokat kínálja fel keresési alternatívaként:

 

 

Ily mód 中国 (zhōngguó), azaz Kína kínaiul való bevitele során megjelenik többek között a „Kínai Mobilinternet Hivatal” (中国移动网上营业厅) Bank of China (中国银行), Kína térkép (中国地图), China Telecom (中国电信), etc. Az alábbi opciókon kívül természetesen a keresőmotor az adott kínai nyelvű kifejezéssel releváns valamennyi találatot rendelkezésre bocsát, s a kínai szövegbevitel hatékonysága miatt jobban veszi fel a versenyt példának okáért a Google adatbázisával.

 

Nem kínai nyelvű keresés esetén is automatikusan felajánlja a keresendő tartalom kínai fordítását:

 

 

Budapest bevitele közben már Bù​dá​pèi​sī (布达佩斯) kínai nyelvre való átültetései közül is válogathatunk – mely tulajdonképpen egyfajta kínai nyelvű autocomplete. Az írás pillanatában a magyarul bevitt Budapest-re 1.460.000 becsült találatot jelzett, míg 布达佩斯-re 4.160.000-ret, vagyis a Baidu erőssége legfőképpen a kínai nyelvű tartalomra való keresés (bár az utóbbi időkben az angol nyelvű keresés fejlesztése érdekében már lépéseket hoztak,s a keresővállalat első általános külföldi szolgáltatásaihoz tartozik a japán nyelvű keresőszolgáltatás - Baidu Japan néven).

 

Ennek nyomán hatékonyabban működik a kínai közéletet érintő témák keresésekor – a Google-nél találatainak kétszeresét jelzi a 2010 októberi Lǐgāng (李刚)-incidensre; és értelem szerűen a kínai kultúra különböző szegmenseiben– az idiómáktól (chéngyǔ) a népszerű TV show-kon (különös tekintettel a házastárs-kereső show-kra) át szappanoperákig – is mélyebben búvárkodhatunk. Az idegen nyelvű tartalmak esetében viszont már – a Google-höz mérten kevésbé hatékony, valamint a Baidu sem zárhatja ki magát a „nagy tűzfal”, az Aranypajzs projekt (Jīn​dùn​ Gōng​chéng​) néven emlegetett internet-cenzúra mögül, így egyes tartalmak – közmorált romboló vagy éppen obszcén, pornografikus oldalak – eleve nem érhetők el a Baidu-n keresztül.

 

A szövegbevitel kapcsán a pinyin (拼音) mellett választhatjuk a kézírás (写手) funkciót, azaz berajzolhatjuk a karaktereket, melyeket ezt követően a keresőfelületbe másolhatjuk:

 

 

További érdekességként beállíthatjuk, hogy csak egyszerűsített írásjegyeket (简体), vagy hagyományos írásjegyeket is (繁体) – melyeket ma elsősorban Taiwan-on és Hong Kong-ban használatosak – tartalmazhasson a keresett tartalom.

 

A Baidu összesen 57 kereső, illetve közösségi szolgáltatást nyújt, ezek közül az egyik legfontosabb Baidu Baike- Bǎidù Bǎikē (百度百科) kínai nyelvű szótár és web-enciklopédia, 2011 júliusára több, mint 3.5 millió cikkével már közel tízszeres nagyságú tartalommal rendelkezik, mint a kínai nyelvű Wikipédia.

 

 

2003 óta a Bǎidù Tiēbā (百度贴吧) – Baidu Post Bar – legnagyobb query alapú kínai kommunikációs platform, ahol a felhasználók különböző fórumokat hozhatnak létre kulcsszavak alapján -filmsztárokkal, filmekkel, könyvekkel, képregényekkel kapcsolatban. Bǎi​dù zhī​dào(百度知道) – Baidu Knows – egy közösségi tudásmegosztó platform, hol a felhasználók kérdéseket tehetnek fel bármely témára vonatkozóan, s melyekre a közösség tagjai közül bárki választ adhat. Szolgáltatásai közé tartozik még a Bǎi​dù Kōngjiān (百度 空间) -, vagyis a Baidu Space közösségi portálja, valamint természetesen a hír, kép, videó, és MP3 kereső szolgáltatás – valamennyi esetében kifejezetten kínai tartalmakra fókuszálva, így például MP3 alatt javarészt kínai mandopop-slágerekre vadászhatunk; ugyanígy a videó-keresés során is automatikusan a kínai videómegosztó oldalakra – youku.com, tudou.com, etc. – navigál át az oldal. A Baidu immáron pedig saját böngészővel rendelkezik: http://liulanqi.baidu.com/, emellett a hírek szerint Androidon alapuló saját mobilos operációs rendszert fejlesztene Qiushi néven.

 

Összességében a Baidu egy igen kiterjedt keresőszolgáltatást biztosít, mi több a kínai nyelvű világ első számú szolgáltatója, mely hazai pályán gyakorlatilag kizárólagos dominanciával bír, és egyre nagyobb konkurenciát jelent globális szinten is.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr233215257

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása