Bilatzaileak eta pertzepzioak
Interneteko erabiltzaile arrunt batek, Google edota beste bilatzaile bat erabiliz, zerbaiti buruzko informazioa bilatzen duenean, normalean hainbat informazio jasoko du. Segundu gutxi batzutan milaka, eta maiz gaiaren arabera, miloika webguneren zerrenda eskuratuko du. Webgune horiek gure bilaketarekin zer ikusi txikia eduki arren, erabiltzaileak bilaketa arrakastatsua egin duelaren inpresioa hartuko du. Eta gainera bilatzaileak Interneten dagoen guztia bildu diola pentsatuko du. Kontua da pertzepzio horiek engainagarriak direla.
Beste modu batera esanda, bilatzaile batek, biblioteketako katalogoek ez bezala, ia edozein bilaketetan erantzun masiboa ematen duela, eta horren ondorioz erabiltzaileok halako arrakasta eta asetasun sentsazio hartzen dugu. Batetik ematen du bilaketa ondo planteatu dugula (norbere egoa puztuz), eta bestetik ematen du gure behar informatiboa asetu duela. Baina… usteak erdi ustel!
Web ikusezina: Bergman-en txostena
Bilatzaileak ageriko web-a indexatzen dute, eta beraz ez dira web ikusezinean sartzen. Robotek ez daukate gaitasunik sisteman horietan informazioa bilatzeko (gehienetan datu-baseak direlako eta robotek ez dakitelako bertan bilatzen, web pribatua delako, web jabeduna delako eta sartzeko ordaindu behar delako, eta abar). Kontua da web ikusezinean informazio gehiago eta fidagarriagoa dagoela, eta haren tamaina, Bergman-en ikerketaren arabera, askozaz handiagoa dela.
lasera Bergman-en txostenetik ateratako zenbait datu aipagarri eraman nituen web ikusezinaren tamaina eta ezaugarrien gainean. Apunteetan ingelesez dituzue, baina klasean euskarara itzuli eta komentatu genituen.
Vanesa, zeintzuk dira Bergman-ek web ikusiezinari buruz ematen dituen datuak?
Entries (RSS)
Apirila 16th, 2008 at 5:56 pm
Nire ustez, google-ek, yahoo-k edota beste bilatzaileek web ikusezinean datuak ezin bilatzearen beste arazo bat (informazio masiboaz aparte) dagoen informazio guztia fidagarria den edo ez ez dakigula da.
Apirila 17th, 2008 at 11:30 am
INFORMAZIO AROA
Egun Internet ozeano bateko gainazalarekin konparatu daiteke, World Wide Web bezala ezagutzen duguna, alegia, baina berez hori atal txiki bat baino ez da. Izan ere, oinarrizkoena sareak harrapatu dezake, baina kantitate garrantzitsu bat sakonean dago, sakoneko Web-a (Deep Web) deritzona. Ezkutatutako Web “zati” hori galduta dagoela esango dugu, zergatik? Ikusten ez dugulako, bilatzaileetan aurkitu ezin dugulako, informazio guzti horretaz ezin garelako baliatu, edo hori pentsatzen da, behintzat.
Bilatzaileak gainazaleko Web-a den armiarma-sarean ibiltzen dira, gainazaleko horretaz baliatu ahal izateko, orrialdeak (web orriak) beste orrialde batzuetara linkatuta egon behar dira eta estatikoak izan behar dira. Bilatzaile horiek ez dira gai ezkutuko webean sartzeko eta horien informazioa lortzeko. Horregatik, egun arte Deep Web deiturikoa ikusezina izan da.
Brig Planet bilaketaren teknologiak, barneko weba eta gainazaleko webaren edukiera lortzea, identifikatzea, klasifikatzea eta organizatzea lortu duen bakarra da. Izan ere, gainazaleko eta ezkutuko webak ez dira berdinak, azken horretako informazioa lortzeko datu baseetan bilatu behar da. Beraz, Google, Yahoo, MSN… bilatzaileek ezin dute sakonekoan dauden datuak lortu.
Informazio aroan informazioa da gutiziatuena. Hau dela eta, sakoneko webak oso balio handia du. Bergman-ek 2000an (BrighPlanet) egindako ikerketaren arabera, Karmelek azaldu duen bezala, web ikusezinean informazio gehiago eta fidagarriagoa dagoela adierazi zuen eta haren tamaina askoz handiagoa dela. Jarraian aipatuko ditugu ikerketako datu aipagarri batzuk:
o Web ikusezinaren informazioak 7500 terabytes okupatzen du, aldiz gainazalekoa 19 besterik ez.
o Egun, ikusezineko webean 200.000 leku gehiago existitzen dira, gainazalekoan baino.
o Web ikusezineko lekurik garrantzitsuenak kontutan hartzen baditugu (60 handienak) 750 terabytes-eko informazioa osatzen dutela konturatuko gara. Hau da, gainazaleko Internet-ak duen informazioa baino 40 aldiz gehiago. Datu base horien adibidea (Deep Web): National Climatic Data Center (NOAA). URL: http://www.ncdc.noaa.gov/ol/satellite/satelliteresources.html. 366,000 GB okupatzen ditu.)
o Web ikusezineko lekuak normalean gai espezifikoagoak lantzen dituzte. Erdia baino gehiago gai espezifikoak izanik.
o Ezkutuko webaren %90 sarrera publikokoa da.
o …
Laburbilduz, Bergmanek behin eta berriz errepikatzen duena da Web ikusezinak askoz handiagoa dela eta askoz informazio gehiago duela ageriko Internet baino. Gainera, erabiltzaileen % 85-ak bilatzaileak erabiltzen ditu soilik, Yahoo, Google, Excite… kasu, askotan behar duten informazioa lortu gabe. Izan ere, ageriko webaren informazioa orokorragoa da eta fidagarritasun maila baxua. Brigh Planet ikerketaren helburua beraz, webeko informazioaren ikuspegi berria ematea izan da, eta erreminta berriak edo desberdinak daudela ezagutzera eraman gaituzte. Komunikazio eta informazio aroan gaude eta gehienetan ez gara horretaz jabetzen. Internet gero eta datu gehiago pilatzen ditu eta horietako asko ez ditugu ezagutzen. Teknologia berrien eboluzioa izugarria da, urtero Webeko dokumentuen hazkundea %200 izanik. Harrigarria, benetan!
Apirila 19th, 2008 at 8:26 pm
Nahiz eta sarrera honetako gaiarekin bat ez etorri artikulu interesgarri hau aurkitu dut Britannica entziklopediaren gainean (gazteleraz). Idazlea Enrique Dans da, informazio eta tecnologiarekin zerikusia daukaten gaietan aditua eta espainia mailan blogari ospetsuenetarikoa.
Azken esaldiarekin geratuko nitzateke:
“…parece claro que hacer algo en Internet quedándose completamente al margen de los motores de búsqueda al estar detrás de una barrera de pago no resulta una estrategia sencilla, por bueno que pueda ser tu contenido. ”
Artikulu osoa:
http://www.enriquedans.com/2008/04/britannica-sigue-intentandolo.html
Apirila 23rd, 2008 at 6:03 pm
Kaixo
Hainbeste web ikusezin gora eta behera, eta hara Google antza denez web ikusezinean dagoena indexatzen ari da. Berria hemen agertu da: http://www.metodosdebusca.com/118/google/google-ya-localiza-contenidos-de-la-web-invisible-2.html
Vanessa, informazioa aroaren gainean halako iruzkin orokor bat egitera animatu zara, galdera zehatzari erantzunaz bide batez. Saiakera eskertuta dago, baina gehiegizko informazioak bizi gaituen honetan, nahikoa zen Bergman-en datuak euskaratzea.
Gorka, (bietan) ados zurekin. Ados, benetako gakoa ez da tamainua, fidagarritasuna baizik. Halaber ados beste kontuarekin ere, web gune bat garatzeak SEO kontutan hartu gabe ez du zentzurik. Borondate ona ez da nahikoa, gauzak buruarekin egin behar dira eta joko arauak ezagutu behar dira. Esate baterako euskal kulturgintzako erakunde askok web guneak garatzen dituzte, baina klasean aipatutako kontuak aintzat hartu gabe, eta horren ondorioz, hainbeste baliabide web gune baten inbertitu ostean, oihartzun txikia edo eskasa lortzen dute. Horrek guztiak dakarren frustrazioarekin, teknologia berrien ustezko panazearen aroan.
Bihar arte