RHÍ Fréttir

nr. 30 febrúar 1997

  

  

Upplýsingaleit á Interneti

Daði Kárason

Internet ættu flestir að kannast við þó ekki þurfi að fara lengra en 5 ár aftur í tímann til að hið gagnstæða gildi. Netið á sér langa og oft á tímum undarlega sögu, en segja má að internetvæðing almennings um heim allan hafi tekið vel innan við fimm ár. Þetta verður að teljast stuttur tími ef miðað er við allan þann fjölda sem hefur aðgang að netinu í dag.

Hvað varð þess valdandi að netið náði þeim vinsældum, sem um ræðir? Telja má að kaflaskil hafi orðið árið 1994 þegar Veraldarvefurinn (WorldWide Web) var settur fram á því myndræna viðmóti sem þekkjum hann í dag. Vefurinn hafði vissulega verið til fyrir þann tíma en hafði þann annmarka að innihalda einungis texta, grafíkina vantaði. En þetta breytist 1994 þegar settur var fram staðall sem gerði kleift að birta myndir á vefnum. Samhliða þessu komu fram vafrar (e. browsers) sem nýttu þennan nýja einginleika og einfölduðu jafnframt vefflakk. Eftir þetta varð ekki aftur snúið enda talið að vefsíður um heim allan séu nú á bilinu 80-90 miljónir (þessi tala er reyndar mjög ónákvæm enda ákaflega erfitt að hafa tölu á síðunum).

Þeir sem lifðu áðurnefnda umbrotatíma minnast sjálfsagt vandamáls sem hrjáði þá sem flökkuðu um vefinn, en það var hversu erfitt var að hafa uppi á upplýsingum á vefnum. Uppýsingarnar gátu jú verið til staðar en vandamálið var hvar? Staðan breyttist ekki að ráði fyrr en 1994 þegar Yahoo! kom fram með uppflettisíður sínar. Telja má að þar hafi komið fram fyrsti vísir að skipulegri skráningu og flokkun vefsíðna sem miðaði að því að búa til nokkurskonar “gular síður³ fyrir vefinn.

Vandamálið við upplýsingaleit á vefnum er enn til staðar en þó í nokkuð annarri mynd en áður. Í dag geta netverjar valið um fjölda leitartóla við upplýsingaöflun á netinu. Svonefndar leitarvélar hafa náð miklum vinsældum á þessu sviði enda veita þær aðgang að miklu af upplýsingum á fljótlegan hátt. Reyndar svo miklu af upplýsingum að vandamálið hefur snúist við, netverjinn fær of mikið af upplýsingum og á oft á tíðum í vandræðum með að vinna úr þeim.

En hvað er leitarvél og hvernig vinnur hún? Leitarvél er ekkert annað en geysistór orðaskrá, þar sem finna má tugþúsundir ef ekki hundruð þúsunda orða. Leitarvélin flakkar um vefinn og skoðar þær síður sem á vegi hennar verða. Ef vélin rekst á orð á vefsíðu, sem finna má í orðaskránni skráir hún hjá sér að þessi ákveðna síða innihaldi þetta tiltekna orð. Þannig nær leitarvélin að byggja upp gríðarmikinn lista yfir síður sem innihalda ákveðin orð. Þegar netverji sendir fyrirspurn til leitarvélarinnar um ákveðið leitarorð svarar vélin með lista yfir þær síður sem hún hefur skráð hjá sér að innihaldi leitarorðið.

Í dag eru leitarvélar á vefnum á milli 10 og 20 talsins. Orðalistinn er sá hluti sem þær eiga sameiginlegan, en eftir það má segja að skyldleikanum ljúki. Ákaflega mismunandi er hversu stór listinn er, hvernig unnið er úr honum, hvernig hann er geymdur og hversu hraðvirkar vélarnar eru. Sá hluti sem skiptir notanda vélarinnar mestu máli er hversu góð svör vélin veitir við fyrirspurnum. Það er til lítils að fá þau svör við fyrirspurn að um 10 miljónir síðna innihaldi þetta ákveðna leitarorð og að hér á eftir fylgi fyrstu 10 síðurnar. Vandamálið er því tvíþætt, annarsvegar þarf notandinn að senda inn markvissa fyrirspurn og eins þarf leitarvélin að lesa rétt úr fyrirspurninni þannig að notandinn fái viðeigandi svör. Telja menn að öllu meiri framfarir hafi orðið í lausn síðara vandamálsins.

Töluverð samkeppni er milli leitarvélanna og þykir hverjum sinn fugl fagur. Samkeppnin birtist einna helst í því að netverjar eru hvattir til að nota eingöngu leitarvél X því hún hafi skoðað flestar vefsíður og veiti best svör við fyrirspurnum. Fjöldi notenda skiptir miklu máli við fjármögnun leitarvélanna enda byggist hún í mörgum tilvikum á sölu auglýsinga. Því fleiri netverjar sem sjá auglýsinguna því hærra verð má fá fyrir hana. Auglýsingar hjá leitarvélum taka oft mið af fyrirspurninni sem send var til vélarinnar. Ekki er óalgegnt að sjá auglýsingu frá bifreiðaframleiðanda eftir að hafa sent inn fyrirspurn sem tengdist bifreiðum. Auglýsingamennska af þessu tagi hefur sætt nokkurri gagnrýni enda hafa heyrst efasemdaraddir um hlutleysi leitarvéla sem nýta sér þessa tækni. Gagnrýnin hefur einna helst beinst að því hvort upplýsingarnar innan leitarvélarinnar séu falar þ.e. að auglýsandi geti greitt fyrir að ákveðnar vefsíður komi oftar upp, sem svör við fyrirspurnum.

Áhyggjuraddir hafa einnig heyrst þess efnis hversu öflugar leitarvélarnar séu orðnar og hversu víða þær leiti fanga. Nú þegar skoða nokkrar af stærstu vélunum vefinn reglulega auk fréttanetins (Usenet). Hugmyndir eru uppi um að auka enn notagildi vélanna og láta þær skrá notendur á spjallrásunum (IRC). Finnst mönnum leitarvélarnar vera farnar að sinna hlutverki “Stóra bróður³ nokkuð vel enda sé hvergi hægt að stinga niður fæti á netinu án þess að það sé skrásett af leitarvél. Þótt tilhugsunin sé miður skemmtileg verður erfitt að sporna gegn skráningu af þessu tagi. Vefurinn, fréttanetið og spjallrásirnar eru opinn vettvangur og því erfitt að biðjast undan skráningu af þessu tagi. Ekki má heldur líta framhjá því að upplýsingagildi slíkrar skráningar er ótvírætt enda væri það skref afturábak að hindra aðgengi að upplýsingum sem þegar eru fyrir opnum tjöldum.

Hvað sem öllum úrtölum líður er ljóst að leitarvélarnar eru eitt mikilvægasta tækið sem netverji getur notað við upplýsingaleit á Interneti. En stærsta vandamálið sem snýr að netverjanum er sjálfsagt hvaða leitarvél hann á að nota. Ekkert einhlítt svar er til við þeirri spurningu. Leitarvélarnar geta gefið ákaflega mismunandi svör við sömu fyrirspurn. Ein vél getur gefið góða raun við eina fyrirspurn og önnur við þá næstu. Netverjar ættu því að hafa nokkrar leitarvélar á bakvið eyrað og prófa einfaldlega aðra ef ein þeirra gefur ekki viðundandi svör. Hraði vélarinnar skiptir einnig máli auk þess hversu þægilegt er að nota hana. Samt sem áður eru nokkrar leitarvélar sem standa framarlega þegar kemur að áðurnefndum atriðum. Þetta eru AltaVista, Excite, HotBot og InfoSeek en umfjöllun um þær og upplýsingabankann Yahoo! má finna hér fyrir neðan og á næstu síðu.


AltaVista leitarvélin kom fram á sjónarsviðið fyrir tæpum tveimur árum. Hún er í eigu Digital tölvufyrirtækisins og var strax í upphafi hátt skrifuð. Kom þar helst til að hún var geysihraðvirk og er enn. Digital ráðgerði í upphafi að gera AltaVista að hraðvirkustu leitarvélinni og vandaði svo til verksins að enn í dag eru fáar ef nokkur leitarvél sem skákar AltaVista á sviði hraða.

AltaVista inniheldur um 30 miljón vefsíður auk þess sem hún skoðar allar fréttagrúppur á Usenet á hverjum degi. Eins og áður segir er einn helsti kostur AltaVista hversu hraðvirk hún er. Annar kostur er sá að umsjónarmenn AltaVista hafa varað sig á því að hafa upphafssíðu leitarvélarinnar netta þannig að lítinn tíma tekur að ná í hana auk þess sem í boði er textaútgáfa upphafsíðunnar. Þetta hefur skapað AltaVista þó nokkrar vinsældir, sérstaklega meðal þeirra sem hafa hæga tengingu við Internetið. Einfalt er að útfæra flóknar fyrirspurnir t.d. með rökvirkjum auk þess sem velja má hversu ítarlegar niðurstöður AltaVista veitir. Í stuttu máli sagt, bæði einföld og hraðvirk leitarvél.


Excite kom fram á sjónarsviðið fyrir um ári síðan. Leitarvélin er hugðarefni hóps ungra manna sem vildi stofna fyrirtæki og töldu upplýsingamiðlun auðveldasta vettvanginn. Excite sker sig nokkuð frá hinum leitarvélunum þar sem hún flokkar gögnin á sérstakan hátt. Þessi flokkun gerir Excite kleift að túlka fyrirspurnir nokkuð ítarlega og skilja meðal annars að ef fyrirspurn inniheldur orðið “film³ eiga skjöl sem innihalda “movie³ alveg eins við sem svör við fyrirspurninni. Þetta birtist notendum í því að hafi notandinn fengið svör við fyrirspurn á hann þess kost að fá fleiri svör í svipuðum dúr með því að smella á “Find similar³ hnapp. Þessi aðgerð getur flýtt gríðarlega fyrir við upplýsingaleit.

Excite hefur vaxið töluvert frá stofnun enda hefur hún á snærum sínum nokkurskonar ritstjórn sem ritar umsagnir um mikinn fjölda vefsíðna. Excite hefur því vaxið frá því að vera eingöngu leitarvél yfir í alsherjar upplýsingamiðlara og þykir sér fátt óviðkomandi, býður meðal annars upp á fréttaþjónustu. Excite býður að þessu leyti upp á flestar þjónustur allra leitarvélanna. Excite er hraðvirk enda hlotið góða dóma í erlendum tölvutímaritum og af mörgum talin besta leitarvélin. Eins og flestar leitarvélar býður Excite upp á ítarlega leitarmöguleika, t.d. með rökvirkjum. Samt sem áður vantar textaútgáfu af upphafssíðunni auk þess sem upphafssíðan sjálf er nokkuð þung í vöfum, sérstaklega fyrir notendur með hægvirka nettengingu eða aldraðar tölvur.


HotBot byrjaði sem rannsóknarverkefni við Berkley háskólann í Bandaríkjunum. Markmiðið var að búa til hraðvirkan og stóran gagnabanka sem þyrfti lítið reikniafl. Þetta tókst nokkuð vel enda skoðar HotBot flestar síður allra leitarvélanna eða tæpar 55 miljónir, auk allra greina á Usenet. Einn helsti kostur HotBot er hversu einföld hún er í notkun. Viðmót HotBot einfaldar mjög samsetningu flókinna fyrirspurna, reyndar svo vel að það er nú á allra færi. Hægt er á einfaldan hátt að skilgreina hvort leita eigi að vefsíðum, myndum, hljóðum eða forritum og er þá fátt eitt talið. Upphafssíðan er létt í meðförum en textaútgáfu hennar vantar. HotBot hefur ekki verið starfrækt lengi en hefur fengið ágætis dóma enda nokkuð hraðvirk. Í stuttu máli sagt leitarvél með einfalt viðmót og mest af gögnum allra vélanna.


Yahoo! sker sig nokkuð frá hinum leitarvélunum enda varla um eiginlega leitarvél að ræða. Munurinn á Yahoo! og öðrum leitarvélum er sá að hjá Yahoo! eru vefsíður flokkaðar niður eftir innihaldi. Uppbyggingin er því svipuð því sem þekkist í “gulu síðunum³ þ.e. hægt er að fletta upp á orðinu “bifreiðaframleiðendur³ og fá þá lista yfir alla bifreiðaframleiðendur sem skráðir eru hjá Yahoo!. Kosturinn við þetta fyrirkomulag er sá að hjá Yahoo! er hægt að ganga að miklu af upplýsingum um sama hlutinn á skipulegan hátt. Ef ætlunin væri að leita að bifreiðaframleiðendum t.d. með AltaVista er viðbúið að svörin við fyrirspurninni yrðu á þá leið að sumir framleiðendur kæmu oft fram, aðrir aldrei og auk þess nokkuð margar síður sem hafa lítið að gera með sjálfa framleiðendurna. Yahoo! inniheldur aftur á móti ekki nema brot að þeim vefsíðum sem hinar leitarvélarnar skoða enda gríðarleg vinna fólgin í því að flokka síðurnar niður. Þetta kemur yfirleitt ekki að sök enda inniheldur Yahoo! um 300.000 síður í 20.000 flokkum sem er nóg fyrir flesta. Yahoo! býður upp á leit í þeim síðum sem eru á skrá og einnig tengingu við aðrar leitarvélar t.d. AltaVista og Excite. Textaútgáfa af upphafsíðunni er ekki í boði en það kemur ekki að sök því síðan er lítil að umfangi. Yahoo! er kostur sem vert er að íhuga vandlega enda hraðvirk og einföld í notkun.


InfoSeek reynir að sameina leitarvél auk flokkunarkerfis Yahoo!. Þetta gengur ágætlega enda InfoSeek nokk-uð vinsæl leitarvél. InfoSeek býður upp á mismunandi leitarmöguleika, hraða eða nákvæma leit. Hröð leit skilar einungis af sér nauðsynlegustu grunnupplýsingum sem svör við fyrirspurninni og er því nokkuð hrað-virk. Nákvæm leit miðar að því að auðvelda notandanum að finna það sem hann leitar að og þá helst með því að geta sér til um hugðarefni notandans. Þessir eiginleikar, ásamt stórum gagnagrunni InfoSeek gera hana að vænlegum kosti. Auk þessa bætist við að hægt er að leita að upplýsingum á sama hátt og hjá Yahoo! þ.e. flokkuðum eftir tegund. InfoSeek hefur hlotið lofsamlega dóma enda með einfalt og skemmti-legt viðmót, þótt engar séu texta-útgáfur af síðunum. InfoSeek býður einnig upp á ítarlegar fyrirspurnir á svipuðu formi og aðrar leitarvélar. Sameining leitarvélar og uppfletti-forms gera InfoSeek að kosti sem vert er að athuga.

  
Notendaþjónusta RHÍ,  16. febrúar 2000 

Efnisyfirlit Næsta grein Önnur fréttabréf