Hvað gera leitarvélar, hvert er hlutverk þeirra?

Hlutverk leitarvéla er annarsvegar að skanna (crawling) og að safna gögnum í gagnasafn (indexing) og hinsvegar að veita leitarvélanotendum leitarniðurstöður í forgangsröð þar sem efst á lista eru mest gagnlegu og mest viðeigandi upplýsingar fáanlegar miðað við leitarorðið sem slegið var inn.

Skönnun og söfnun

Ímyndaðu þér póstþjónustu sem keyrir um landið allt, kemur við í öllum húsum og sækir póst.

Póstþjónustan heldur úti veglegu leiðakerfi þar sem öll hús eru merkt inn. Hvert hús er tákn fyrir link, sem getur verið vefsíða, undirsíða vefsíðu, bloggpóstur, pdf skjal, mynd eða hvaða annað skjal sem má komast í, á internetinu. Með því að fylgja leiðarkerfinu skannar póstþjónustan allt landið. Ef byggt er nýtt hús eða bætt inn herbergi, fer það í leiðarkerfið, sé annað rifið, er það tekið út úr leiðarkerfinu.

Póstþjónustan merkir ekki aðeins inn öll húsin heldur bankar líka uppá og sækir póst, sé einhver. Pósturinn sem sóttur er, er tákn fyrir uppfærslur á vefsíðu, t.d þegar nýtt innlegg er skrifað.

Leitarvélar, hér Google, nota mjög stórt safn af tölvum til þess að skanna vefinn eins og hann leggur sig. Forritið sem síðan safnar gögnunum saman heitir Googlebot (oft kallað bot, crawler, spider).

Googlebot notar reiknirit (algorithm) til þess að ákveða hvaða síður á að skanna, hve oft og hve margar síður eða/og skjöl frá hverri vefsíðu á að sækja. Um leið og Googlebot heimsækir hverja síðu, skannar það síðuna einnig fyrir linkum sem kunna að vera þar og bætir þeim á to-do listann sinn yfir síður sem þarf að skanna. Nýjar síður, breytingar á verandi síðum og dauðir linkar eru skráðir og uppfærðir í gangasafni Google.

Söfnun gagna í gagnasafn Google

Í “bransanum” er talað um að Google (og aðrar leitarvélar) indexi síður. Slangur að sjálfsögðu en þýðir að Google safnar því sem Googlebot finnur, í risastórt gagnasafn.

Gagnasafn Google heitir Google Index. Því má líkja við upplýsingarnar sem bókasafn hefur um þær bækur sem skráðar eru í bóksasafnið. Í staðinn fyrir bækur hefur gagnasafn Google upplýsingar um allar þær vefsíður sem Google veit um.

Magnið af upplýsingum sem leitarvélar geyma er ólýsanlegt. Fyrirtækin sem eiga leitarvélarnar eru með uppsett risastór gagnaver um allan heim sem geyma allar þessar upplýsingar. Í gagnaverunum eru síðan þúsundir véla sem vinna mjög hratt úr gígantísku magni upplýsinga, þannig að þegar þú framkvæmir leit, er markmið leitarvélanna að koma með upplýsingarnar til þín eins hratt og mögulegt er.

Leitarvélanotandinn (ég og þú) er mjög kröfuharður, 1 – 2 sekúndur í bið getur þýtt að notandinn verður óþolinmóður og fer annað, þannig að hraði er klárt keppikefli fyrir leitarvélafyrirtækin.

 

Leitarniðurstöður = svör við spurningum

Leitarvélar eru vélar sem svara spurningum. Þegar notandi framkvæmir leit, skanna leitarvélar allar þær upplýsingar sem þær yfirhöfuð hafa og nota fyrrnefnt reiknirit til þess að ákveða hvaða upplýsingar eru mest viðeigandi og mest gagnlegar og skila notandanum þeim upplýsingum sem þær hafa, efst þeim sem leitarvélin telur bestar m.v þá leit sem slegin var inn.

Og hvernig fara leitarvélar að því að finna mest viðeigandi og mest gagnlegu upplýsingarnar?

Til þess að ákveða hvaða leitarniðurstöður eru birtar efst við hverja leit eru notuð ákveðin viðmið, ég mun fara yfir þau helstu og hvað þú getur gert til þess að besta þína síðu, í næstu köflum.

Eins og fram hefur komið er markmið leitarvéla (amk. hjá Google) að veita notandanum mest viðeigandi og mest gagnlegu upplýsingarnar. Efst koma bestu niðurstöðurnar og þær eru oftast mest vinsælar líka. Vinsældir spila þannig inní að leitarvélar gera ráð fyrir að mjög vinsæl vefsíða, undirsíða eða skjal hafi að geyma mjög gagnlegar upplýsingar.

Vinsældir vefsíðna og hve viðeigandi efni þeirra er notandanum er ekki stjórnað handvirkt heldur er téð reiknirit (algorithm) notað til þess að sækja bestu hnífana í skúffunni (mest viðeigandi) og forgangsraða þeim síðan (vinsældir), besti efst.

Meira um leitarvélar og hvaða samband þú vilt byggja við Google.