Søkemotor
En søkemotor er en type programvare som leter frem informasjon fra Internett (nettsider eller andre nettressurser) eller fra datasystemer som ikke er på Internett. Søkemotoren rangerer treffene etter hva den oppfatter som mest relevant etter det søk som er gjort. Typisk ligger søkemotoren tilgjengelig som et nettsted, der brukeren legger inn søkeord eventuelt sammen med filterinnstillinger, og treffene vises gjerne som klikkbare lenker.
Søkemotoren kan enten gjøre søk på hele Internett (for eksempel Google, Bing, Kvasir og Yahoo!), innenfor et bestemt nettsted (for eksempel søk innenfor VGs nettavis), eller innenfor et bestemt tema (f.eks. Kelkoo, som søker etter priser på produkter, og Picsearch, som søker etter bilder). En bedrift kan også sette opp en intern bedrifts-søkemotor for å få enklere tilgang til alle dokumenter og databaser i bedriften.
Historie
[rediger | rediger kilde]Den første søkemotoren for Internett var Wandex, en såkalt web crawler (søkerobot), utviklet av Matthew Gray ved MIT i 1993. Denne søkemotoren finnes ikke lenger, men en annen tidlig søkemotor, Aliweb, som også kom i 1993, finnes den dag i dag. Lycos kom også tidlig, allerede i 1994.
Senere ble flere søkemotorer ble tilgjengelige, som WebCrawler, Hotbot, Excite, Infoseek, Inktomi og AltaVista. Disse konkurrerte med bl.a. Yahoo!, som var en ren katalogtjeneste. Yahoo fikk imidlertid søkemotorfunksjon i 2002 (Inktomi), og overtok i 2003 Overture, som eide AlltheWeb og AltaVista. I 2004 lanserte Yahoo! sin egen søkemotor, som kombinerte teknologien fra disse oppkjøpene.
Fra ca. 2001 ble Google den mest brukte søkemotoren. Google er fortsatt den største søkemotoren på Internett. Tjenesten er kjent for å bruke betalt søkemotorannonsering ved å tilby annonser som er relevante for søkeordene.
Søkemotorer
[rediger | rediger kilde]Det finnes en rekke søkemotorer for internett, blant annet:
- Bing (tidligere kjent som Live Search eller MSN Search)
- Yahoo!
- DuckDuckGo, som ikke lagrer eller videreformidler informasjon om søk
- Kvasir, en Norgesbasert tjeneste
Andre søkemotorer er Rubrikk, DMOZ (Open Directory Project), Gigablast, Accoona, AltaVista, AlltheWeb, Overture, Fjalar, Kvass.no, Search, Ask Jeeves, Webcrawler, Hotbot, a9, Clusty, Ez2Find, Fast, Teoma, WiseNut, GoHook, Walhello, Kartoo, Yelo, Cuil og Snap.
Av Open Source-søkemotorer kan nevnes Htdig, Nutch, Egothor og OpenFTS.
Majestic-12 er en søkemotor basert på distribuert indeksering.
Slik fungerer søkemotorer
[rediger | rediger kilde]Søkemotorer er stadig i utvikling, og de fleste har utviklet seg og tatt i bruk andre, bedre teknikker i tillegg til de som er beskrevet her.
De forskjellige søkemotorene er ulikt utformet, men det ha to ting tilfelles: en søkerobot og en indeks (søkemotor). Søkeroboten leser en nettside, identifiserer eventuelle linker, og følger en av de mulige linkene videre. «Kommersielle» søkemotorer har gjerne også en database med nettsider de tidligere har besøkt, som de besøker igjen etter en viss tid. Indeksen er som en indeks bakerst i en bok, bare mye større. Den består av alle ordene som den har kommet over på alle nettsider den har besøkt. Hvert av ordene i indeksen har en liste over alle nettsider der ordene forekommer.
Når søkeroboten leser en ny nettside, legges den til i søkemotoren: Søkemotoren registrerer alle ordene som forekommer i dokumentet. For hvert av ordene legges nettsiden til i listen over steder dette ordet forekommer. Det vil for eksempel si at hvis søkeroboten leser en side med 50 ord som forekommer en eller flere ganger, så legges nettsiden til i forekomstlisten til alle disse 50 ordene.
Søkeroboten må ha minst én side å starte fra, deretter foregår traverseringen langs lenker den finner på sidene den leser. Dette betyr at en søkerobot bare registrerer de sidene som det finnes lenker til.