Googles vej fra søgemaskine til vidensmaskine

af Robin Engelhardt

Blandt Googles ingeniører er man begyndt at droppe betegnelsen ’søgemaskine’. I stedet taler man nu om ’vidensmaskiner’. I årevis har internetentreprenører og forskere inden for kunstig intelligens talt om det såkaldte semantiske web: et netværk af videnssystemer, der kan forstå og frembringe netop det, som brugeren leder efter. Men først nu, i 2010’erne, synes id eerne for alvor at blive realiserbare. Google er faktisk så fokuseret på den semantiske omstilling, at de ifølge chefen for deres ‘webspam team’, Matt Cutts, har omdøbt deres ’Search Quality Team’ til nu at hedde ’Google Knowledge Team’. Men også mange andre aktører er ved at nærme sig de første funktionelle prototyper af ægte vidensmaskiner. Tænk på IBM’s supercomputer Watson, der hjælper læger med at lave diagnoser. Tænk på Apples talegenkendelsesprogram Siri, der svarer på spørgsmål og laver kontekstbaserede anbefalinger. Og tænk ikke mindst på svarmaskinen Wolfram Alpha, der laver real time beregninger på queries ved brug af aktualiserede og strukturerede databaser.

Google-PageRank-Update Overgangen til det semantiske web startede lidt tvivlsom med at Google for et par år siden begyndte at skræddersy søgeresultater til ens personlige profil. Hvis du og jeg laver en søgning om, lad os sige Tyrkiet, får jeg måske masser af top-links til tyrkiske feriebyer, og du til den politiske situation i landet. Det skyldes en database, som ved, at jeg engang har været på ferie i Antalya og du engang har lavet en søgning om Kemal Atatürk. Google selv siger at det øger følelsen af relevans for den enkelte, mens kritikerne siger, at det kaster al objektivitet overbord og kan bruges som vildledning i stedet for vejledning.

Tidligere på året 2012 lancerede Google så deres Knowledge Graph: et system som forbinder søgeord med konkrete mennesker, bygninger, og ting. Laver du f.eks. en søgning om ”Andromeda”, kan du i stedet for at lede blandt søgeresultaterne klikke på en af de fire foreslåede præcisioner på højre side af søgeresultatet: mente du galaksen, mytologien, tv-serien eller det svenske heavy metal band? Knowledge graph bygger på freebase, en database ejet af firmaet metaweb og opkøbt af google i juli 2010. Det var det første skridt på en lang overgang fra søgeordsgenkendelse til objekt- og relationsgenkendelse. I en sådan netværksforståelse er ordet ’Danmark’ altså ikke blot et genkendeligt ord bestående af syv bogstaver og lidt metadata, men en specifik entitet med utallige attributter og relationer.

Google offentliggjorde for halvanden måned siden deres Voice Search i direkte konkurrence med Apples Siri. Mens Voice Search bruger googles søgemaskine og gps, bruger siri også Wolfram Alpha til at beregne mere aktuelle svar. F.eks. vil spørgsmålet ”Ask Wolfram what flights are overhead” kunne fortælle dig, præcist hvilket passagerfly der netop flyver hen over hovedet på dig (hvis du altså er i USA). Googles Voice Search er til gengæld meget hurtigere, og har ofte meget mere relevant information. Når deres Knowledge Graph for alvor kommer i gang (lige nu indeholder den ’kun’ informationer om 500 millioner mennesker, steder og ting og har 3,5 milliarder attributter knyttet til dem), vil den kunne svare hurtigt og relevant på stort set hvadsomhelst. Den vil være den første store vidensmaskine og vide, hvor du kommer fra, hvad du er for en, og måske også hvad du lige nu går og foretager dig.