Vrijdagavond zat ik
een documentaire van de VPRO te kijken over Google Books: Google en het Wereldbrein. Het
wereldbrein was een idee van HG Wells, een laat-victoriaans scifi-schrijver.
Uit 1937. Hij hoopte alle kennis, ideeën en prestatie van de mensheid in één kaartenbak
(index) bij elkaar te brengen. Dat is duidelijk niet gelukt en daar was Wells
destijds heel boos over.
Maar de mannen van
Google, en dan vooral Page en Brin, zijn bezig het nog eens over te doen, met
Google Books. Daar ging de documentaire over. Omdat ze lak hebben aan het
auteursrecht van anderen (probeer niet aan het PageRank-algoritme te komen), is
dat een beetje vastgelopen: met name in Europa mag Google niet zomaar alle
teksten die ze ingescand hebben (want daar komt Google Books op neer: scannen
van alles wat los en vast zit in de bibliotheekwereld) op het net laten zien.
De Amerikaanse rechter durfde al niet tegen Google in te gaan.
Maar wat wilden die
Google-mannen eigenlijk met al die boeken, behalve nog wat meer
persoonsgegevens binnenharken: wie wat leest en dat soort dingen? Kevin Kelly
wist dat wel. Hij heeft ooit meegedaan bij het opzetten van Wired, dus hij
heeft wat te vertellen in die wereld, ook al heeft hij dezelfde primitieve
opvattingen over intellectuele eigendom als de Google-mannen. Brin en Page
wilden - willen- volgens hem wat Wells niet gelukt is: alle kennis van de
wereld digitaal op een stel servers en vervolgens in een kunstmatig brein, om
daar dan kunstmatig intelligente dingen mee te doen. Google wil immers ook
vragen kunnen beantwoorden als "wat zal ik eens gaan doen vandaag" of
"hoeveel Amerikanen hebben een paspoort?".
Hoe dat eruit zou
kunnen zien? Halverwege de documentaire was een stukje van de aflevering van
Jeopardy! te zien, die door IBM's Watson is gewonnen. Watson, een losse
computer (los van het Internet) heeft zijn eigen boekencollectie ingebouwd en
ook nog een serie "algoritmes" (chique naam voor losse programma's of
software) om daar antwoorden uit te peuren. Misschien voorspelt dat wat Google
Search gaat kunnen als het al die Google Books uit heeft?
Op dit moment krijg
je als antwoord op vragen aan Google een lijst documenten, waar je zelf maar wijzer
uit moet zien te worden, maar een enkele keer krijg je direct antwoord. Zoek
maar eens op "wie is de koning van Spanje".
Dat leek me nou een
mooie gelegenheid om te kijken wat die Watson allemaal kan. In 2011, want toen
was die uitzending van Jeopardy!, een quiz waar de vragen soms in de vorm van
cryptogrammen worden gesteld. Ik had niet verwacht dat ik onder de indruk zou
zijn. Ik vind AI een enorme hype en het aantal problemen dat je met
patroonherkenning en predictive analysis kunt oplossen is maar beperkt. Maar
een computer die vragen als:
"To push one of
these paper products is to stretch established limits"
kan beantwoorden is
toch wel erg interessant.
Heel knap dus, maar wat heb je kun er nog meer mee, behalve aan Twee voor Twaalf meedoen?
Denk even terug aan
de schaakcomputer, ook een IBM-ding. Het is fantastisch als je een grootmeester
kunt verslaan, maar welke praktische problemen kun je verder oplossen als je
goed kunt schaken? Antwoord: helemaal niks. Goed kunnen schaken is niet hetzelfde
als intelligentie. Een spelletje Go winnen van de Europese kampioen trouwens
ook niet.
Datzelfde geldt voor
Watson en natuurlijk ook voor Google Zoeken: vragen beantwoorden door
woordenboekdefinities, handboeken en encyclopedieën te sorteren en door elkaar
te husselen is toch wat anders dan begrijpen wat er staat.
Raar eigenlijk dat Google zo ver achter ligt op IBM's Watson.