zondag 28 februari 2016

Intelligentie uit boeken halen?


Vrijdagavond zat ik een documentaire van de VPRO te kijken over Google Books: Google en het Wereldbrein. Het wereldbrein was een idee van HG Wells, een laat-victoriaans scifi-schrijver. Uit 1937. Hij hoopte alle kennis, ideeën en prestatie van de mensheid in één kaartenbak (index) bij elkaar te brengen. Dat is duidelijk niet gelukt en daar was Wells destijds heel boos over.

Maar de mannen van Google, en dan vooral Page en Brin, zijn bezig het nog eens over te doen, met Google Books. Daar ging de documentaire over. Omdat ze lak hebben aan het auteursrecht van anderen (probeer niet aan het PageRank-algoritme te komen), is dat een beetje vastgelopen: met name in Europa mag Google niet zomaar alle teksten die ze ingescand hebben (want daar komt Google Books op neer: scannen van alles wat los en vast zit in de bibliotheekwereld) op het net laten zien. De Amerikaanse rechter durfde al niet tegen Google in te gaan.

Maar wat wilden die Google-mannen eigenlijk met al die boeken, behalve nog wat meer persoonsgegevens binnenharken: wie wat leest en dat soort dingen? Kevin Kelly wist dat wel. Hij heeft ooit meegedaan bij het opzetten van Wired, dus hij heeft wat te vertellen in die wereld, ook al heeft hij dezelfde primitieve opvattingen over intellectuele eigendom als de Google-mannen. Brin en Page wilden - willen- volgens hem wat Wells niet gelukt is: alle kennis van de wereld digitaal op een stel servers en vervolgens in een kunstmatig brein, om daar dan kunstmatig intelligente dingen mee te doen. Google wil immers ook vragen kunnen beantwoorden als "wat zal ik eens gaan doen vandaag" of "hoeveel Amerikanen hebben een paspoort?".

Hoe dat eruit zou kunnen zien? Halverwege de documentaire was een stukje van de aflevering van Jeopardy! te zien, die door IBM's Watson is gewonnen. Watson, een losse computer (los van het Internet) heeft zijn eigen boekencollectie ingebouwd en ook nog een serie "algoritmes" (chique naam voor losse programma's of software) om daar antwoorden uit te peuren. Misschien voorspelt dat wat Google Search gaat kunnen als het al die Google Books uit heeft?

Op dit moment krijg je als antwoord op vragen aan Google een lijst documenten, waar je zelf maar wijzer uit moet zien te worden, maar een enkele keer krijg je direct antwoord. Zoek maar eens op "wie is de koning van Spanje".

Dat leek me nou een mooie gelegenheid om te kijken wat die Watson allemaal kan. In 2011, want toen was die uitzending van Jeopardy!, een quiz waar de vragen soms in de vorm van cryptogrammen worden gesteld. Ik had niet verwacht dat ik onder de indruk zou zijn. Ik vind AI een enorme hype en het aantal problemen dat je met patroonherkenning en predictive analysis kunt oplossen is maar beperkt. Maar een computer die vragen als:

"To push one of these paper products is to stretch established limits"

kan beantwoorden is toch wel erg interessant.

Heel knap dus, maar wat heb je kun er nog meer mee, behalve aan Twee voor Twaalf meedoen?

Denk even terug aan de schaakcomputer, ook een IBM-ding. Het is fantastisch als je een grootmeester kunt verslaan, maar welke praktische problemen kun je verder oplossen als je goed kunt schaken? Antwoord: helemaal niks. Goed kunnen schaken is niet hetzelfde als intelligentie. Een spelletje Go winnen van de Europese kampioen trouwens ook niet.

Datzelfde geldt voor Watson en natuurlijk ook voor Google Zoeken: vragen beantwoorden door woordenboekdefinities, handboeken en encyclopedieën te sorteren en door elkaar te husselen is toch wat anders dan begrijpen wat er staat.

Raar eigenlijk dat Google zo ver achter ligt op IBM's Watson.