zondag 30 oktober 2016

Wordt het nou eindelijk wat met die Artificial Intelligence?

Een nieuwe uitvinding kondig je natuurlijk aan als het begin van een interessanter, belangrijker en fijner leven voor de hele planeet, of als de vierde industriële revolutie. Kijk maar naar autonome auto’s. Geen files meer, geen ongelukken en lekker met je neus in de krant of je ogen dicht naar je werk.

En dat valt vervolgens dan ineens erg tegen: sommige wegen zijn toch wel erg smal en druk, de boordcomputer kan niet zien of er sneeuw op de weg ligt en soms gebeuren er ook nog serieuze ongelukken. Dan wordt het een tijdje stil – of er is weer iets nieuws dat de aandacht afleidt – maar nog wat later blijk je dan toch ineens iets nuttigs te kunnen met zo’n uitvinding, ook al is het misschien minder spectaculair.

ICTers en toekomstvoorspellers kennen dit patroon als de Hype Cycle. Gartner, het onderzoeksbureau dat die term bedacht heeft, maakt elk jaar leuke staatjes waarin je kunt zien hoe het met nieuwe uitvindingen gaat. In 2015 waren autonome auto’s nog helemaal je van het, maar augmented reality was ver weggezakt in de belangstelling. Nu we Pokémon Go hebben, weten we dat er in ieder geval één toepassing van augmented reality is die niet meer weg gaat.

Artificial Intelligence / AI / kunstmatige intelligentie is ook zo’n uitvinding, maar dan net iets anders. Voor AI begint de hype cycle namelijk telkens weer van voor af aan. In plaats van een slope of enlightenment, als er langzaam toch echt bruikbare toepassingen worden gevonden, glijdt AI altijd weer terug naar het nulpunt. Lange, donkere perioden van vergetelheid. Dat is al zo vaak gebeurd dat er een aparte naam voor is: AI-winters.

Een mooi overzicht daarvan vind je in een animatie van ene Frank Chen, die 45 minuten duurt. Inclusief een happy end, want nu is alles anders! We hebben deep learning, dus vanaf nu wordt AI alleen nog maar beter.

Het is denk ik goed om te weten dat Frank Chen voor Andreessen Horowitz werkt. Dat zijn van die investeerders, venture capitalists. Die Horowitz ken ik niet, maar Marc Andreessen heeft de eerste fatsoenlijke Internet-browser gemaakt en daar een smak geld mee verdiend. Dat soort mensen vindt het vaak leuk om te kijken of ze nog eens binnen kunnen lopen, maar dan met een leuke start-up van iemand anders.

Het lijkt me leuk werk: je krijgt de hele dag mensen langs met spannende nieuwe ideeën en jij kunt over hun lot (of in ieder geval dat van hun ideeën) beslissen als een Romeinse keizer over het leven van een gladiator. Duim omhoog: we gaan in je investeren, duim omlaag: fijne dag nog, volgende pitch a.u.b. Iedereen is aardig voor je en wil komen praten, je hoeft nooit meer zelf koffie te halen en je kunt in een t-shirtje naar je werk.

En als je op de goede startup gokt, kun je lekker verdienen door hem naar de beurs te brengen of door te verkopen. Aangezien je dan toekomstige waarde verkoopt – geen enkele investeerder wacht met verkopen tot er een keer winst wordt gemaakt - is het wel handig een mooi rooskleurig verhaal klaar te hebben voor geïnteresseerde kopers. Hou dat even in de gaten als je de animatie gaat bekijken.

Katten

AI draait deze ronde om deep learning of machine learning, het herkennen van patronen. Daar is al jaren software voor (met neural networks), maar de computers waren te klein om er mee uit de voeten te kunnen. Maar dankzij Big Data kunnen we nu honderden computers aan elkaar koppelen en als één computer laten werken en dan werkt het wel.Die kan dan op zoek naar overeenkomsten in eindeloze verzamelingen afbeeldingen, opnames of zinnen.

In 2012 zijn ze er bij Google en Stanford University zo in geslaagd met 16.000 aan elkaar gekoppelde computers 10 miljoen YouTube video’s te sorteren op onderwerp. YouTube staat vol met video’s van katten en die werden gelukkig ook als apart onderwerp herkend. Dat was een doorbraak.

Het herkennen van gesproken taal is een ander succesnummer van de nieuwe AI. Siri en Google Now kunnen losse woordjes uitstekend herkennen. Ik heb een Italiaanse woordenboekje van Van Dale op mijn telefoon en als ik een woord wil opzoeken door het in te spreken, verstaat het me bijna altijd goed. Heel handig.

Maar ook weer niet perfect. Als je wilt dat Siri en Google Now hele zinnen herkennen, moet je helpen door de woorden los van elkaar uit te spreken. Normaal doe je dat natuurlijk niet. Sterker nog, als je gewoon praat, spreek je de helft van de letters in een woord nìet of anders uit. Als mijn dochter “aanmaaklimonade” zegt, klinkt het als “ameklimenade””. Niemand spreekt de “o” in “limonade” uit als een mooie ronde “o”. Niemand spreekt de “n” voor de “m” ook als een “n” uit. En dat valt niemand op, kennelijk is het niet nodig om begrepen te worden. Behalve dan voor Google en Siri.

Automatisch vertalen wordt vaak in één adem met de andere succesnummers van automatisch leren genoemd. Daar begrijp ik helemaal niks van. Toen ik Word net even opstartte, kreeg ik een enthousiast berichtje over nieuwe mogelijkheden om samen met anderen aan een tekst te werken. Er was meer informatie over, maar die was wel automatisch vertaald, het stond er netjes bij. Toen ik doorklikte kreeg ik dit op mijn scherm:

"Als u wilt onderzoeken en schrijven over een onderwerp voor uw paper universiteit of school project, gebruikt u onderzoeker in Word 2016 zodat u een aan de slag met in het schrijven van uw paper."

Blij dat ik het weet. Mag ik toch nog even het Engels zien?

Hoe loopt dit af?

Voor sommige mensen is het moment dat computers intelligenter zijn dan wijzelf al bijna aangebroken. Kijk maar eens naar de plaatjes bij dit stuk van Tim Urban. Zwaar overdreven, maar erg onderhoudend. (Net als zijn TED Talk over uitstellen trouwens, Inside the mind of a master procrastinator.) Toch zijn er veel mensen die dit serieus nemen en al zitten te zenuwen over hun baantjes.

Maar er zijn er ook die vinden dat de AI-wetenschappers en de Googles en de Apples zichzelf zwaar overschatten. Als je de maatschappelijke impact van de iPhone bijvoorbeeld vergelijkt met die van de auto of van stromend water dan is die, afgezien van de entertainment-waarde, miniem. Elektrisch licht, wasmachines en auto’s hebben mensen ongelofelijk veel productiever gemaakt, en dus rijker. Dat geldt ook nog een beetje voor tekstverwerkers en spreadsheets, maar smartphones of tablets? Leuk: ja, productief: nou nee, niet echt.

Toen Robert Gordon, een top-econoom waar ik nog nooit van had gehoord, dat zei, werd het niet echt gewaardeerd. In Amerika moet je technologie-optimist zijn, maar hij verpest het feestje door te verwachten dat we weer teruggaan naar een economische groei van 0,2 procent per jaar, net als tussen 1300 en 1700. Daar is ook een leuke TED Talk over trouwens, vooral het stukje waarin hij voorrekent hoeveel vervuiling de voorgangers van de auto, paarden, veroorzaakten.

Zelf zie ik niet zo goed waar die superieure automatische intelligentie vandaan moet komen. Wat de AI-wereld nu presteert is nieuw en indrukwekkend, maar tegelijk ook beperkt: met brute computerkracht patronen (katten of woorden) herkennen in tienduizenden afbeeldingen of opnames. Dat heeft weinig met begrip of intelligentie te maken. Een kind heeft geen 300 voorbeelden nodig om te leren wat een kat is.

Waar ik wel van opkeek is een Amerikaans onderzoek, waaruit bleek dat een computerprogramma rapporten van een patholoog die weefsel heeft onderzocht op kwaadaardige cellen even goed of beter kan interpreteren dan de behandelende arts. En sneller en goedkoper. Bij een steekproef van 7.000 rapporten. In Nederland gebeurt trouwens vergelijkbaar onderzoek.

Met dit soort dingen komt AI wèl verder in de hype cycle. Gaat het nu dan toch een keer anders?
 

zondag 22 mei 2016

Hoe gaat het nou met de uitgeverij? 5 kleine lessen

Van de week naar INCT-live geweest om te kijken of de uitgeverij nog leeft en om lekker te netwerken met eventuele nabestaanden. Dit is wat ik er heb opgestoken.

Uitgeven is een business voor grijze mannen

Als je tenminste afgaat op de bezoekers van INCT-live. Leuk voor mij, want ik ben er ook zo een, maar hip is anders.

Venijnige interviewers zijn leuker dan mannen met PowerPoints

TED Talks zijn de gouden standaard voor presentaties (daar moet je dan ook heel erg je best voor doen, zie hier, derde alinea), maar op een doorsnee-congres ben je vaak blij dat je je smartphone bij je hebt om de laatste 25 minuten voor de koffiepauze een beetje leuk door te komen, terwijl de spreker met zijn sheets staat te worstelen.

INCT-live heeft hier een goeie oplossing: interviews door een venijnige interviewer, Ronnie Overgoor, die het nog net leuk houdt voor de geïnterviewde, maar zich niks laat wijsmaken en vrolijk lacht om onzin. De geïnterviewde die trots vertelde dat ze had meegewerkt aan de introductie van “intense vla” zal er nog wel eens aan terugdenken.

Allemaal kleine stroompjes inkomsten

Kranten en tijdschriften leefden lang geleden van abonnementen en advertenties. Maar online is alles gratis en de advertentiemarkt is gekaapt door Google en Facebook. Die centen komen nooit meer terug. Je kan daar lang over treuren en wachten tot je failliet gaat, je kunt ook iets nieuws verzinnen. Fietsen verkopen, bijvoorbeeld. Zowel Rob Koghee, van New Skool Media (een aantal publieksbladen waar Sanoma geen zin meer in had), als Caspar van Rijn (Van De Standaard en andere kranten) hadden het erover.

Als je bij een mooi artikel over fietsen een advertentie zet voor een fiets, dan heb je veel meer kans dat je er een verkoopt, dan als Google dezelfde advertentie op een willekeurige plek op een willekeurige site zet. Simpele omzet, als je de logistiek maar wel goed regelt. Mensen kunnen hun fiets dus niet afhalen bij de redactie van Fiets en Caspar van Rijn spant geen kettingen.

Techno-optimisme

De gadget-show van Sander van der Heijde(@sandertje op Twitter, daar komt hij nooit meer vanaf) zat twee keer vol. Het nieuwste van Google en de zelfrijdende auto gingen erin als koek (ik wil nog wel eens zien wie er in een zelfrijdende auto stapt als het een nacht gevroren heeft en er dwars ingeparkeerd moet worden op een Amsterdamse gracht).

Karina van Dalen (wetenschap) en Herman Buss (uitgeefconsultant) presenteerden een plan om met big data de literaire kwaliteit van bestsellers en manuscripten te meten. Wetenschappelijk interessant en de uitgeverij kan zo wat besparen op de 80 tot 100 miljoen die ze jaarlijks uitgeven aan boeken die floppen.

Het lijkt me nogal ambitieus en ze gaan geloof ik ook voorbij aan de invloed van het boekhandelarenpanel van DWDD, maar je weet nooit wat AI, Big Data en die andere Grote Beloften opleveren. Zoals het ruimtevaartprogramma van de Apollo ons het tefalpannetje heeft gebracht. Niet zo bedoeld, toch mooi meegenomen. (Ik bedoel dit eigenlijk serieus).

Het gaat eigenlijk best

De ergste creatieve destructie (nadruk op het laatste) van de uitgeefbranche door Google, Facebook, maar bijvoorbeeld ook Vice lijkt nu wel voorbij en een aantal uitgevers heeft zich, morrend, “nieuwe”, dure en onwennige technieken als video en apps maken aangeleerd en andere manieren ontdekt om geld te verdienen. En native advertising blijkt toch aantrekkelijker dan willekeurige Google Ads. Dat helpt ook.

Het kost wel meer geld en meer werk, met nìet meer mensen. In de zaal riep zelfs iemand dat het misschien maar goed is dat het vet nu van de botten is. Dat klinkt mij iets te veel naar zelfkastijding, schuld en boete. Ik vond die internationale conferenties en auteursdiners nooit vervelend.
Soit. We leven nog.

maandag 11 april 2016

De mensen zijn een beetje uitgeappt, dus nou krijgen we bots

De betere toekomstvoorspellers hebben het idee dat we zo langzamerhand uitgeappt zijn. Bots zijn the Next Big Thing. Een bot is een programma, ergens op het Internet, dat je van alles kunt vragen via apps als Whatsapp, Facebook (Messenger) of Twitter. Heel handig, want daar ben je toch al de halve dag mee in de weer.
Je hebt simpele bots, waarmee je een pizza kunt bestellen of de weg vragen, maar je hebt natuurlijk ook ingewikkelde bots, waarmee je hele gesprekken kunt voeren. Chatbots noem je die. Bijvoorbeeld Miss Piggy, op Facebook. Stuur maar eens een bericht. Ze reageert alleen op werkdagen na 10 uur, zoals je van een dame ook mag verwachten.

9292

Het idee lijkt me wel aardig (niet het idee van chatten met Miss Piggy, hoewel we natuurlijk graag van haar willen horen of het nog eens wat wordt met Kermit ): Het is veel makkelijker om in Whatsapp aan 9292 te vragen "hoe ben ik om 10 uur in Leiden?", dan om de app te openen, het aankomstation in te tikken, de tijd in te tikken, op Plan Reis te tikken, te ontdekken dat je vergeten bent in te geven dat 10 uur de aankomsttijd is en niet de vertrektijd, enzovoorts. Bovendien kun je straks al je andere apps dan wissen.
China ligt ver voor met bots. Je kunt met WeChat – net zoiets als WhatsApp – behalve appen ook taxi’s bestellen en betalen. Maar op het westelijk halfrond is ook iedereen bezig, van Telegram tot Facebook (Messenger) en Google misschien ook wel.

M en Tay

Facebook is bezig met een bot, M, waarmee je van alles kunt bestellen, maar hij is alleen beschikbaar in Californië en omstreken. Dat komt omdat Facebook smokkelt: (chat)bots zijn namelijk helemaal niet zo goed in het begrijpen van de vragen die door worden geappt. Daarom hebben ze er een legertje uitzendkrachten bij ingehuurd, die de vragen en antwoorden meelezen, zodat de goede spullen worden geleverd.
Microsoft dacht dat probleem op te lossen door er wat Artificial Intelligence en Deep Learning tegenaan te gooien. Dat hebben ze geweten toen ze Tay lanceerden, een chatbot op Twitter voor jonge Amerikanen, die al chattend zou gaan leren om nog veel beter te chatten:
Zoals je nog wel eens vervelende kinderen hebt die argeloze peutertjes lelijke woorden leren zodat hun ouders zich doodschrikken, zo heb je op het Internet allerlei nare types die het leuk vinden om chatbots te corrumperen. Toen een van hen erin slaagde Tay te laten zeggen: "bush did 9/11 and Hitler would have done a better job than the monkey we have now. donald trump is the only hope we've got." besloot Microsoft Tay maar even van Twitter te halen.

Bots van de baan?

Zijn bots nou van de baan? Welnee, in China chatten en bestellen ze vrolijk door. Dit was alleen een lesje in AI: net zoals er nogal een verschil is tussen een auto autonoom laten rijden over een Californische snelweg (kan al bijna) en hem autonoom achteruit in te laten parkeren op een Amsterdamse gracht waar fietsers tegen de stroom in rijden (gaat dat ooit lukken?), zo is er ook een verschil tussen een chatbot leren te vertellen hoe laat de bus naar het station vertrekt (moet kunnen) en een intelligent, empathisch gesprek te voeren over de dingen des levens. Of dat ooit gaat lukken, daar wil ik het hier nog wel eens over hebben.

zondag 28 februari 2016

Intelligentie uit boeken halen?


Vrijdagavond zat ik een documentaire van de VPRO te kijken over Google Books: Google en het Wereldbrein. Het wereldbrein was een idee van HG Wells, een laat-victoriaans scifi-schrijver. Uit 1937. Hij hoopte alle kennis, ideeën en prestatie van de mensheid in één kaartenbak (index) bij elkaar te brengen. Dat is duidelijk niet gelukt en daar was Wells destijds heel boos over.

Maar de mannen van Google, en dan vooral Page en Brin, zijn bezig het nog eens over te doen, met Google Books. Daar ging de documentaire over. Omdat ze lak hebben aan het auteursrecht van anderen (probeer niet aan het PageRank-algoritme te komen), is dat een beetje vastgelopen: met name in Europa mag Google niet zomaar alle teksten die ze ingescand hebben (want daar komt Google Books op neer: scannen van alles wat los en vast zit in de bibliotheekwereld) op het net laten zien. De Amerikaanse rechter durfde al niet tegen Google in te gaan.

Maar wat wilden die Google-mannen eigenlijk met al die boeken, behalve nog wat meer persoonsgegevens binnenharken: wie wat leest en dat soort dingen? Kevin Kelly wist dat wel. Hij heeft ooit meegedaan bij het opzetten van Wired, dus hij heeft wat te vertellen in die wereld, ook al heeft hij dezelfde primitieve opvattingen over intellectuele eigendom als de Google-mannen. Brin en Page wilden - willen- volgens hem wat Wells niet gelukt is: alle kennis van de wereld digitaal op een stel servers en vervolgens in een kunstmatig brein, om daar dan kunstmatig intelligente dingen mee te doen. Google wil immers ook vragen kunnen beantwoorden als "wat zal ik eens gaan doen vandaag" of "hoeveel Amerikanen hebben een paspoort?".

Hoe dat eruit zou kunnen zien? Halverwege de documentaire was een stukje van de aflevering van Jeopardy! te zien, die door IBM's Watson is gewonnen. Watson, een losse computer (los van het Internet) heeft zijn eigen boekencollectie ingebouwd en ook nog een serie "algoritmes" (chique naam voor losse programma's of software) om daar antwoorden uit te peuren. Misschien voorspelt dat wat Google Search gaat kunnen als het al die Google Books uit heeft?

Op dit moment krijg je als antwoord op vragen aan Google een lijst documenten, waar je zelf maar wijzer uit moet zien te worden, maar een enkele keer krijg je direct antwoord. Zoek maar eens op "wie is de koning van Spanje".

Dat leek me nou een mooie gelegenheid om te kijken wat die Watson allemaal kan. In 2011, want toen was die uitzending van Jeopardy!, een quiz waar de vragen soms in de vorm van cryptogrammen worden gesteld. Ik had niet verwacht dat ik onder de indruk zou zijn. Ik vind AI een enorme hype en het aantal problemen dat je met patroonherkenning en predictive analysis kunt oplossen is maar beperkt. Maar een computer die vragen als:

"To push one of these paper products is to stretch established limits"

kan beantwoorden is toch wel erg interessant.

Heel knap dus, maar wat heb je kun er nog meer mee, behalve aan Twee voor Twaalf meedoen?

Denk even terug aan de schaakcomputer, ook een IBM-ding. Het is fantastisch als je een grootmeester kunt verslaan, maar welke praktische problemen kun je verder oplossen als je goed kunt schaken? Antwoord: helemaal niks. Goed kunnen schaken is niet hetzelfde als intelligentie. Een spelletje Go winnen van de Europese kampioen trouwens ook niet.

Datzelfde geldt voor Watson en natuurlijk ook voor Google Zoeken: vragen beantwoorden door woordenboekdefinities, handboeken en encyclopedieën te sorteren en door elkaar te husselen is toch wat anders dan begrijpen wat er staat.

Raar eigenlijk dat Google zo ver achter ligt op IBM's Watson.