Marco Jacobs vp

Marco Jacobs is vp marketing bij Videantis.

11 December 2018

Als je ergens middenin zit, lijkt het soms of er niets om je heen gebeurt. Ik werk al vele jaren dag in dag uit in de beeldverwerking en dat gevoel heb ik vaak gehad. Maar nu zie ik toch een radicaal nieuw fenomeen opkomen in mijn vakgebied.

Beeldverwerking werd midden jaren negentig interessant, aan het begin van mijn carrière. Alle analoge beelden werden toen snel digitaal gemaakt, te beginnen bij het beeldscherm. Compressie maakte het mogelijk om digitale video over dezelfde, voor analoge tv bedoelde, kabels te verzenden. Settopboxen decomprimeerden het videosignaal dan weer vlak bij de tv. Dvd gebruikte compressie om video op een schijfje te zetten. Er kwamen digitale videorecorders en de beeldkwaliteit ging omhoog met de introductie van hd-tv en blu-ray.

Die beweging zet zich tot op de dag van vandaag voort. Je kunt op dit moment al voor driehonderd euro een 4k-beeldscherm kopen, met viermaal zo veel pixels als een hd-tv. De volgende Olympische Spelen in Tokio zullen in 8k worden uitgezonden, wederom viermaal zo veel pixels.

Eenzelfde trend heeft zich voltrokken aan de beeldopnamekant. Ook daar werd midden jaren negentig digitalisering doorgevoerd toen fotofilm werd vervangen door chips. De resolutie, beeldkwaliteit en miniaturisatie van deze sensoren ging zeer snel vooruit. De laatste Samsung-telefoon heeft nu vijf kleine camera’s: een van 24 megapixel op de voorkant en op de achterkant vier verschillende exemplaren van tezamen 47 megapixels die nauw samenwerken om onder alle omstandigheden het perfecte beeld te genereren.

Behalve de beeldschermen en camera’s is er een derde tak van sport van beeldenverwerking, die halverwege de jaren nul echt snel begon te groeien: het verspreiden van beelden via het internet. We weten allemaal dat dat een hoge vlucht heeft genomen. De video’s op Youtube, Facebook, Instagram, Netflix, Twitch en vergelijkbare diensten zijn verantwoordelijk voor driekwart van het dataverkeer op het internet.

De afgelopen twintig jaar draaide het bij beeldverwerking dus vooral om het vergaren, distribueren en presenteren van beelden. De laatste paar jaar is er een belangrijke vierde pijler bij gekomen: de computer de beelden laten begrijpen. Dat blijkt echter een stuk moeilijker. Ter vergelijking: wij gebruiken meer dan de helft van ons brein om visuele informatie te verwerken.

Voor deze slimme beeldverwerking wordt vaak deep learning gebruikt. Dit heeft een vlucht genomen sinds de ontwikkeling van Alexnet in 2012. Dit neurale net had een volledig nieuwe aanpak. Voorheen dienden algoritmeontwikkelaars zelf aan te geven of het programma moest zoeken naar lijnen, cirkels, textuur, kleur, hellingen of combinaties daarvan om bijvoorbeeld een verkeersbord te herkennen. Bij het Alexnet-algoritme worden deze afwegingen overgelaten aan de computer zelf. Het resultaat was verbluffend: Alexnet presteerde 41 procent beter in het herkennen van beelden dan de algoritmes die tot dan toe bekend waren.

Omdat deze nieuwe slimme, diep lerende algoritmes een grote nauwkeurigheid hebben en breed inzetbaar zijn, vinden ze toepassing in vele nieuwe producten: zelfrijdende auto’s, slimme mobiele telefoontoepassingen, robots voor fabrieken of thuis, medische applicaties, beveiligingscamera’s, in de landbouw, internetdatacentra en de detailhandel, waar het scannen van streepjescodes bijvoorbeeld volledig kan worden vervangen door camera’s die volgen wie er wat in het mandje legt.

Sinds Alexnet zes jaar geleden is er een stortvloed ontstaan van bedrijven en technologieën. Tientallen ondernemingen werken aan nieuwe chips met specifieke hardware aan boord om de algoritmes efficiënt te draaien. Er zijn bedrijven die duizenden mensen in dienst hebben om voorbeeldplaatjes te vergaren en met de hand te beschrijven, zodat ze gebruikt kunnen worden voor training van de algoritmes. Anderen werken aan softwareontwikkelgereedschappen die deze nieuwe manier van beeldverwerking ondersteunen, weer anderen aan simulatieomgevingen om trainingsplaatjes te genereren, aangezien je niet altijd makkelijk alle belangrijke plaatjes zelf kunt schieten. En natuurlijk worden de algoritmes zelf ook nog steeds hard doorontwikkeld.

Dit jaar worden er weer meer dan drie miljard camera’s verkocht en het grootste deel daarvan wordt al gebruikt voor slimme toepassingen. Het is moeilijk te geloven dat er pas zes jaar zijn verstreken. Eén ding is zeker: in de tweede helft van mijn carrière gaat beeldverwerking een nog veel grotere rol spelen in de maatschappij dan in de eerste.