Peter de With is hoogleraar beeldbewerking bij de TU Eindhoven.

20 dec 2018

De toepassing van artificial intelligence (ai) in beeldbewerkingssystemen heeft de afgelopen jaren een onstuimige groei doorgemaakt. Vooral met deep learning (dl) hebben we grote stappen voorwaarts gezet om computers beter objecten in beelden te laten herkennen of te begrijpen. Tegenwoordig doen ze zelfs dingen die we aanvankelijk voor onmogelijk hielden.

Bij surveillance zijn bijvoorbeeld herkenning en classificatie van verkeersobjecten en -deelnemers met dl gemeengoed geworden. Dl-systemen beoordelen hier in 95 procent of meer van de gevallen correct en het gaat ook goed als de objecten dicht op elkaar gepakt zijn. Daarnaast is het mogelijk gebleken om bij voldoende grote databestanden ook de typeaanduiding van het object met een goede score te geven.

Het is een kwestie van tijd voordat we complexere verkeerssituaties als geheel kunnen beoordelen, in plaats van de afzonderlijke objecten in de situatie. Deze toepassing is belangrijk voor onder meer wegbeheerders en overheden, die automatisch kunnen extraheren hoe en door wie de weg wordt gebruikt. Deze techniek is ook nodig voor de autonome auto en automatische controle van verkeersstromen. Hiermee kunnen we uiteindelijk stad en land aansturen (smart city) of slim ingrijpen bij ongelukken en calamiteiten.

In de gezondheidszorg is de hoge kwaliteit van detectie en herkenning een geweldige ondersteuning voor artsen. Denk hier aan de vroege detectie van (slok)darmkanker waarvoor steeds meer screening is. Het is nu allemaal mensenwerk, met alle intrinsieke onnauwkeurigheden van de mens als risicofactor. Als je veel patiënten per dag moet beoordelen op kleine nuanceverschillen in de beeldinhoud, dan is bij een gering concentratieverlies een kleine beoordelingsfout relatief snel gemaakt. Daarnaast heeft de computer een veel beter geheugen dan de mens.

Lerende netwerken komen nog beter tot hun recht bij signalen met veel ruis. Met lasers kunnen we bijvoorbeeld in de diepte van het darmweefsel checken. Deze signalen ruisen echter behoorlijk en geven nauwelijks zichtbare structuren. Hierdoor scoren artsen vrij slecht als beoordelaar, terwijl de eerste onderzoeksresultaten wijzen op een computerscore van minimaal tachtig procent.

Bij al dit positieve nieuws doemt echter ook een aantal problemen op die deels niet-technisch van aard zijn en moeten worden opgelost omdat de maatschappij dat expliciet vraagt. De industrie, veelal grote Amerikaanse bedrijven, hebben het gebruik van dl enorm gestimuleerd en gemakkelijk gemaakt. Maar niemand weet nog precies wat die softwarepakketten nu werkelijk leren van de beelden.

De eerste generatie onderzoekers is al blij dat het werkt en kan goede sier maken hiermee in wetenschap en industrie, maar uitleggen wat er precies gebeurt in dat netwerk is niet mogelijk. Dit is een gevaar voor de voortgang, maar ook de toepassing. Wie wil accepteren dat hij zal overlijden door een programmafout mag zijn hand opsteken.

Zoals zo vaak lopen de Verenigde Staten voorop bij deze discussie, deels door de claims die slachtoffers kunnen indienen. De Amerikaanse FDA staat toepassing van dl toe onder de voorwaarde dat het betrokken bedrijf of instituut haarfijn kan uitleggen hoe het netwerk werkt en waar de tekortkomingen zitten. Dit werkt in eerste instantie vertragend, maar op termijn is dit een goede ontwikkeling en leidt het tot betere veiligheid voor patiënten.

Het kennishiaat biedt ook kansen voor de Nederlandse en Europese industrie. Die staat op achterstand vergeleken met de VS en China, maar we kunnen een deel goedmaken door op tijd met onderzoek te beginnen waarin de kwaliteit van het lerende netwerk wordt aangetoond. Ook zouden we werkprocessen kunnen definiëren waarbij we de tekortkomingen en fouten van zelflerende systemen loggen en gevalideerde verbeteringen daarvoor overnemen in een verplicht verbeterproces – vergelijkbaar met de procedures in de vliegtuigindustrie.

Ook beeld- en geluidsmanipulatie openen nieuwe deuren. Met lerende netwerken zal het spoedig mogelijk zijn mensen op film te vervangen door levensechte modellen (deepfake). Die doen dan domme dingen die in werkelijkheid niet zijn gebeurd. Als we methodes ontwikkelen om dat soort manipulaties te detecteren en te ontzenuwen, kunnen we onze politici en bekende Nederlanders beter beschermen in de toekomst.

Apr
11

High-Tech Systems

Eindhoven

High-end system engineering and disruptive mechatronics

Kortom: de tweede generatie dl komt eraan en biedt geweldige kansen voor degenen die kwaliteit en integriteit willen waarborgen. Daarvoor zou genoeg interesse moeten zijn, zeker in Europa.