9 februari 2017

Google verbetert beveiligingsbeelden

Wazige en ongedetailleerde camerabeelden zijn straks verleden tijd, dankzij twee nieuwe kunstmatige intelligenties van internetbedrijf Google. Die kunnen van een paar pixels een herkenbaar gezicht maken, dankzij deep learning.

De kunstmatige intelligentie zou agenten kunnen helpen bij hun opsporingsbezigheden. Beveiligingscamera's hebben immers vaak een beeld met lage resolutie van een vermeende dader, waar de politie nauwelijks een gezicht in kan herkennen. De Google-onderzoekstakken Deepmind en Brain maken van beelden van 64 pixels een herkenbaar (zij het nog steeds korrelig) gezicht, waar je veel eerder een persoon in kunt herkennen.

'Enhance'

De techniek maakt een fantasie uit misdaadseries als CSI werkelijkheid. In die series zoomen rechercheurs eindeloos in op camerabeelden, waarbij de kwaliteit van het beeld nooit afneemt. Wat Google doet is echter niet hetzelfde; het gebruikt twee kunstmatig intelligente programma's om tot een 'waarschijnlijke' weergave van een gezicht te komen.

Allereerst neemt één programma foto's van hogere resolutie, en schaalt ze terug tot 64 pixels. Vervolgens kijkt het kunstmatige intelligente algoritme of één van die pixelplaatjes overeenkomt met het oorspronkelijke beeld. Het vergelijken van beelden kan Google goed; de beeldzoekmachine van Google Images gebruikt het immers ook.

Voorbeelden van door Google bekeken gezichten. Links het oorspronkelijke pixelplaatje; de tweede kolom van rechts is het echte beeld.

Pixels verzinnen

Het andere deel van de beeldoperatie is interessanter: de AI kijkt naar de pixels en probeert aan de hand van kleur en positie ten opzichte van andere pixels te bepalen wat het beeld voorstelt. Ziet het bijvoorbeeld een rode pixel midden onderin, dan is dat waarschijnlijk een mond, mogelijk met lippenstift. De AI leert dat door een heleboel soortgelijke, maar grotere plaatjes te bekijken. Zo 'leert' de computer hoe een gezicht, of slaapkamer (het andere onderzoeksonderwerp voor dit project) eruit ziet. Weet het programma eenmaal wat er waarschijnlijk in de pixels te zien is, dan voegt het pixels toe voor een afbeelding van hogere resolutie. Daarbij wordt die éne rode pixel plotseling een mond met lippenstift.

Daarbij verzint het algoritme dus pixels. Die informatie wordt gecombineerd met het resultaat van de zoektocht naar een soortgelijk beeld. De computer voegt alles samen, en op die manier ontstaat een korrelig beeld van 32 x 32 pixels, vier keer scherper dan de oorspronkelijke pixel-brij.

Bewijsmateriaal

De resultaten lijken overtuigend. In vergelijking met het echte beeld heeft het algoritme zeker een idee hoe een gezicht eruit hoort te zien. De vraag is hoe nauwkeurig het is; aangezien er pixels en gezichtsaspecten worden verzonnen kan er ook iets uitkomen dat er realistisch uitziet, maar in werkelijkheid niets met het origineel te maken heeft. Daarom zal het als bewijsmateriaal niet helpen.

Toch is dit een stap vooruit ten opzichte van de gebruikelijke techniek om beelden te verbeteren. Daarbij worden pixels bekeken en wordt het gemiddelde beeld genomen van een aantal naast elkaar liggende pixels. Dat zorgt voor een beter beeld, maar het is ook per definitie onscherp. Daar heeft de methode van Google geen last van.