Inspirasjon

Computer vision – en hjørnesten i kunstig intelligens

Selvkjørende biler, VR, ansiktsgjenkjenning og autonome industriroboter er noen av de hotteste teknologiområdene akkurat nå. Og de har alle en ting til felles – computer vision. Men å få en maskin til å se forskjell på en plastpose og en ball er vanskeligere enn man skulle tro.

Computer vision er et forskningsfelt som alene ikke har fått så stor oppmerksomhet, men som ligger til grunn for mye av det vi nå ser på som den mest aktuelle fremtidsteknologien. Å lære en maskin å tolke visuell informasjon er en sentral del innen kunstig intelligens, autonome kjøretøy, roboter og mye annet.

Allerede i dag brukes computer vision innen vidt forskjellige felt som helsetjeneste og bekjempelse av kriminalitet. Gjennom ansiktsgjenkjenning kan systemer selv oppdage om en bestemt person finnes på en overvåkningsvideo. På den måten slipper en medarbeider å måtte sitte og se på en mengde videomateriale manuelt. På samme måte kan røntgenbilder analyseres automatisk, for å gjøre en første skanning på jakt etter for eksempel kreftsvulster.

– Man kan tenke seg en helsetjeneste på nettet der visse typer førsteanalyser automatiseres. I de tilfellene der datamaskinen anser et behov for nærmere analyser, sendes man videre til en menneskelig lege, sier Michael Felsberg som er professor i computer vision ved Linköpings universitet.

Utfordrende å tolke bilder

Men noe som vi mennesker tar for gitt er veldig komplisert for en maskin. Å tolke sine omgivelser er ikke først og fremst et spørsmål om å kunne se, men å forstå hva du ser.

– Et bilde er bare en stor matrise. Den inneholder ingen konkret informasjon om objekter eller avstand. Det eneste et kamera måler er intensiteten i lyset. All tolkning skjer i programvaren, sier Michael Felsberg.

En utfordring for computer vision handler om ren prosessorkraft. I dagens selvkjørende biler finnes det for eksempel kamera, gps, radar, laser og mange andre kilder til informasjon. Alt dette må tas inn, tolkes og behandles av datamaskinen for at bilen skal kunne fatte en beslutning om å fortsette ferden.

Men den største utfordringen ligger i metodikken. Det som er enkelt for et menneske; å få en spontan oppfattelse av verden bare ved å se på den, er vanskelig for en datamaskin.

– Datamaskiner er flinke til å se om et bilde henger rett, men å skille på en plastpose og en ball er vanskelig for computer vision. Vi prøver å bryte ned en del av menneskets intelligens som er veldig fundamental, men likevel vanskelig å måle. Det gjør det veldig vanskelig å bygge modeller for hvordan datamaskinen skal tolke det den ser, sier Michael Felsberg.

Selvlærende systemer

I stedet for å prøve å forutse alle mulige situasjoner en selvkjørende bil kan havne i, har forskerne de siste årene byttet fokus mot maskininnlæring. Det innebærer at de trener opp et intelligent system, i stedet for å programmere det. Men dette fører til andre problemer.

– I selvlærende systemer er det to utfordringer. Det ene er å vite hvorfor noe fungerer eller ikke. Det andre er å få et mål på hvor sannsynlig det er at en tolkning er korrekt, sier Michael Felsberg.

Når kommer computer vision til det nivået der vi faktisk har selvkjørende biler i større kommersiell skala? Michael Felsberg synes det er vanskeligere enn noen gang å forutse, men svarer på spørsmålet gjennom å fortelle om hvilke anbefalinger han har gitt sine barn om å ta førerkortet.

– Min datter som er 18 år ha allerede tatt førerkortet, og jeg anbefaler min 16-årige sønn å gjøre det samme. Men min 12-årige sønn kommer kanskje ikke til å trenge det, sier han.

Flere IT-trender finner du her

21 august 2018

Tagger