Text

  • Studieort sal Kappa, MDH Västerås.
Datum
  • 2020-01-28 09:15

Carl Ahlberg försvarar sin doktorsavhandling i datavetenskap

Carl Ahlberg, vid akademin för innovation, design och teknik (IDT), försvarar sin doktorsavhandling i datavetenskap, den 28 januari, klockan 09:15 i sal Kappa, MDH Västerås.

Titel: “Embedded high-resolution stereo-vision of high frame-rate and low latency through FPGA-acceleration”.

Serienummer: 304.

Opponent är professor Ignacio Bravo Munoz, Alcalá de Henares Spain.

Betygsnämnden utgörs av professor Antonio Jesus Bandera Rubio, University of Malaga, professor Knut Åkesson, Chalmers och docent Saad Mubeen, MDH.

Reserv är professor Cristina Seceleanu, MDH.

Sammanfattning:

Autonoma agenter är beroende av information från den omgivande miljön för att agera. I en mängd av tillgängliga sensorer är troligtvis bildsensorn den mest mångsidiga, då den möjliggör särskillnad av färg, storlek, form och djup. För det sistnämnda är, i en dynamisk miljö utan krav på förkunskaper, stereovision en vanligt tillämpad teknik. Tolkning av bildinnehåll och extrahering av relevant information går under benämningen datorseende. Datorseende, och specifikt stereoalgoritmer, är redan för ett enskilt bildpar komplexa och

beräkningsmässigt kostsamma, och ger resultat som, i termer av noggrannhet, är kvalitativt svåra att jämföra. Problematiken utökas vidare av kontinuerlig ström av bilder, med allt högre bildfrekvens och upplösning. För autonoma agenter krävs dessutom överväganden vad gäller realtidskrav, inbyggda system/resursbegränsade beräkningsplattformar, strömförbrukning och fysisk storlek, vilket summerar till ett otvetydigt utmanande problem.

Den här avhandlingen syftar till att åstadkomma högupplöst stereovision med hög uppdateringsfrekvens och låg latens på inbyggda system. Genom att närma sig problemet från två olika vinklar, hårdvaru- och algoritmmässigt, kan ett symbiotiskt förhållande däremellan säkerställas.

Avhandlingens första bidrag är GIMME och GIMME2 inbyggda visionsplattformar, som erbjuder FPGA-baserad hårdvaruaccelering, med särskilt fokus på stereoseende, i kontrast till för tidpunkten kommersiellt tillgängliga system.

Det andra bidraget, härrörande stereoalgoritmer, är tudelat. Först hanteras skalbarhetproblemet, sammankopplat med disparitetsomfånget, genom att föreslå en segmentbaserad stereoalgoritm.

I segmentrymden är matchningen oberoende av bildupplösningen, samt att disparitetsomfånget definieras i termer av segment, vilket antyder att relativt få hypoteser behövs för att omfatta hela scenen. I det andra bidraget på algoritmnivå, mer i linje med konventionella stereoalgoritmer för FPGAer, har Censustransformen (CT) identifierats som ett återkommande kostnadsmått för likhet. Här föreslås en optimering av CT genom att tillämpa genetisk algoritm (GA) – Genetisk Algoritm Census Transform (GACT). GACT visar lovande resultat för referensdataset jämfört med etablerade CT-metoder, men är samtidigt resurseffektiv.

Kontaktinformation