Toshiba Corporation on kehittänyt 3D-tunnistuksella varustetun tekoälyn, joka pystyy mittaamaan etäisyyden stereokameran tarkkuudella käyttämällä kaupallisella kameralla otettua kuvaa ja analysoimalla kameran linssin aiheuttamaa epätarkkuutta syvällisen oppimisen avulla. Tämä tekniikka estää stereokameroiden käytön, mikä lopulta vähentää kustannuksia ja tilaa. Toshiba esittelee tämän saavutuksen Etelä-Koreassa 30. lokakuuta 2019 klo 10 alkaen pidettävässä kansainvälisessä tietokonenäkökonferenssissa (ICCV2019).
Kuvan tunnistaminen on tulossa yhä tärkeämmäksi, ja sovellukset, kuten esineiden liikkuvat robotit, itsenäiset miehittämättömät ajoneuvot, kauko-ohjattavat dronit, jotka tarkastavat infrastruktuuria, edellyttävät muutakin kuin vain kuvia kohteista, he tarvitsevat pienen laitteen 3D-tietojen analysoimiseksi muodon ja etäisyyden mukaan. Siksi tutkimuksia on lisätty monokulaarikameroiden mittaustekniikan kehittämiseksi (ne on helppo pienentää) käyttämällä syvää oppimista oppimaan paremmin kuvan muoto, tausta ja muut maisematiedot.
Tällä menetelmällä on haittapuoli; etäisyyden tarkkuus arvioidaan monokulaarikameran avulla opittujen maisematietojen mukaan, mikä aiheuttaa tarkkuuden laskun eri maisemissa otettujen kuvien vuoksi. Tämän voittamiseksi Toshiba on kehittänyt värisuodatetun aukkovalokuvauksen, jossa linssiin on kiinnitetty kaksi värisuodatinta ja tuloksena olevan kuvan epätarkkuuden väri ja koko analysoidaan kohteen etäisyyden mukaan. Vaikka tämä ratkaisee tietojen riippuvuuden ongelman, nykyisten linssien muokkaaminen maksaa aikaa ja rahaa.
Toshiba on voittanut tämän ongelman kehittämällä tekoälyn 3D-tunnistustekniikalla, joka käyttää syvää oppimista analysoimaan kuvan sumentumista sen sijainnin mukaan objektiivissa, jotta etäisyys voidaan mitata samalla tarkkuudella kuin stereokamerajärjestelmä, tavallisella monokulaarikameralla, mutta ilman maisematietoja. Toistaiseksi katsottiin teoreettisesti mahdottomaksi mitata etäisyyttä epätarkkuuden muodon perusteella, joka on sama esineille, joilla on sekä etäisyys että etäisyys, kun ne ovat yhtä kaukana polttopisteestä. Analyysitulokset ovat kuitenkin osoittaneet merkittävän eron lähellä ja kaukana olevien kohteiden hämärtymismuotojen välillä, vaikka ne olisivatkin yhtä kaukana polttopisteestä. Sen avulla Toshiba analysoi onnistuneesti siepattujen kuvien hämärtymät syvän hermoverkkomallin kanssa koulutetun syvän oppimismoduulin avulla.
Kun valo kulkee linssin läpi, syntyvän epätarkkuuden muodon tiedetään muuttuvan valon aallonpituudesta ja sijainnista linssissä. Kehitetyssä verkossa sijainti ja väri käsitellään erikseen hämärtymisen muodon muutosten asianmukaisen havaitsemiseksi ja sitten painotetun tarkkailumekanismin läpikäynnin jälkeen ohjaamaan kirkkauden kaltevuuteen kohdistuvaa sijaintia etäisyyden oikean mittaamiseksi. Oppimisen avulla verkko päivitetään sitten vähentämään virhettä mitatun etäisyyden ja todellisen etäisyyden välillä. Tämän tekoälymoduulin avulla Toshiba on vahvistanut, että yksi kaupallisesti saatavana olevalla kameralla otettu kuva toteuttaa saman etäisyyden mittaustarkkuuden, joka on varmistettu stereokameroilla. Lisätietoja löytyy tältä Toshiban viralliselta sivulta.
Toshiba vahvistaa järjestelmän monipuolisuuden kaupallisesti saatavilla olevilla kameroilla ja linsseillä ja nopeuttaa kuvankäsittelyä. Tavoitteena on julkinen toteutus tilikaudella 2020.