Kľúčové poznatky
- Algoritmy rozpoznávania tváre sa zlepšujú pri čítaní tvárí s maskami.
- Nová štúdia poukazuje na obmedzenia toho, ako môže algoritmus čítať tvárovú masku, ako je farba a tvar masky.
- Odborníci tvrdia, že odvetvie rozpoznávania tváre aktívne pracuje na zahrnutí tvárových masiek do svojich algoritmov.
Mnohé odvetvia sa museli prispôsobiť pandémii, vrátane odvetvia rozpoznávania tvárí. Odborníci tvrdia, že technológia sa pomaly zlepšuje pri rozpoznávaní ľudí, ktorí nosia masky.
Nová správa zverejnená Národným inštitútom pre štandardy a technológie (NIST) ukazuje výsledky 65 nových algoritmov rozpoznávania tváre vytvorených po začiatku pandémie COVID-19, ako aj 87 algoritmov predložených pred pandémiou. Správa odhalila, že vývojári softvéru sa zlepšujú vo vývoji algoritmov, ktoré rozpoznávajú maskované tváre, dokonca sú tak presné ako bežné algoritmy na rozpoznávanie tváre.
„Zatiaľ čo niekoľko predpandemických algoritmov stále zostáva medzi najpresnejšími na maskovaných fotografiách, niektorí vývojári predložili algoritmy po pandémii, ktoré vykazujú výrazne lepšiu presnosť a teraz patria medzi najpresnejšie v našom teste,“píše sa v správe.
Čo zistila štúdia
Štúdia bola druhou svojho druhu, ktorú uskutočnila NIST s rovnakým súborom údajov, ktorý mal testovať algoritmy rozpoznávania tváre a ich presnosť v prítomnosti tvárových masiek. Autori správy použili 6,2 milióna fotografií a na tieto obrázky aplikovali simulácie rôznych kombinácií digitálnych masiek.
Mei Ngan, spoluautor správy a počítačový vedec z NIST, povedal Lifewire v telefonickom rozhovore, že prítomnosť tvárových masiek v podstate vrátila technológiu rozpoznávania tváre asi o dva až tri roky späť.
„Chybovosť je niekde medzi 2,5 % a 5 % – porovnateľné s tým, kde boli najmodernejšie technológie v roku 2017,“povedala.
Predchádzajúca správa NIST zverejnená v júli sa zaoberala výkonnosťou algoritmov rozpoznávania tváre predložených pred marcom 2020, teda pred vyhlásením Svetovej zdravotníckej organizácie za globálnu pandémiu. Táto prvá štúdia zistila, že chybovosť týchto predpandemických algoritmov je medzi 5 % a 50 %.
Aj keď sa tieto algoritmy zlepšujú pri čítaní maskovaných tvárí, novšia štúdia zistila, že niektoré faktory ovplyvňujú chybovosť, napríklad farba masky (tmavšie masky ako červená alebo čierna majú vyššiu chybovosť) a spôsob maskovania je tvarovaný (oblejšie tvary masky majú nižšiu chybovosť).
Ngan povedal, že algoritmy používajú viditeľnú časť niečí tváre, ako je oblasť okolo očí a čela, na rozpoznanie čŕt tváre, a nie na čítanie cez samotnú masku.
Budúcnosť rozpoznávania tváre a masiek na tvár
Ngan povedal, že je zrejmé, že vývojári výrazne zlepšili svoje algoritmy rozpoznávania tváre, pokiaľ ide o tvárové masky.
„Je zrejmé, že je potrebné, aby systémy rozpoznávania tváre fungovali v rámci obmedzení nosenia tvárových masiek,“povedala. „Vzhľadom na veci, ktoré sme robili, a výsledky našej nedávnej štúdie vidíme, že priemysel rozpoznávania tváre aktívne pracuje na zahrnutí tvárových masiek do svojich algoritmov.“
Vzhľadom na to, že technológia sa zlepšuje, znamená to, že bude jednoduchšie robiť veci, ako je odomykanie našich telefónov s maskou na tvár, ale pokiaľ ide o pokrok v rozpoznávaní tváre týmto spôsobom, existujú aj iné dôsledky.
Mnohé štúdie ukazujú, že rozpoznávanie tváre je často hlásené ako nesprávne identifikované nesprávne osoby a majú rasové predsudky. Štúdia NIST z roku 2019 zistila, že technológia rozpoznávania tváre nesprávne identifikuje černochov a ázijských ľudí až 100-krát častejšie ako belochov.
Aj keď sa technológia v čítaní masiek zlepšuje, percento chýb – bez ohľadu na to, aké malé – môže byť stále problémom pri nesprávnej identifikácii osoby s maskou.
Zatiaľ čo najnovšia správa NIST ukazuje, že algoritmy sa zdokonaľujú pri zvládaní úlohy masky na tvár, Ngan povedal, že len čas ukáže, či toto je naozaj to, kam smeruje budúcnosť rozpoznávania tváre počas pandémie.
"Možno môžeme očakávať ďalšie zníženie chýb, alebo možno vývojári nájdu obmedzenia množstva jedinečných informácií v nezamaskovanej oblasti," povedal Ngan.