Programovanie

Čo je to rozpoznávanie tváre? AI pre Veľkého brata

Dokáže Veľký brat rozpoznať vašu tvár podľa CCTV monitorovania na ulici a povedať, či ste šťastní, smutní alebo nahnevaní? Môže táto identifikácia viesť k vášmu zatknutiu na základe nevybaveného zatykača? Aká je pravdepodobnosť, že identifikácia je nesprávna a skutočne sa spája s niekým iným? Dokážete celkom poraziť sledovanie pomocou nejakého triku?

Na druhú stranu, môžete sa dostať do trezoru chráneného kamerou a softvérom na identifikáciu tváre podržaním odtlačku tváre oprávnenej osoby? Čo ak si nasadíte 3-D masku tváre oprávnenej osoby?

Vitajte v rozpoznávaní tváre - a v spoofingu rozpoznávania tváre.

Čo je to rozpoznávanie tváre?

Rozpoznávanie tváre je metóda identifikácie neznámej osoby alebo autentifikácie identity konkrétnej osoby z jej tváre. Je to oblasť počítačového videnia, ale rozpoznávanie tváre je špecializované a pre niektoré aplikácie sa dodáva so sociálnou batožinou, ako aj s určitými zraniteľnosťami voči falšovaniu.

Ako funguje rozpoznávanie tváre?

Algoritmy skorého rozpoznávania tváre (ktoré sa v súčasnosti stále používajú v vylepšenej a automatizovanejšej podobe) sa spoliehajú na biometriu (napríklad vzdialenosť medzi očami), ktorá premení namerané tvárové rysy z dvojrozmerného obrazu na množinu čísel (znak vektor alebo šablóna), ktorý popisuje tvár. Proces rozpoznávania potom porovnáva tieto vektory s databázou známych tvárí, ktoré boli mapované na prvky rovnakým spôsobom. Jednou z komplikácií v tomto procese je úprava tvárí na normalizované, aby sa zohľadnilo otáčanie a nakláňanie hlavy pred extrahovaním metrík. Táto trieda algoritmov sa nazýva geometrický.

Ďalším prístupom k rozpoznávaniu tváre je normalizácia a kompresia 2-D snímok tváre a ich porovnanie s databázou podobne normalizovaných a komprimovaných snímok. Táto trieda algoritmov sa nazýva fotometrické.

Trojrozmerné rozpoznávanie tváre využíva 3-D senzory na snímanie obrazu tváre alebo rekonštruuje 3-D obraz z troch 2-D sledovacích kamier nasmerovaných do rôznych uhlov. 3-D rozpoznávanie tváre môže byť podstatne presnejšie ako 2-D rozpoznávanie.

Analýza textúry kože mapuje čiary, vzory a škvrny na tvári človeka na iný vektor funkcií. Pridanie analýzy textúry pokožky k 2-D alebo 3-D rozpoznávaniu tváre môže zlepšiť presnosť rozpoznávania o 20 až 25 percent, najmä v prípade dvojčiat a dvojčiat. Môžete tiež kombinovať všetky metódy a pridať ešte viacspektrálne obrázky (viditeľné svetlo a infračervené žiarenie), aby ste dosiahli ešte väčšiu presnosť.

Rozpoznávanie tváre sa medziročne zlepšuje od začiatku práce v odbore v roku 1964. Miera chybovosti sa v priemere každé dva roky znížila o polovicu.

Súvisiace video: Ako funguje rozpoznávanie tváre

Testy dodávateľov rozpoznávania tváre

NIST, americký Národný inštitút pre štandardy a technológie, USA od roku 2000 vykonáva testy algoritmov rozpoznávania tváre, FRVT (Face Recognition Vendor Test). Použité súbory obrazových dát sú väčšinou zábery z hrnčekov na presadzovanie práva, ale zahŕňajú divoké statické obrázky, ako sú tie, ktoré sa nachádzajú vo Wikimedia, a obrázky s nízkym rozlíšením z webových kamier.

Algoritmy FRVT sú väčšinou predkladané komerčnými dodávateľmi. Medziročné porovnania ukazujú zásadný nárast výkonu a presnosti; podľa dodávateľov je to primárne kvôli použitiu hlbokých konvolučných neurónových sietí.

Súvisiace testovacie programy NIST na rozpoznávanie tváre študovali demografické účinky, detekciu morfovania tváre, identifikáciu tvárí zverejnených na sociálnych sieťach a identifikáciu tvárí vo videu. Predchádzajúca séria testov bola vykonaná v 90. rokoch minulého storočia pod iným menom, Face Recognition Technology (FERET).

NIST

Aplikácie na rozpoznávanie tváre

Aplikácie rozpoznávania tváre väčšinou spadajú do troch hlavných kategórií: bezpečnosť, zdravie a marketing / maloobchod. Zabezpečenie zahŕňa vymáhanie práva a táto trieda použitia rozpoznávania tváre môže byť rovnako neškodná, ako je rýchlejšie a presnejšie priraďovanie ľudí k ich pasovým fotografiám, ako aj scenár „Osoby záujmu“, kde sú ľudia sledovaní pomocou CCTV a porovnávaní do zhromaždených databáz fotografií. Medzi zabezpečenie mimo oblasti presadzovania práva patria bežné aplikácie, ako napríklad odblokovanie tváre pre mobilné telefóny a kontrola prístupu do laboratórií a trezorov.

Aplikácie rozpoznávania tváre na zdravie zahŕňajú registrácie pacientov, detekciu emócií v reálnom čase, sledovanie pacientov v rámci zariadenia, hodnotenie úrovní bolesti u neverbálnych pacientov, detekciu určitých chorôb a stavov, identifikáciu personálu a bezpečnosť zariadenia. Medzi marketingové a maloobchodné aplikácie rozpoznávania tváre patrí identifikácia členov vernostného programu, identifikácia a sledovanie známych priekupníkov a rozpoznávanie ľudí a ich emócií pri cielených návrhoch produktov.

Kontroverzie, zaujatosti a zákazy rozpoznávania tváre

Povedať, že niektoré z týchto aplikácií sú kontroverzné, by bolo podhodnotením. Ako sa hovorí v článku New York Times z roku 2019, rozpoznávanie tváre sa rozprúdilo kontroverzne, od jeho použitia na sledovanie štadiónov až po rasistický softvér.

Sledovanie štadióna? Rozpoznávanie tváre bolo použité na Super Bowle v roku 2001: softvér identifikoval 19 ľudí považovaných za osoby, na ktoré sa vzťahujú nevybavené zatykače, hoci nikto nebol zatknutý (nie pre nedostatok pokusov).

Rasistický softvér? Vyskytlo sa niekoľko problémov, počnúc softvérom na sledovanie tváre z roku 2009, ktorý dokázal sledovať bielu farbu pleti, ale nie čiernymi, a pokračoval štúdiou MIT z roku 2015, ktorá ukázala, že vtedajší softvér na rozpoznávanie tváre pracoval na bielych mužských tvárach oveľa lepšie ako na ženských a / alebo Čierne tváre.

Tieto druhy problémov viedli k úplným zákazom softvéru na rozpoznávanie tváre na konkrétnych miestach alebo na konkrétne účely. V roku 2019 sa San Francisco stalo prvým veľkým americkým mestom, ktoré zablokovalo polícii a iným orgánom činným v trestnom konaní používanie softvéru na rozpoznávanie tváre; Microsoft požadoval federálne nariadenia o rozpoznávaní tváre; a MIT ukázali, že Amazon Rekognition mal väčšie problémy s určením ženského pohlavia ako mužského z obrázkov tváre, rovnako ako väčšie problémy s čiernym ženským pohlavím ako s bielym ženským pohlavím.

V júni 2020 spoločnosť Microsoft oznámila, že nebude predávať a nepredala svoj softvér na rozpoznávanie tváre polícii; Amazon zakázal polícii rok používať Rekognition; a IBM upustilo od technológie rozpoznávania tváre. Úplný zákaz rozpoznávania tváre nebude ľahký, vzhľadom na jeho široké prijatie v telefónoch iPhone (Face ID) a ďalších zariadeniach, softvéri a technológiách.

Nie každý softvér na rozpoznávanie tváre trpí rovnakými predsudkami. Štúdia demografických efektov NIST z roku 2019 nadviazala na prácu MIT a ukázala, že algoritmické demografické skreslenie sa medzi vývojármi softvéru na rozpoznávanie tváre veľmi líši. Áno, existujú demografické účinky na mieru nesprávnej zhody a mieru nesprávnej zhody algoritmov identifikácie tváre, ale môžu sa líšiť o niekoľko rádov od dodávateľa k predajcovi a časom sa znižovali.

Hackovanie rozpoznávania tváre a techniky proti falšovaniu

Vzhľadom na potenciálne ohrozenie súkromia v dôsledku rozpoznávania tváre a príťažlivosť získania prístupu k zdrojom vysokej hodnoty chráneným autentifikáciou tváre bolo vynaložené veľa úsilia na hacknutie alebo znefunkčnenie technológie. Môžete predložiť vytlačený obrázok tváre namiesto živej tváre alebo obrázok na obrazovke alebo trojrozmernú tlačenú masku, aby ste dosiahli overenie totožnosti. Pri CCTV sledovaní môžete prehrávať video. Ak sa chcete vyhnúť sledovaniu, môžete vyskúšať látky a make-up „CV Dazzle“ alebo svetelné zdroje IR, aby ste oklamali softvér tak, že nedetegoval vašu tvár.

Samozrejmosťou je úsilie o vývoj techník anti-spoofing pre všetky tieto útoky. Na detekciu tlačených obrázkov používajú predajcovia test živosti, napríklad čakanie na blikanie subjektu, alebo vykonanie pohybovej analýzy alebo infračervené rozlíšenie na rozlíšenie živej tváre od vytlačeného obrázka. Ďalším prístupom je vykonanie analýzy mikroštruktúry, pretože ľudská pokožka sa opticky líši od výtlačkov a materiálov masiek. Najnovšie techniky proti spoofingu sú väčšinou založené na hlbokých konvolučných neurónových sieťach.

Toto je vyvíjajúca sa oblasť. Medzi útočníkmi a anti-spoofingovým softvérom prebieha vojnová vojna, ako aj akademický výskum účinnosti rôznych útočných a obranných techník.

Predajcovia rozpoznávania tváre

Podľa Nadácie Electronic Frontier Foundation je spoločnosť MorphoTrust, dcérska spoločnosť spoločnosti Idemia (predtým známa ako OT-Morpho alebo Safran), jedným z najväčších dodávateľov technológií na rozpoznávanie tváre a ďalších technológií biometrickej identifikácie v Spojených štátoch. Navrhla systémy pre štátne DMV, federálne a štátne orgány činné v trestnom konaní, hraničné kontroly a letiská (vrátane TSA PreCheck) a štátne oddelenie. Medzi ďalších bežných dodávateľov patria spoločnosti 3M, Cognitec, DataWorks Plus, Dynamic Imaging Systems, FaceFirst a NEC Global.

Test dodávateľov rozpoznávania tváre NIST obsahuje algoritmy od mnohých ďalších dodávateľov z celého sveta. Existuje tiež niekoľko otvorených algoritmov rozpoznávania tváre s rôznou kvalitou a niekoľko hlavných cloudových služieb, ktoré ponúkajú rozpoznávanie tváre.

Amazon Rekognition je služba analýzy obrazu a videa, ktorá dokáže identifikovať objekty, ľudí, text, scény a aktivity vrátane analýzy tváre a vlastných štítkov. Google Cloud Vision API je vopred pripravená služba na analýzu obrázkov, ktorá dokáže detekovať objekty a tváre, čítať tlačený a ručne písaný text a vytvárať metadáta do vášho katalógu obrázkov. Google AutoML Vision vám umožňuje trénovať vlastné modely obrázkov.

Rozhranie Azure Face API vykonáva detekciu tváre, ktorá vníma tváre a atribúty v obraze, vykonáva identifikáciu osôb, ktorá sa zhoduje s jednotlivcom vo vašom súkromnom úložisku až s 1 miliónom ľudí, a vykonáva rozpoznávanie vnímaných emócií. Face API môže bežať v cloude alebo na okraji v kontajneroch.

Tvárové súbory údajov na školenie o rozpoznávaní

Na stiahnutie sú k dispozícii desiatky súborov údajov o tvári, ktoré je možné použiť na školenie rozpoznávania. Nie všetky súbory údajov o tvári sú rovnaké: Zvyčajne sa líšia veľkosťou obrázka, počtom zastúpených osôb, počtom obrázkov na osobu, podmienkami obrázkov a osvetlením. Orgány činné v trestnom konaní majú tiež prístup k neverejným súborom údajov o tvári, ako sú napríklad súčasné mugshoty a obrázky vodičských preukazov.

Niektoré z väčších databáz tvárí sú Označené tváre v divočine s približne 13 000 jedinečnými ľuďmi; FERET, používaný pre prvé testy NIST; databáza Mugshot použitá v prebiehajúcom NIST FRVT; databáza monitorovacích kamier SCFace, ktorá je k dispozícii aj s orientačnými bodmi tváre; a označené tváre Wikipédie s ~ 1,5 000 jedinečnými identitami. Niektoré z týchto databáz obsahujú viac obrázkov na jednu identitu. Tento zoznam výskumníka Ethana Meyersa ponúka niekoľko presvedčivých rád pri výbere súboru údajov o tvári na konkrétny účel.

Stručne povedané, rozpoznávanie tváre sa zlepšuje a predajcovia sa učia odhaľovať väčšinu falšovania, ale niektoré aplikácie technológie sú kontroverzné. Miera chybovosti rozpoznávania tváre sa podľa NIST znižuje o každé dva roky na polovicu. Predajcovia vylepšili svoje techniky proti spoofingu začlenením konvolučných neurónových sietí.

Medzitým existujú iniciatívy zakazujúce používanie rozpoznávania tváre pri sledovaní, najmä zo strany polície. Úplný zákaz rozpoznávania tváre by bol ťažký vzhľadom na to, ako veľmi sa rozšíril.

Prečítajte si viac o strojovom učení a hlbokom učení:

  • Hlboké učenie vs. strojové učenie: Pochopte rozdiely
  • Čo je to strojové učenie? Spravodajstvo odvodené z údajov
  • Čo je to hlboké učenie? Algoritmy, ktoré napodobňujú ľudský mozog
  • Algoritmy strojového učenia vysvetlené
  • Vysvetlenie automatizovaného strojového učenia alebo AutoML
  • Vysvetlenie kontrolovaného učenia
  • Vysvetlenie čiastočne kontrolovaného učenia
  • Výučba bez dozoru vysvetlená
  • Vysvetlenie posilňovacieho učenia
  • Čo je to počítačové videnie? AI pre obrázky a video
  • Čo je to rozpoznávanie tváre? AI pre Veľkého brata
  • Čo je spracovanie prirodzeného jazyka? AI pre reč a text
  • Kaggle: Kde sa vedci o údajoch učia a súťažia
  • Čo je CUDA? Paralelné spracovanie pre GPU
$config[zx-auto] not found$config[zx-overlay] not found