Prečo podniky prechádzajú z TensorFlow na PyTorch

Hĺbkové učenie, podkategória strojového učenia, využíva viacvrstvové neurónové siete na automatizáciu historicky náročných strojových úloh - ako je rozpoznávanie obrázkov, spracovanie prirodzeného jazyka (NLP) a strojový preklad - v rozsahu.

TensorFlow, ktorý vzišiel zo spoločnosti Google v roku 2015, je najpopulárnejším rámcom hlbokého učenia otvoreného zdroja pre výskum aj podnikanie. Ale PyTorch, ktorý sa z Facebooku vynoril v roku 2016, sa rýchlo dotiahol vďaka vylepšeniam v oblasti komunity, ktoré uľahčujú použitie a nasadenie pre širšiu škálu prípadov použitia.

Spoločnosť PyTorch zaznamenáva obzvlášť silné prijatie v automobilovom priemysle - kde ju možno použiť na pilotné systémy autonómneho riadenia od spoločností Tesla a Lyft úrovne 5. Rámec sa tiež používa na klasifikáciu a odporúčanie obsahu v mediálnych spoločnostiach a na podporu robotov v priemyselných aplikáciách.

Joe Spisak, vedúci produktu umelej inteligencie spoločnosti Facebook AI, uviedol, že aj keď ho potešilo zvýšenie podnikového zavádzania PyTorch, je potrebné ešte veľa urobiť, aby sa dosiahlo širšie prijatie v priemysle.

„Ďalšia vlna adopcie príde s umožnením správy životného cyklu, potrubí MLOps a Kubeflow a komunity okolo toho,“ uviedol. „Pre tých, ktorí sú na začiatku cesty, sú tieto nástroje veľmi dobré, pretože na začiatok používajú spravované služby a nejaký otvorený zdroj s niečím ako SageMaker v AWS alebo Azure ML.“

Disney: Identifikácia animovaných tvárí vo filmoch

Od roku 2012 inžinieri a vedci v oblasti mediálneho giganta Disney budujú to, čo spoločnosť nazýva Content Genome, graf znalostí, ktorý spája metaúdaje obsahu a umožňuje vyhľadávanie a personalizáciu aplikácií založených na strojovom učení v masívnej knižnici obsahu Disney.

„Tieto metaúdaje vylepšujú nástroje, ktoré používajú rozprávači disneyov na výrobu obsahu; inšpirovať iteratívnu tvorivosť pri rozprávaní príbehov; posilniť zážitky používateľov prostredníctvom nástrojov odporúčaní, digitálnej navigácie a zisťovania obsahu; a umožniť business intelligence, “napísali vývojári spoločnosti Disney Miquel Àngel Farré, Anthony Accardo, Marc Junyent, Monica Alfaro a Cesc Guitart v júli na blogu.

Predtým, ako sa to mohlo stať, musel Disney investovať do rozsiahleho projektu anotácie obsahu a obrátil sa na svojich dátových vedcov, aby vycvičili automatizovaný kanál značkovania pomocou modelov hĺbkového učenia na rozpoznávanie obrázkov na identifikáciu obrovského množstva obrázkov ľudí, postáv a miest.

Inžinieri spoločnosti Disney začali experimentovaním s rôznymi rámcami vrátane TensorFlow, ale v roku 2019 sa rozhodli konsolidovať okolo programu PyTorch. Inžinieri prešli od konvenčného deskriptora funkcií histogramu orientovaných gradientov (HOG) a modelu populárnych podporných vektorových strojov (SVM) k verzii architektúra detekcie objektov dabovaná do oblastí s konvolučnými neurónovými sieťami (R-CNN). Posledné menované bolo priaznivejšie pre manipuláciu s kombináciami živých akcií, animácií a vizuálnych efektov bežných v obsahu Disney.

"Je ťažké definovať, čo je tvár v karikatúre, takže sme prešli k metódam hlbokého učenia pomocou detektora objektov a použili prenosové učenie," vysvetlila inžinierka Disney Research Monica Alfaro. Po spracovaní iba niekoľkých tisíc tvárí už nový model vo všetkých troch prípadoch použitia zhruba identifikoval tváre. Do výroby sa dostal v januári 2020.

„Teraz používame iba jeden model pre tri typy tvárí, a to je skvelé pre film Marvel, ako je Avengers, kde je potrebné rozpoznať Iron Mana a Tonyho Starka alebo akúkoľvek postavu s maskou,“ uviedla.

Pretože sa inžinieri zaoberajú takým veľkým objemom obrazových dát, aby mohli paralelne trénovať a spúšťať model, chceli pri prechode do výroby tiež pracovať na drahých a vysoko výkonných grafických procesoroch.

Prechod od CPU umožnil inžinierom rýchlejšie preškoliť a aktualizovať modely. Urýchlilo to tiež distribúciu výsledkov do rôznych skupín v rámci spoločnosti Disney, čím sa skrátil čas spracovania hraného filmu na zhruba hodinu a dnes sa výsledky dostanú medzi päť až desať minút.

"Detektor objektov TensorFlow priniesol problémy s pamäťou pri výrobe a bolo ťažké ho aktualizovať, zatiaľ čo program PyTorch mal rovnaký detektor objektov a Faster-RCNN, takže sme program PyTorch začali používať na všetko," uviedol Alfaro.

Tento prechod z jedného rámca na druhý bol prekvapivo jednoduchý aj pre inžiniersky tím. "Zmena [na PyTorch] bola ľahká, pretože je to všetko zabudované, iba pripojíte niektoré funkcie a môžete začať rýchlo, takže to nie je strmá krivka učenia," uviedol Alfaro.

Keď narazili na nejaké problémy alebo úzke miesta, bola im k dispozícii živá komunita PyTorch.

Technológia Blue River: roboty na ničenie buriny

Spoločnosť Blue River Technology navrhla robota, ktorý využíva honosnú kombináciu digitálneho hľadania cesty, integrovaných kamier a počítačového videnia na postrekovanie burín herbicídom, zatiaľ čo necháva plodiny osamote v takmer reálnom čase, čo pomáha poľnohospodárom efektívnejšie konzervovať drahé a potenciálne ekologicky škodlivé herbicídy.

Spoločnosť so sídlom v Sunnyvale v Kalifornii padla do oka výrobcovi ťažkých zariadení John Deere v roku 2017, keď bola získaná za 305 miliónov dolárov, s cieľom integrovať túto technológiu do svojich poľnohospodárskych zariadení.

Vedci z Blue River experimentovali s rôznymi rámcami hlbokého učenia, zatiaľ čo sa snažili trénovať modely počítačového videnia, aby rozpoznali rozdiel medzi burinami a plodinami, čo je obrovská výzva, keď sa zaoberáte bavlníkovými rastlinami, ktoré sa nešťastne podobajú burinám.

Boli navrhnutí vysoko vyškolení agronómovia, ktorí majú vykonávať úlohy manuálneho označovania obrázkov a trénovať konvolučnú neurónovú sieť (CNN) pomocou programu PyTorch „na analýzu každého rámca a vytvorenie pixelovo presnej mapy toho, kde sú plodiny a burina,“ Chris Padwick, riaditeľ počítača vízia a strojové učenie v spoločnosti Blue River Technology, napísal v blogu v auguste.

"Rovnako ako iné spoločnosti, aj my sme vyskúšali Caffe, TensorFlow a potom PyTorch," povedal Padwick. "Pre nás to funguje pekne po vybalení z krabice." Nemali sme vôbec žiadne hlásenia o chybe ani chybu blokovania. Na distribuovaných výpočtoch to skutočne svieti a je ľahšie použiteľný ako TensorFlow, čo bolo pre dátové paralelnosti dosť komplikované. “

Padwick hovorí, že popularita a jednoduchosť rámca PyTorch mu dáva výhodu, pokiaľ ide o rýchly nábor nových zamestnancov. Padwick teda sníva o svete, v ktorom „sa ľudia rozvíjajú v čomkoľvek, čo im vyhovuje. Niektorí ako výskum Apache MXNet alebo Darknet alebo Caffe, ale vo výrobe musia byť v jednom jazyku a PyTorch má všetko, čo potrebujeme, aby sme boli úspešní. “

Datarock: Cloudová analýza obrazu pre ťažobný priemysel

Austrálsky startup Datarock, ktorý založila skupina geológov, uplatňuje technológiu počítačového videnia v ťažobnom priemysle. Konkrétnejšie, jeho modely hlbokého učenia pomáhajú geológom analyzovať základné vzorky vrtných vrtov rýchlejšie ako predtým.

Typicky by geológ tieto vzorky testoval centimeter po centimetri, aby vyhodnotil mineralógiu a štruktúru, zatiaľ čo inžinieri by hľadali fyzikálne vlastnosti, ako sú poruchy, zlomeniny a kvalita hornín. Tento proces je pomalý a náchylný k ľudskej chybe.

"Počítač dokáže vidieť skaly ako inžinier," povedal Brenton Crawford, prevádzkový riaditeľ spoločnosti Datarock. "Ak to vidíte na obrázku, môžeme trénovať model, ktorý ho analyzuje rovnako ako človek."

Podobne ako Blue River, Datarock používa vo výrobe variant modelu RCNN, pričom vedci sa v počiatočných fázach obracajú na techniky rozširovania údajov, aby zhromaždili dostatok tréningových údajov.

„Po počiatočnom období objavenia sa tím pustil do kombinovania techník na vytvorenie pracovného toku spracovania obrazu pre základné snímky vŕtania. To zahŕňalo vývoj série modelov hlbokého učenia, ktoré by mohli spracovať prvotné obrázky do štruktúrovaného formátu a segmentovať dôležité geologické informácie, “napísali vedci v blogovom príspevku.

Pomocou technológie spoločnosti Datarock môžu klienti získať výsledky za pol hodinu, na rozdiel od piatich alebo šiestich hodín, ktoré sú potrebné na to, aby sa nálezy zaznamenali manuálne. Toto uvoľní geológov z najnáročnejších častí ich práce, uviedol Crawford. Avšak „keď automatizujeme veci, ktoré sú ťažšie, získame určité potlačenie a musíme vysvetliť, že sú súčasťou tohto systému, aby sme vyškolili modely a zaistili, že sa táto slučka spätnej väzby otočí.“

Rovnako ako mnoho spoločností trénujúcich modely počítačového videnia zameraných na hlboké vzdelávanie, aj spoločnosť Datarock začala s programom TensorFlow, ale čoskoro prešla na program PyTorch.

"Na začiatku sme použili TensorFlow a narazilo by to na nás zo záhadných dôvodov," povedal Duy Tin Truong, vedúci strojového učenia v Datarocku. „Programy PyTorch a Detecton2 boli vydané v tom čase a vyhovovali našim potrebám, takže po niekoľkých testoch sme zistili, že je jednoduchšie ladiť a pracovať a zaberať menej pamäte, preto sme vykonali konverziu,“ uviedol.

Spoločnosť Datarock tiež uviedla štvornásobné zlepšenie výkonu odvodzovania z TensorFlow na PyTorch a Detectron2 pri spustení modelov na GPU - a 3x na CPU.

Truong ako dôvod prechodu uviedol rastúcu komunitu PyTorch, dobre navrhnuté rozhranie, jednoduché použitie a lepšie ladenie a poznamenal, že aj keď „sú z pohľadu rozhrania úplne odlišné, pokiaľ poznáte TensorFlow, je celkom ľahké prepnúť , zvlášť ak poznáte Pythona. “

Disney: Identifikácia animovaných tvárí vo filmoch

Technológia Blue River: roboty na ničenie buriny

Datarock: Cloudová analýza obrazu pre ťažobný priemysel

mohlo by sa vám páčiť