Programovanie

Recenzia: Google Cloud AI rozsvieti strojové učenie

Google má jeden z najväčších balíkov strojového učenia v priemysle, ktorý sa v súčasnosti zameriava na svoju platformu Google Cloud AI a Machine Learning. Google pred rokmi roztočil TensorFlow ako open source, ale TensorFlow je stále najvyzretejší a najcitovanejší rámec hlbokého učenia. Podobne Google pred rokmi vyčlenil Kubernetes ako open source, ale stále je to dominantný systém správy kontajnerov.

Google je jedným z hlavných zdrojov nástrojov a infraštruktúry pre vývojárov, vedcov v oblasti dát a odborníkov na strojové učenie, ale Google AI historicky nebol až taký atraktívny pre obchodných analytikov, ktorí nemajú seriózne zázemie v oblasti dát alebo programovania. To sa začína meniť.

Platforma Google Cloud AI a Machine Learning obsahuje stavebné bloky AI, platformu AI a akcelerátory a riešenia AI. Riešenia AI sú pomerne nové a sú zamerané skôr na obchodných manažérov ako na vedcov v oblasti údajov. Môžu zahŕňať konzultácie od spoločnosti Google alebo jej partnerov.

Stavebné bloky AI, ktoré sú vopred vyškolené, ale prispôsobiteľné, je možné používať bez dôkladných znalostí programovania alebo dátovej vedy. Kvalifikovaní vedci v oblasti dát ich však často používajú z pragmatických dôvodov, hlavne na to, aby dokončili prácu bez rozsiahleho modelového školenia.

Platforma AI a akcelerátory sú všeobecne pre serióznych vedcov v oblasti dát a vyžadujú si schopnosť kódovania, znalosti techník prípravy dát a veľa času na školenie. Odporúčam tam ísť až po vyskúšaní príslušných stavebných prvkov.

V ponukách AI cloudu spoločnosti Google Cloud stále chýbajú odkazy, najmä pri príprave údajov. Najbližšia vec, ktorú má Google Cloud k službe na import a úpravu dát, je Cloud Dataprep od tretej strany od spoločnosti Trifacta; Skúsil som to pred rokom a bol som podgurážený. Inžinierstvo funkcií zabudované do tabuliek Cloud AutoML Tables je však sľubné a bolo by užitočné mať tento druh služby k dispozícii pre ďalšie scenáre.

Tichá spodná strana umelej inteligencie má čo do činenia s etikou a zodpovednosťou (alebo jej nedostatkom) spolu s pretrvávajúcimi modelovými predsudkami (často kvôli skresleným údajom používaným na školenie). Google zverejnil svoje Princípy umelej inteligencie v roku 2018. Je to nedokončená práca, ale je to základ pre usmernenie, o ktorom pojednáva nedávny príspevok na blogu Zodpovedná AI.

Na trhu AI existuje veľká konkurencia (viac ako tucet predajcov) a veľká konkurencia na trhu verejných cloudov (viac ako pol tucta dôveryhodných dodávateľov). Na zabezpečenie spravodlivého porovnania by som musel napísať článok najmenej päťkrát tak dlho, ako tento, takže ak nerád ich vynechávam, väčšinu porovnávaní produktov musím vynechať. Pre najlepšie zrejmé porovnanie môžem zhrnúť: AWS robí väčšinu toho, čo robí Google, a je tiež veľmi dobrá, ale všeobecne si účtuje vyššie ceny.

Google Cloud AI Building Blocks

Google Cloud AI Building Blocks sú ľahko použiteľné komponenty, ktoré môžete začleniť do svojich vlastných aplikácií na pridanie zraku, jazyka, konverzácie a štruktúrovaných údajov. Mnohé zo stavebných blokov AI sú vopred vyškolené neurónové siete, ale je možné ich prispôsobiť prenosovým učením a hľadaním neurónových sietí, ak po vybalení z krabice neslúžia vašim potrebám. Tabuľky AutoML sa trochu líšia v tom, že automatizuje proces, ktorý by dátový vedec použil na nájdenie najlepšieho modelu strojového učenia pre tabuľkovú množinu údajov.

AutoML

Služby Google Cloud AutoML poskytujú prispôsobené hlboké neurónové siete na preklad jazykových párov, klasifikáciu textu, detekciu objektov, klasifikáciu obrázkov a klasifikáciu a sledovanie objektov videa. Vyžadujú označené údaje na zaškolenie, nevyžadujú však značné znalosti hlbokého učenia, prenosového učenia alebo programovania.

Google Cloud AutoML prispôsobuje bojom testované vysoko presné hlboké neurónové siete pre vaše označené údaje. Namiesto toho, aby ste pri výcviku modelov z vašich dát začínali od nuly, implementuje AutoML automatické hĺbkové prenosové učenie (čo znamená, že vychádza z existujúcej hlbokej neurónovej siete trénovanej na iných dátach) a vyhľadávanie neurálnej architektúry (čo znamená, že nájde správnu kombináciu ďalších sieťových vrstiev). ) pre preklad jazykových párov a ďalšie služby uvedené vyššie.

V každej oblasti má Google už jednu alebo viac vopred vyškolených služieb založených na hlbokých neurónových sieťach a obrovských množinách označených údajov. Môžu dobre fungovať pre vaše údaje nezmenené. Mali by ste to vyskúšať, aby ste si ušetrili čas a peniaze. Ak neurobia to, čo potrebujete, Google Cloud AutoML vám pomôže vytvoriť model, ktorý to urobí, bez toho, aby ste museli vedieť, ako vykonávať prenosové učenie alebo ako navrhovať neurónové siete.

Transfer learning ponúka dve veľké výhody oproti trénovaniu neurónovej siete od nuly. Najskôr to vyžaduje oveľa menej údajov na zaškolenie, pretože väčšina vrstiev siete je už dobre vyškolená. Po druhé, trénuje sa oveľa rýchlejšie, pretože optimalizuje iba konečné vrstvy.

Aj keď sa služby Google Cloud AutoML zvykli predstavovať spoločne ako balík, v súčasnosti sú uvedené so svojimi základnými vopred vyškolenými službami. To, čo väčšina ostatných spoločností nazýva AutoML, vykonávajú tabuľky Google Cloud AutoML.

Prečítajte si celú recenziu služby Google Cloud AutoML

Tabuľky AutoML

Zvyčajným procesom vedy o údajoch pre mnoho regresných a klasifikačných problémov je vytvorenie tabuľky údajov na školenie, čistenie a kondicionovanie údajov, vykonanie inžinierstva funkcií a pokus o trénovanie všetkých vhodných modelov na transformovanej tabuľke vrátane kroku optimalizácie. hyperparametre najlepších modelov. Tabuľky Google Cloud AutoML môžu celý tento proces vykonať automaticky, keď manuálne identifikujete cieľové pole.

Tabuľky AutoML automaticky vyhľadávajú štruktúrované údaje v modelovej zoo spoločnosti Google, aby našli ten najlepší model pre vaše potreby, od lineárnych / logistických regresných modelov pre jednoduchšie súbory dát až po pokročilé hĺbkové, súborové a architektonické metódy vyhľadávania pre väčšie a zložitejšie. Automatizuje inžinierstvo funkcií pre širokú škálu tabuľkových dátových primitív - ako sú čísla, triedy, reťazce, časové značky a zoznamy - a pomáha vám zistiť a postarať sa o chýbajúce hodnoty, odľahlé hodnoty a ďalšie bežné problémy s údajmi.

Jeho bezkonkurenčné rozhranie vás prevedie celým životným cyklom end-to-end strojového učenia, vďaka čomu bude môcť ktokoľvek vo vašom tíme ľahko vytvárať modely a spoľahlivo ich začleniť do širších aplikácií. Tabuľky AutoML poskytujú rozsiahle vstupné údaje a funkcie vysvetlenia správania sa modelu spolu s ochrannými zábradliami, aby sa zabránilo bežným chybám. Tabuľky AutoML sú k dispozícii aj v prostrediach API a notebookov.

Tabuľky AutoML konkurujú Driverless AI a niekoľkým ďalším implementáciám a rámcom AutoML.

Vision API

Google Cloud Vision API je vopred vyškolená služba strojového učenia na kategorizáciu obrázkov a extrahovanie rôznych funkcií. Môže klasifikovať obrázky do tisícok vopred vyškolených kategórií, od generických predmetov a zvierat nájdených na obrázku (napríklad mačka), cez všeobecné podmienky (napríklad za súmraku) až po konkrétne pamätihodnosti (Eiffelova veža, Grand Canyon), a identifikovať všeobecné vlastnosti obrázka, napríklad jeho dominantné farby. Môže izolovať oblasti, ktoré sú tvárami, potom aplikovať na tváre geometrické (orientácia tváre a orientačné body) a emočné analýzy, aj keď nerozpozná tváre ako patriace konkrétnym ľuďom, s výnimkou celebrít (na ktoré sa vyžaduje špeciálna licencia na používanie). Vision API používa OCR na detekciu textu v obrázkoch vo viac ako 50 jazykoch a rôznych typoch súborov. Môže tiež identifikovať logá výrobkov a zisťovať obsah pre dospelých, násilie a lekársky obsah.

Prečítajte si celú recenziu rozhraní Google Cloud Machine Learning API

Video Intelligence API

Rozhranie Google Cloud Video Intelligence API automaticky rozpozná viac ako 20 000 objektov, miest a akcií v uloženom a streamovanom videu. Rozlišuje tiež zmeny scény a extrahuje bohaté metadáta na úrovni videa, záberu alebo snímky. Ďalej vykonáva detekciu a extrakciu textu pomocou OCR, detekuje explicitný obsah, automatizuje skryté titulky a titulky, rozpoznáva logá a detekuje tváre, osoby a pózy.

Google odporúča rozhranie Video Intelligence API na extrakciu metadát na indexovanie, organizáciu a prehľadávanie vášho video obsahu. Môže prepisovať videá a generovať skryté titulky, ako aj označovať a filtrovať nevhodný obsah, a to všetko nákladovo efektívnejšie ako prepisovatelia. Medzi prípady použitia patrí moderovanie obsahu, odporúčania obsahu, archívy médií a kontextové reklamy.

Rozhranie API pre prirodzený jazyk

Spracovanie prirodzeného jazyka (NLP) je veľkou súčasťou „tajnej omáčky“, vďaka ktorej dobre fungujú vstupy do Vyhľadávania Google a Google Assistant. Rozhranie Google Cloud Natural Language API poskytuje vašim programom rovnakú technológiu. Môže vykonávať syntaktickú analýzu (pozri obrázok nižšie), extrakciu entít, analýzu sentimentu a klasifikáciu obsahu v 10 jazykoch. Ak viete, môžete určiť jazyk; inak sa API pokúsi automaticky zistiť jazyk. Na obsah súvisiaci so zdravotnou starostlivosťou sa špecializuje samostatné API, ktoré je v súčasnosti k dispozícii pre včasný prístup na požiadanie.

Prečítajte si celú recenziu rozhraní Google Cloud Machine Learning API

Preklad

Rozhranie Google Cloud Translation API dokáže preložiť viac ako sto jazykových párov, dokáže automaticky zistiť zdrojový jazyk, ak ho neurčíte, a má tri príchute: základná, pokročilá a mediálny preklad. Rozhranie Advanced Translation API podporuje glosár, hromadný preklad a použitie vlastných modelov. Rozhranie Basic Translation API je v podstate to, čo používa spotrebiteľské rozhranie služby Google Translate. AutoML Translation vám umožňuje trénovať vlastné modely pomocou prenosového učenia.

Rozhranie Media Translation API prekladá obsah priamo zo zvuku (reči), buď zvukových súborov alebo streamov, v 12 jazykoch a automaticky generuje interpunkciu. Existujú samostatné modely pre videohovory a zvukové hovory.

Prečítajte si celú recenziu rozhraní Google Cloud Machine Learning API

$config[zx-auto] not found$config[zx-overlay] not found