Programovanie

Zmysluplnosť stratégie databázy grafov spoločnosti Microsoft

Trvalo to nejaký čas, ale nákup spoločnosti LinkedIn za 26 miliárd dolárov, ktorý spoločnosť Microsoft ponúka, konečne začína prinášať zaujímavé výsledky, pričom údaje z LinkedIn sa začnú objavovať v nástrojoch, ako je Outlook. Je to prvý znak spoločnosti Microsoft, ktorá využíva graf vzťahov medzi sociálnymi sieťami, komplexný súbor údajov, ktorý bol dôvodom jednej z najväčších akvizícií spoločnosti Microsoft v Silicon Valley.

Pod kapotou nie je sociálna sieť ako LinkedIn ničím iným ako obrovskou databázou grafov NoSQL, ktorá na správu pološtruktúrovaných dát využíva bez schémy prístup. Každý uzol v grafe je jednotlivec so všetkými jeho profilovými údajmi. Každý uzol je prepojený s ostatnými, desiatky alebo stovky pre ľudí s niekoľkými spojeniami, tisíce pre vysoko prepojených jednotlivcov. Dotazy prechádzajú týmito spojeniami a umožňujú vám nájsť všetkých ľudí, ktorých poznáte, pracujú na AI, alebo ktorí majú sídlo v Ontáriu, alebo predtým pracovali na LinkedIn.

Grafové databázy všade: Microsoft Graph, Common Data Service, Cosmos DB a Security Graph

Záujem spoločnosti Microsoft o údaje založené na grafoch je jasný. Generálny riaditeľ Satya Nadella označil API služieb Office 365, ktoré je základom toho, čo sa teraz nazýva Microsoft Graph, ako „najdôležitejšiu“ stávku spoločnosti. Je to určite veľmi silný nástroj a jeho otvorenie pre všetkých umožňuje organizáciám preskúmať, ako sa vyvíjajú ich interné tímy a ako sú firemné znalosti ukladané v dokumentoch a konverzáciách - spolu s nástrojmi na sprístupnenie týchto informácií a ich použitie.

V programe Microsoft Graph je veľa údajov s nástrojmi na informovanie spotrebiteľov a na podnikanie. Prvky spojené s účtami Microsoft, ako napríklad nový Stream aktivít a Graf zariadení, sú základom pre roamingové funkcie zariadení, ako sú napríklad nástroje Pokračovať na mojom počítači, ktoré boli nedávno vydané pre iOS a Android (podobné schopnosti Handoff založenej na účtoch Apple iCloud v systéme iOS). „a ktorý spoločnosť Microsoft vyzýva vývojárov platformy Universal Window Platform (UWP), aby zabudovali svoj kód ako súčasť projektu Rome a pripravovanej funkcie Windows Timeline.

Microsoft Graph a LinkedIn však nie sú iba grafmi spoločnosti Microsoft s API:

  • Dynamics 365 obsahuje službu Common Data Service, spôsob popisu štandardných položiek v podniku. Pomocou služby Common Data Service môžete rozšíriť štandardnú schému o svoj model zákazníka alebo svoje produkty.
  • Potom je tu cloud Cosmos DB, ktorý stavia na databáze dokumentov JSON s rôznymi množinami rozhraní API, vrátane jednej na vývoj a správu vlastných databáz grafov vo veľkom rozsahu.
  • Aj keď to nie je úplne verejné, graf Microsoft Security sa používa na hodnotenie a správu hrozieb vystavených vašim aplikáciám prostredníctvom nástrojov, ako je funkcia podmieneného prístupu Azure Active Directory.

Odlišný prístup spoločnosti Microsoft: Dopytovanie viacerých grafov

Veci, ktoré sa stávajú zaujímavými, sú dotazy na grafy vo viacerých grafoch a ich použitie na získanie štatistík, ktoré môžu pomôcť pri podnikaní rozhodnutí. Často som hovoril o myšlienke „informácií v správnom čase“: informácie v správnom čase poskytované správnym ľuďom, aby sa mohli správne rozhodnúť pre správny výsledok podnikania. Schopnosť dopytovať sa na okrajoch grafu, nie na uzle, vám umožní pochopiť vzťahy medzi položkami, čo je kľúčový faktor pri poskytovaní typu podpory informácií, ktoré moderné obchodné potreby potrebujú.

Podporou viacerých grafov ponúka spoločnosť Microsoft alternatívu k tradičným databázovým nástrojom na podporu rozhodovania. Zmiešaním interných zamestnancov a údajov o dokumentoch v Microsoft Graph, externých vzťahov cez LinkedIn, základných obchodných informácií v Dynamics 365 Common Data Service a vlastnej schémy v cloudovej databáze Cosmos DB môžete robiť zložité krížové dotazy so zameraním na nielen jednotlivé uzly v týchto grafoch, ale aj prepojenia medzi uzlami. To vám umožní pracovať s oveľa zložitejšími vzťahmi ako s tými, ktoré sú vystavené v relačných databázach.

Jedným zo spôsobov, ako to odhaliť, je nový nástroj Bing for Business, ktorý pridáva informácie z podnikovej služby Active Directory a ďalších zdrojov do vyhľadávaní Bing, keď je používateľ prihlásený do účtu Azure Active Directory. Výsledky sa dynamicky generujú z dotazov programu Microsoft Graph, ktoré vracajú podrobnosti napríklad o tom, kde sa niekto nachádza v organizačnom diagrame, spolu so súvisiacim obsahom zo širšieho webu a z dokumentov, ktoré interne zdieľa.

Je to iný spôsob, ako odhaliť informácie, ktoré sú k dispozícii v nástroji Microsoft Delve, a brať ich z aplikácie, ktorú bolo potrebné spustiť skôr, ako budete môcť zadať dopyt do vždy otvoreného prehľadávača. Ako odvetvie sme prepracovali hľadanie do prehliadača, takže je logické, aby sa stal jedným z nástrojov, ktoré používame na skúmanie grafov, ktoré sú základom nášho podnikania.

Počiatočné vydanie aplikácie Bing for Business sa zameriava na program Microsoft Graph spolu s nástrojmi, ktoré umožňujú správcom pridávať konkrétne intranetové odkazy pre konkrétne dotazy. Keď teda hľadáte súčasné pravidlá pre výdavky, budete presmerovaní na príslušné samoobslužné nástroje. Budúce vydania prinesú viac grafov spoločnosti Microsoft, uzamknú vyhľadávanie založené na funkcii podmieneného prístupu a odhalia externé vzťahy prostredníctvom LinkedIn.

Chyba v grafoch spoločnosti Microsoft: Používajú rôzne gramatiky dotazov

Aj keď celková vízia rôznych vlastností spoločnosti Microsoft založených na grafoch začína byť jasná, stále existujú problémy s dopytovaním z viacerých zdrojov. Hoci všetky ponúkajú rozhrania REST API, základné jazyky dotazov sa môžu líšiť. Napríklad Microsoft Graph používa vo svojich API svoju vlastnú gramatiku dotazov, zatiaľ čo CosmosDB stavia na široko používanom dotazovacom jazyku grafov Apache Gremlin.

Dotazy založené na API bývajú pomerne jednoduché a sú zamerané na konkrétne vyhľadávania. Zložitejšie dotazy sa zvyčajne spracovávajú pomocou jazykov špecifických pre doménu, ako je Gremlin, ktoré sú určené na použitie s databázami grafov. Jednou z najzaujímavejších funkcií spoločnosti Gremlin je jej schopnosť generovať nové mapy zo základných údajov, ktoré môžete analyzovať a použiť vo svojich aplikáciách. Gremlin tiež zvláda porovnávanie vzorov, ako aj prácu s rozsiahlymi nástrojmi na analýzu údajov, ako je Hadoop; takže ho môžete použiť na doručovanie dotazov z nástroja na veľké dáta Azure HDInsight spolu s vašimi grafmi hostenými v Cosmos DB.

Ak máme získať výhody všetkých rôznych vlastností grafov Microsoftu, budeme potrebovať spoločnú platformu dotazov, ktorá dokáže prijímať dotazy a rozdúchavať ich z rôznych zdrojov, asynchrónne spracovávať odpovede a zabezpečiť, aby boli dotazy správne konštruované tak, aby zacieliť na konkrétne API.

Môžete si vytvoriť svoj vlastný stroj na vytváranie multigrafických dotazov, ale toto je skutočne niečo, čo Microsoft musí dodať, napríklad ako služba Azure. Týmto spôsobom je možné ho integrovať s existujúcim predplatným a so známymi metódami overovania, či už pre používateľov alebo pre aplikácie.

$config[zx-auto] not found$config[zx-overlay] not found