Programovanie

Knižnica strojového učenia Java s otvoreným zdrojom Oracle

Spoločnosť Oracle sprístupňuje svoju knižnicu strojového učenia Java Tribuo Java v rámci priestoru pre strojové učenie, aby uspokojila potreby podniku v rámci licencie open source.

Cieľom produktu Oracle Tribuo je uľahčiť vytváranie a nasadenie modelov strojového učenia v prostredí Java, podobne ako to už bolo v prípade Pythonu. Tribuo, vydané pod licenciou Apache 2.0 a vyvinuté spoločnosťou Oracle Labs, je prístupné z GitHub a Maven Central.

Tribuo poskytuje štandardné funkcie strojového učenia vrátane algoritmov pre klasifikáciu, klastrovanie, detekciu anomálií a regresiu. Tribuo tiež obsahuje kanály na načítanie a transformáciu údajov a poskytuje sadu hodnotení podporovaných predikčných úloh. Pretože Tribuo zhromažďuje štatistiku vstupov, môže napríklad opísať rozsah každého vstupu. Pomenúva tiež funkcie, správu ID funkcií a ID výstupov pod kapotou, aby sa zabránilo konfliktom a zmätkom ID pri reťazení modelov, načítaní údajov a vylepšovaní vstupov.

Model Tribuo vie, kedy vidí funkciu prvýkrát, čo je obzvlášť užitočné pri práci so spracovaním prirodzeného jazyka. Modely vedia, čo sú výstupy, pričom výstupy sú silno typizované. Vývojári sa nemusia pýtať, či je float pravdepodobnosť, regresná hodnota alebo ID klastra. V prípade Tribuo je každý z nich samostatným typom; model dokáže opísať typy a rozsahy, o ktorých vie. Použitie vstupov a výstupov so silným typom znamená, že Tribuo môže sledovať proces výstavby modelu, od bodu sa načítajú dáta cez rozdelenie vlak / test alebo transformácie súborov údajov až po školenie a hodnotenie modelu. Tieto sledovacie údaje sa zapracujú do všetkých modelov a hodnotení.

Systém proveniencie Tribuo môže vygenerovať konfiguráciu, ktorá prebuduje tréningový kanál na reprodukciu modelu alebo vyhodnotenia. Vyladený model možno tiež postaviť na nových dátach alebo hyperparametroch. Používatelia tak vždy vedia, čo je model Tribuo, odkiaľ pochádza a ako ho vytvoriť.

Spoločnosť Oracle vidí spoločnosť Tribuo, ktorá zapĺňa medzeru na trhu strojového učenia pre podnikové aplikácie. Napríklad zatiaľ čo knižnica TensorFlow vytvorená spoločnosťou Google poskytuje základné algoritmy pre hlboké učenie, spoločnosť Tribuo poskytuje niekoľko algoritmov strojového učenia, z ktorých niektoré sú v TensorFlow a niektoré nie, a zároveň poskytujú rozhranie pre TensorFlow, uviedol Adam Pocock z Oracle, hlavný člen technického personálu Oracle Labs. A keďže analytický modul Apache Spark je určený pre veľké distribuované systémy, Tribuo je určený pre menšie výpočty, ktoré sa zmestia na jeden stroj, uviedol Pocock.

Okrem TensorFlow poskytuje Tribuo rozhranie s XGBoost a runtime ONNX, čo umožňuje nasadenie modelov uložených vo formáte ONNX alebo trénovaných v TensorFlow a XGBoost spolu s natívnymi modelmi Tribuo. Podpora formátu modelu ONNX umožňuje nasadenie v jazyku Java modelov trénovaných pomocou populárnych knižníc Pythonu, napríklad PyTorch.

Tribuo funguje na prostredí Java 8 alebo novšom. Spoločnosť Oracle prijíma príspevky kódu spoločnosti Tribuo na základe dohody s prispievateľom Oracle. Tribuo sa už v spoločnosti Oracle interne používalo v produkte Fusion Cloud ERP napríklad na inteligentné rozpoznávanie dokumentov.

$config[zx-auto] not found$config[zx-overlay] not found