Programovanie

Apache PredictionIO: Jednoduchšie strojové učenie so Sparkom

Nadácia Apache Foundation pridala do svojho zoznamu nový projekt strojového učenia, Apache PredictionIO, otvorenú verziu projektu, ktorý pôvodne navrhla dcérska spoločnosť Salesforce.

Čo ForexIO robí pre strojové učenie a Spark

Apache PredictionIO je postavený na vrchole Spark a Hadoop a slúži na predpovede založené na Sparku z dát pomocou prispôsobiteľných šablón pre bežné úlohy. Aplikácie odosielajú údaje na server udalostí PredictionIO, aby vycvičili model, a potom vyhľadávajú v stroji predpovede založené na modeli.

Spark, MLlib, HBase, Spray a Elasticsearch sú dodávané s balíkom PredictionIO a Apache ponúka podporované SDK pre prácu v jazykoch Java, PHP, Python a Ruby. Dáta môžu byť uložené v rôznych koncových zariadeniach: JDBC, Elasticsearch, HBase, HDFS a ich lokálne systémy súborov sú podporované ihneď po vybalení. Konce sú pripojiteľné, takže vývojár môže vytvoriť vlastný konektor typu back-end.

Ako šablóny PredictionIO uľahčujú poskytovanie predpovedí od Sparku

Najvýznamnejšou výhodou firmy PredictionIO je jej šablónový systém na vytváranie strojov strojového učenia. Šablóny znižujú ťažké zdvíhanie potrebné na nastavenie systému, aby slúžil konkrétnym druhom predpovedí. Opisujú všetky závislosti tretích strán, ktoré by mohli byť potrebné pre danú úlohu, napríklad aplikačný rámec strojového učenia Apache Mahout.

Niektoré existujúce šablóny zahŕňajú:

  • Univerzálny odporúčací motor.
  • Klasifikácia textu.
  • Analýza prežitia (pre predpovede času medzi poruchami).
  • Označovanie tém pomocou Wikipédie ako znalostnej bázy.
  • Analýza podobnosti.

Niektoré šablóny sa integrujú aj do iných produktov strojového učenia. Napríklad dve z predikčných šablón, ktoré sa momentálne nachádzajú v galérii Predikcie, používajú na detekciu rýchlosti prúdenia a všeobecné odporúčania vylepšenia programu Sparkling Water od spoločnosti H2O.ai pre Spark.

PredikciaIO môže tiež automaticky vyhodnotiť predikčný modul a určiť najlepšie hyperparametre, ktoré sa s ním použijú. Je potrebné, aby vývojár vybral a nastavil metriky, ako to urobiť, ale na vykonanie tohto kroku je zvyčajne potrebné menej práce ako pri ručnom ladení hyperparametrov.

Keď je spustený ako služba, môže PredictionIO prijímať predpovede jednotlivo alebo hromadne. Dávkové predpovede sú automaticky paralelizované naprieč klastrom Spark, pokiaľ sú všetky algoritmy použité v dávkovej predikčnej úlohe všetky serializovateľné. (Predvolené algoritmy predpovede sú.)

Kde stiahnuť Predpoveďio

Zdrojový kód predikcieIO je k dispozícii na GitHub. Pre pohodlie sú k dispozícii rôzne obrázky Dockeru a balíček na zostavenie Heroku.

$config[zx-auto] not found$config[zx-overlay] not found