Isilon: Úložiště jako datový analytik aneb možnosti umělé inteligence

Umělá inteligence dnes proniká do všech oblastí a dokáže posunout možnosti technologií ne o jednu, ale hned o několik úrovní. S tím ale samozřejmě roste „hlad“ těchto technologií a po výkonu. Proto i úložiště Dell EMC Isilon musejí bořit rekordy.

AI: o čem vlastně mluvíme?

I když se jedná o globální studii, zmíním ji v českém prostředí. Z průzkumu IDC vyplývá, že 75 % manažerů, kteří zodpovídají za nákup IT technologií, si myslí, že do dvou let budou jejich podnikové aplikace využívat umělou inteligenci. Umělá inteligence ve firmách je tak spíše nevyhnutelná realita než pouhá módní vlna. Abychom měli trošku přesnější představu, o čem zde mluvíme, upřesním často probíraný termín „umělá inteligence“. V tomto případě se bavíme především o takzvaném hloubkovém učení, které ještě můžeme zařadit jako podmnožinu takzvaného strojového učení. V čem je mezi nimi rozdíl? U hloubkového učení se algoritmy učí podobným způsobem jako lidský mozek, zatímco u strojového učení jsou algoritmy naprogramovány s definovanou sadou vlastností. Například, pokud má technologie za úkol rozpoznat automobil, tak v případě strojového učení bude potřebovat znát vlastnosti jako velikost, tvar karoserie, délku osy kol a podobně. Hloubkové učení ale umožňuje neuronové síti definovat funkce z dat, které získá na vstupní vrstvě. Doufám, že z tohoto vysvětlení se vám ještě nezamotala hlava hned na začátku…

Panda vs. kaviár

Samotné pokročilé matematické vzorce zabudované v technologiích ve skutečný byznys neproměníte. Ani nejlepší řidič světa nedokáže vyhrát závod, pokud mu do auta nedáte potřebné palivo. A tím jsou v tomto případě samozřejmě data. Čím kvalitnější, tím rychleji pojedete. Není žádným tajemstvím, že velký potenciál dnes skrývají nestrukturovaná data jako například video. Jenže tyto workloady jsou velmi náročné a nelze u nich provést výraznou kompresi, a tak správa dat se stovkami terabytů či petabytů obrázků či videí, patří mezi opravdu náročné úkoly. Tradiční bloková úložiště v těchto případech nepatří mezi nejspolehlivější spojence.

Ještě krátce zmíním přístupy, které vnímá odborník na hloubkové učení, Andrew Ng. Ten je rozděluje na „pandu“ a „kaviár“. Přístup panda reflektuje způsob, jakým se tato krásná zvířata starají o svá mláďata. Panda se totiž zpravidla stará v danou chvíli jenom o jedno mládě. Stejně tak se firma zaměřuje na jeden trénovací model. Tento přístup se hodí například u společností, které mají jednoho datového vědce, využijí výsledky hloubkového učení jen v omezeném počtu situací, nebo pokud model potřebuje spíše menší množství dat. A tím myslím například objem menší než 100 TB. Naproti tomu stojí „kaviár“. Asi už dokážete odhadnout, o jaký přístup se jedná. Paralelu nachází Andrew v tisících jiker, které kaviár obsahuje. Tento přístup je vhodný tam, kde se využívá obrovského množství dat. Jako příklad můžeme uvést řešení pro autonomní řízení nebo řešení na odhalování podvodů (například pro finanční instituce). V tomto případě se trénuje několik paralelních modelů s cílem nalézt ten nejvhodnější. Oba přístupy ale rozhodně výkon systémů šetřit nebudou.

Pro zájemce přidávám odkaz na celou přednášku: https://www.coursera.org/lecture/deep-neural-network/hyperparameters-tuning-in-practice-pandas-vs-caviar-DHNcc.

Raketa jménem Dell EMC Isilon

Vypisovat, ve kterých oblastech může umělá inteligence pomoci firmám zefektivnit jejich byznys je úkolem, který by vydal minimálně na celou knihu. Zkuste se zamyslet nad tím, kde má vaše firma největší slabiny. Jsem přesvědčen, že i s nimi by vám tyto technologie pomohly. Nicméně, jak jsem již zmiňoval výše – moderní způsoby analytiky vyžadují také moderní výkon. Na 486 také nerozjedete nejnáročnější hry.

Na tyto nároky odpovídají nové modely Dell EMC Isilon. A jde o více než o výkon. Dell EMC Isilon nabízí všechny podnikové funkce, na které jsou IT správci zvyklí, jako jsou správa dat, bezpečnostní řešení, data compliance či ochrana řešení tak, aby systém splňoval všechna právní nařízení a podnikové bezpečnostní politiky. Na chvíli se ale ještě vrátím k výkonu. Oproti konkurenci dosahuje Dell EMC Isilon až 18x vyšší přenosové rychlosti, čímž eliminuje Input/Output úzká hrdla. Rychlosti se šplhají až na 15 GB/s u jednoho šasi a 540 GB/s u clusteru. Další klíčovou vlastností je extrémní škálování, které nabízí až 21x vyšší kapacitu než konkurenční řešení. I při škálování od desítek terabytů do desítek petabytů je efektivní využívání úložiště až na 85 %.

Příklad z praxe: MasterCard

Abych ukázal, jak lze hloubkové učení využít, použiju příklad společnosti MasterCard, se kterou již řadu let na globální úrovni úzce spolupracujeme. MasterCard již dávno není firma s kreditními kartami, je to technologická firma, protože její zařízení naleznete nejenom v mobilních telefonech, moderních terminálech, ale například i v některých pračkách ve veřejných prádelnách. Jenže samozřejmě všude tam, kde se pracuje s penězi, objevují se i zločinci, kteří chtějí snadno získat velké peníze. Proto jsme společně postavili řešení využívající umělou inteligenci, které tyto podvodníky má odhalit. Řešení spojuje analýzy chování, pasivní biometrii nebo ověřené uživatelské profily. Každá ze 160 milionů transakcí, které každou hodinu ve světě proběhnou, je vyhodnocena na základě téměř dvou milionů pravidel. Kromě zvýšení bezpečnosti klientů toto řešení umožňuje také lépe pochopit chování zákazníků, lépe měřit návratnosti investic a MasterCard díky analýze dat také může lépe identifikovat nové marketingové příležitosti. A za těmito možnostmi už se skrývají opravdu velké obchody.

Videopředstavení spolupráce Dell EMC s MasterCard: https://www.dellemc.com/en-us/solutions/artificial-intelligence/ai-with-isilon/index.htm#scroll=off&video-overlay=5992197900001

Patří budoucnost lidem? Patří strojům? Jak říká náš CEO Michael Dell, budoucnost patří lidem A strojům.

Pokud Vás zajímají možnosti využití technologií s umělou inteligencí i ve Vašem podniku, neváhejte mě kontaktovat na boris.pavlik@dell.com.

Autor: Boris Pavlík, Senior Storage Engineer ve společnosti Dell EMC

About the Author: Martin Rohacek