Sdílená úložiště vs. hyperkonvergence: kdy, kde a pro koho

Zvolit spíše budování vlastní architektury se sdíleným úložištěm, nebo se vydat cestou hyperkonvergované infrastruktury? Tuto otázku řešilo a stále řeší mnoho firem. Pro koho se tedy hodí první a kdo spíše ocení druhou variantu? Z vlastních zkušenosti vím, že opravdu velmi záleží na konkrétním zákazníkovi. Proto jsem si připravil krátkého průvodce jednotlivými možnostmi.

Známou frázi „sto lidí, sto chutí“ můžeme snadno uplatnit i při vybírání té nejvhodnější technologie. Kvůli této skutečnosti jsem se rozhodl představit různé přístupy, které nabízíme v Dell EMC, a které se v praxi ukázaly jako nejvhodnější.

Kdy, kde a pro koho: sdílená úložiště

  • Výhody: Sdílená úložiště vychází ekonomicky velmi dobře pro firmy, které disponují poměrně velkým objemem dat, kde nad nimi jim pracuje menší množství serverů. Může se jednat o fyzické nebo virtuální. Na tom nezáleží. Data jsou zde totiž uložena na jednom místě, a zpravidla chráněna pomocí metody Erasure Coding, zabezpečením RAID či obdobnými technologiemi. Díky tomu dobře vychází vzájemný poměr hrubé a čisté kapacity (například 90 %). Jedná se tak o vhodné řešení pro velké databázové systémy.
  • Nevýhody: Data musí při každé operaci urazit dlouhou cestu. Z fyzického média přes řadič pole, poté přes přepínače a kabely, a nakonec přes adaptér v serveru a softwarový ovladač. To představuje jednak zdržení, tak prostor pro poruchy a chyby v konfiguraci. I když je diskové pole samotné rychlé jako blesk, a plné těch nejlepších SSD disků, existuje fyzická hranice rychlosti, kterou v této architektuře zkrátka nelze překročit. Navíc kapacita sdíleného diskového pole se dá jednoduše škálovat, avšak jeho maximální výkon je limitován výkonem řadičů. Pokud u zákazníka nastane raketový nárůst operací (například spuštění nového projektu), může narazit na tento výkonnostní limit, a pak je potřeba nasadit vyšší model řadičů, migrace dat.
  • Vhodné použití – Maloobchod: Jako příklad použiji zákazníka z maloobchodu, jehož firma provozuje velké databázové servery. Pomocí nich analyzuje prodej a zpracovává reporty pro manažery. Software pro analýzu obchodu a databázové řešení zde běží na dvou čtyřprocesorových serverech s několika terabyty RAM. Softwarové licence by v tomto případě byly velmi nákladné. Nedávalo tedy smysl nasadit software ve více menších instancích, a pak řešit, jak práci mezi tyto instance distribuovat. Použili jsme tedy klasické diskové pole. Velkou výhodou je skutečnost, že databáze pro analýzu je po SAN síti replikována z produkčního transakčního systému a OLAP analýza je prováděna nad snapshotem dat, který je umístěný na sekundárním poli. Díky tomu analýza nijak nezatěžuje primární pole, které slouží jen pro transakční systémy.

Kdy, kde a pro koho: hyperkonvergovaná infrastruktura

  • Výhody: Hyperkonvergence je vhodná zejména tehdy, pokud firma staví nové řešení bez předchozích zkušeností, případně potřebuje vyměnit jak diskové pole, tak servery zároveň. Obrovskou výhodou hyperkonvergované infrastruktury je její snadná škálovatelnost, kdy prostě stačí přidat další „cihlu“, čímž ihned vzroste jak výkon, tak i kapacita. Migrace na novou verzi hardwaru bývá v hyperkonvergované infrastruktuře velmi jednoduchá – staré „cihly“ lze postupně odebírat a novější přidávat, aniž by bylo potřeba manuálně data přesouvat. Dnes již vidíme, že při použití SSD disků, jsou řešení výkonnější než sdílená disková pole. To proto, že data jsou fyzicky uložena na stejném serveru, kde je také paměť RAM a CPU pro jejich zpracování. Cesta, kterou data musí při každé operaci urazit, je tak velmi krátká a obsahuje jen minimum vrstev. Stále existuje síťová infrastruktura mezi jednotlivými nody (seskupení několika serverů) v clusteru, ale provoz v této síti je rozložen rovnoměrněji – každý nod komunikuje s každým, nikoliv všechny nody s jedním centrálním (a přetíženým) bodem.
  • Nevýhody: Ačkoliv i data v hyperkonvergované infrastruktuře lze ukládat v různých verzích distribuovaných RAIDů a implementacích Erasure Codingu, arbitrace distribuovaného výpočtu paritních dat není jednoduchá a představuje velkou zátěž. Proto jsou v praxi většinou používány různé technologie zrcadlení dat mezi jednotlivými nody, data tak v clusteru bývají typicky efektivně uložena s kapacitou v poměru hrubá vs. čistá kolem 50 %. Také to však může být i jen 33 %. Uložení stovek terabytů dat v takovém clusteru tedy může být velmi nákladnou záležitostí. S každým nodem firma přikupuje nejen kapacitu, ale i výkon. Fyzicky tedy přidává také RAM, CPU a síťové porty. Ideální je, pokud tento výpočetní výkon dokáže využít. Pokud výpočetní výkon nepotřebuje, pak zbytečně platí nejen za tento hardware, ale často také za licence operačních systémů a dokonce i za napájení a chlazení.
  • Vhodné použití – e-shop: Učebnicovým příkladem je firma provozující velký e-shop, kde počet objednávek často závisí na ročním období. Data sice neustále přibývají, ale protože přibývají i zákazníci, roste i počet obchodních transakcí za minutu. Proto je potřeba postupně zvyšovat nejen kapacitu, ale také výpočetní výkon. Hyperkonvergovaná infrastruktura v tomto případě umožňuje dynamické škálování webových front-end serverů a aplikačních serverů právě podle ročního období. Jak e‑shop roste a expanduje do zahraničí, postupně přikupuje provozovatel další „cihly“. Zatímco při nákupu sdíleného diskového pole by bylo potřeba velkou část nákladů vynaložit jako kapitálové náklady (CAPEX), tak hyperkonvergovaná infrastruktura umožní CAPEXovou složku snížit a zbytek nákladů přesunou do provozních nákladů (OPEX), aniž by bylo potřeba na nákup řešení používat jakoukoliv formu leasingu.

Jsem přesvědčen o tom, že s tím, jak více firem bude nacházet nové způsoby, kterými efektivně využijí svoji datovou základnu pro další obchody, bude postupně narůstat adopce hyperkonvergovaného řešení. Sdílená disková pole ale budou stále mít své místo na trhu. Myslím si, že bude svědky podobné situace, jako v případě virtualizace serverů. Většina serverů dnes běží virtuálně, ale stále jsou případy, kde je dedikovaný fyzický server nejlepším řešením.

Pokud Vás zajímá, zda by Vaše firma měla zvolit spíše sdílené úložiště, nebo hyperkonvergovanou infrastrukturu, kontaktujte mě na Ondrej.Bajer@dell.com. Rád Vám při výběru poradím a ukážu další reálné příklady nasazení.

About the Author: Martin Rohacek