Výzvy Big Data

Rast množstva dát

Na najbližšie roky je projektovaný medziročný nárast v množstve vygenerovaných dát o 40%.

Rast vo výdavkoch na IT je medziročne v priemere len 5%. Základnou výzvou pre IT je nájdenie spôsobu ako ukladať a najmä rozumne využívať dáta s minimálnymi dodatočnými nákladmi. Veríme, že investícia do lepšieho spôsobu ukladania dát a ich lepšieho využitia je základom rozumnej stratégie firmy. A myslíme si, že táto investícia sa vráti v pomerne krátkom čase.

Zákazníci z celého sveta, ktorí zaviedli lepšiu analytiku nad svojimi existujúcimi dátami:

Data privacy

Užívatelia si stále viac cenia svoje súkromie. Aj napriek tomu, že pracujeme s anonymizovanými dátami alebo iným spôsobom zabezpečíme, že z výsledkov našej práce sa nedajú odvodiť súkromné informácie spojiteľné s jednotlivcami, jedná sa o veľmi citlivú tému, ku ktorej treba pristupovať opatrne.

Príkladom môžu byť rôzne výskumy o správaní ľudí, ktoré pochádzajú zo vzorov správania pri nakupovaní. Aj napriek tomu, že výsledky tohto výskumu nepoukazujú na správanie konkrétnych osôb, ale iba na štatistické údaje, vnímajú to zákazníci častokrát veľmi citlivo. Pri výskumoch odvodených z pohybu mobilných telefónov užívateľov je tento jav ešte silnejší.

Pomôžeme vám pri voľbe zdroja dát, anonymizácii a prezentácii dát tak, aby sme nedali zámienku na akékoľvek legitímne námietky voči zásahu do súkromia.

Zodpovednosť za zlé rozhodnutia

V dnešnej dobe nie je ťažké nájsť odpoveď na danú otázku; ťažké je nájdenie správnej otázky a ako sa otázky vyvíjajú, získavame lepší vhľad do nášho ekosystému a nášho podnikania – Kevil Weil

V dátach je možné nájsť súhlasnú odpoveď na takmer akúkoľvek otázku. Stačí sa správne pozerať. Big data by nemal byť spôsob, akým si potvrdíme rozhodnutie, ktoré už padlo. Je potrebná zmena perspektívy, kedy sa naozaj snažíme zistiť, čo nám dáta hovoria. Mali by sme byť pripravení akceptovať aj nečakanú odpoveď. Najväčšia hodnota je v tom, keď dáta preukážu, že sme sa vo svojich predpokladoch mýlili – nemusíme znášať náklady zlého rozhodnutia, pretože ho nespravíme skôr ako si potvrdíme platnosť predpokladov, ktoré k nemu vedú. Najlacnejšie zlé rozhodnutia sú tie, ktoré sa nezrealizujú.

Neštruktúrované dáta

80%-90% dát sú neštruktúrované dáta, čo sťažuje ich použitie a interpretáciu

Medzi štruktúrované dáta patria tie dáta, ktoré majú okrem obsahu aj štruktúru. Patria sem napr. štruktúrované dáta sú uložené v relačnej databáze, dokumentovej databáze (napr. vo formáte XML, JSON, …) alebo ako tzv. dátové vety.

Neštruktúrované dáta sú napr.:

  • email
  • video
  • zvukové záznamy
  • obrázky / fotografie
  • tweety a facebook statusy
  • konverzácie v call centre
  • telefonáty
  • textové dokumenty

Keďže vo väčšine organizácií je väčšina dát neštruktúrovaných, sťažuje to použitie bežných nástrojov na vyhľadávanie a dopytovanie týchto zdrojov dát. V databáze, ktorá obsahuje výplaty ľahko zistíme priemernú alebo mediánovú mzdu, pretože je jasná štruktúra týchto dát. Ak by sme mali výplaty uložené ako obrázky naskenovaných výplatných pások, je tento problém oveľa zložitejší (a v tomto prípade by bol najjednoduchší manuálny výpočet).

Vyhľadávanie a efektívne používanie neštruktúrovaných dát, hľadanie súvislostí a iných atribútov, napr. popularita, kvalita alebo dôležitosť je náročným orieškom – a my sa ho radi spolu s vami pokúsime rozlúsknuť.

Ukladanie dát

Každé dva dni vznikne na svete 5 exabajtov dát. To je 5 miliónov terabajtov!

Rozpočty v IT firmách rastú medziročne v priemere o 5%, zatiaľčo množstvo vytvorených dát rastie v priemere o 40%. Tento nesúlad medzi výdajmi a požiadavkami na ukladanie dát zvyšuje náročnosť efektívneho ukladania dát a efektívneho spracovania dát.

Adoptovaním nových trendov ako napr. distribuované databázy alebo NoSQL databázy a používanie open-source technológií namiesto drahých proprietárnych riešení má výrazný pozitívny efekt na udržateľnosť ukladania dát.

S ukladaním dát vám radi pomôžeme – pozrite si naše služby v oblasti ukladania dát