Rozšířené vyhledávání

M20773 Analýza velkých dat (Big data) pomocí Microsoft R Tisk

Tento 3-denní kurz provede studenty využitím Microsoft R Serveru, tvorbou a provedením analýzy velkého objemu dat, správou prostředí, s využitím systému Hadoop, Spark clusteru nebo SQL Server databází.

Kurz akreditovaný pro DVPP

Délka kurzu: 3 dny

Termíny

TermínMístoJazykCena (bez DPH)Dostupnost
14. 1. 2019 - 16. 1. 2019 Praha cs 18 200 Kč Volný termín Garantovaný termín
13. 3. 2019 - 15. 3. 2019 Praha cs 18 200 Kč Volný termín
20. 5. 2019 - 22. 5. 2019 Praha cs 18 200 Kč Volný termín
PDF ke stažení Rozbalit všeSbalit vše
  • Absolvent kurzu bude umět

    • Jak funguje Microsoft R Server a Microsoft R Client.
    • Používat R Client s R Serverem k analýze velkého objemu dat z různých zdrojů.
    • Vizualizovat data pomocí grafů a diagramů.
    • Transformovat a čistit velké data sety.
    • Implementovat možnost provádět analytické operace paralelně.
    • Vytvořit a použít regresní modely generované z velkého objemu dat.
    • Vytvořit, ohodnotit a nasadit partition model generovaný z velkého objemu dat.
    • Využít R v prostředí SQL Serveru a prostředí Hadoop.
  • Požadavky pro absolvování kurzu

    • Přehledová znalost obecných statistických metod a analýzy dat.
    • Základní znalosti operačního systému Microsoft Windows.
    • Znalost relačních databází.
  • Kurz určen pro

    Kurz je určen pro pracovníky, kteří analyzují velké objemy dat s využitím Big data technologií a pro vývojáře či IT pracovníky, kteří potřebují integrovat analýzy R do firemních řešení.

  • Literatura

    Všichni účastníci školení obdrží originál studijních certifikovaných materiálů Microsoft.

  • Technické vybavení

    Prostorné učebny jsou vybaveny nadstandardními počítači s možností přístupu na Internet, včetně bezdrátového přístupu.

  • Osnova

    Modul 1: Microsoft R Server a R Client

    • Kapitola: Microsoft R Server
    • Kapitola: Microsoft R Client
    • Kapitola: ScaleR funkce
    • Cvičení: Microsoft R Server a Microsoft R Client

    Modul 2: Big Data

    • Kapitola: ScaleR datové zdroje
    • Kapitola: Načítání dat do XDF objektu
    • Kapitola: Sumarizace dat do XDF objektů
    • Cvičení: Big Data

    Modul 3: Vizualizace velkého objemu dat

    • Kapitola: Vizualizace In-memory dat
    • Kapitola: Vizualizace dat
    • Cvičení: Vizualizace dat

    Modul 4: Zpracování velkého objemu dat

    • Kapitola: Transformace velkého objemu dat
    • Kapitola: Správa data setů
    • Cvičení: Zpracování dat

    Modul 5: Paralelizace analytických operací

    • Kapitola: Využití RxLocalParallel kontextu výpočtu s rxExec
    • Kapitola: Využití revoPemaR balíčků
    • Cvičení: Využití rxExec a RevoPemaR k paralelizaci operací

    Modul 6: Tvorba a využití regresních modelů

    • Kapitola: Clustering Big Data
    • Kapitola: Generování regresních modelů a tvorba predikcí
    • Cvičení: Tvorba lineárního regresního modelu

    Modul 7: Tvorba a využití partitioning modelů

    • Kapitola: Tvorba partitioning modelů založených na rozhodovacích stromech
    • Kapitola: Testování partitioning modelů
    • Cvičení: Tvorba a využití partitioning modelů

    Modul 8: Využití Big dat v SQL Serveru a prostředí Hadoop

    • Kapitola: Využití R v SQL Serveru
    • Kapitola: Využití Hadoop Map/Reduce
    • Kapitola: Využití Hadoop Spark
    • Cvičení: Zpracování velkého objemu dat pomocí SQL Serveru a prostředí Hadoop

     

  • Návaznosti

    Business Intelligence

    Business Intelligence
OKsystem a.s.
Tento web používá k poskytování služeb a analýze návštěvnosti soubory cookie. Používáním těchto stránek s tím souhlasíte.