M20773 Analýza velkých dat (Big data) pomocí Microsoft R
Tisk
Tento 3-denní kurz provede studenty využitím Microsoft R Serveru, tvorbou a provedením analýzy velkého objemu dat, správou prostředí, s využitím systému Hadoop, Spark clusteru nebo SQL Server databází.
Kurz akreditovaný pro DVPP
Délka kurzu: 3
dny
Termíny
Termín | Místo | Jazyk | Cena (bez DPH) | Dostupnost |
13. 3. 2019 - 15. 3. 2019
|
Praha |
cs |
18 200 Kč |
Volný termín
|
|
20. 5. 2019 - 22. 5. 2019
|
Praha |
cs |
18 200 Kč |
Volný termín
|
|
PDF ke stažení
Rozbalit všeSbalit vše
-
Absolvent kurzu bude umět
- Jak funguje Microsoft R Server a Microsoft R Client.
- Používat R Client s R Serverem k analýze velkého objemu dat z různých zdrojů.
- Vizualizovat data pomocí grafů a diagramů.
- Transformovat a čistit velké data sety.
- Implementovat možnost provádět analytické operace paralelně.
- Vytvořit a použít regresní modely generované z velkého objemu dat.
- Vytvořit, ohodnotit a nasadit partition model generovaný z velkého objemu dat.
- Využít R v prostředí SQL Serveru a prostředí Hadoop.
-
Požadavky pro absolvování kurzu
- Přehledová znalost obecných statistických metod a analýzy dat.
- Základní znalosti operačního systému Microsoft Windows.
- Znalost relačních databází.
-
Kurz určen pro
Kurz je určen pro pracovníky, kteří analyzují velké objemy dat s využitím Big data technologií a pro vývojáře či IT pracovníky, kteří potřebují integrovat analýzy R do firemních řešení.
-
Literatura
Všichni účastníci školení obdrží originál studijních certifikovaných materiálů Microsoft.
-
Technické vybavení
Prostorné učebny jsou vybaveny nadstandardními počítači s možností přístupu na Internet, včetně bezdrátového přístupu.
-
Osnova
Modul 1: Microsoft R Server a R Client
- Kapitola: Microsoft R Server
- Kapitola: Microsoft R Client
- Kapitola: ScaleR funkce
- Cvičení: Microsoft R Server a Microsoft R Client
Modul 2: Big Data
- Kapitola: ScaleR datové zdroje
- Kapitola: Načítání dat do XDF objektu
- Kapitola: Sumarizace dat do XDF objektů
- Cvičení: Big Data
Modul 3: Vizualizace velkého objemu dat
- Kapitola: Vizualizace In-memory dat
- Kapitola: Vizualizace dat
- Cvičení: Vizualizace dat
Modul 4: Zpracování velkého objemu dat
- Kapitola: Transformace velkého objemu dat
- Kapitola: Správa data setů
- Cvičení: Zpracování dat
Modul 5: Paralelizace analytických operací
- Kapitola: Využití RxLocalParallel kontextu výpočtu s rxExec
- Kapitola: Využití revoPemaR balíčků
- Cvičení: Využití rxExec a RevoPemaR k paralelizaci operací
Modul 6: Tvorba a využití regresních modelů
- Kapitola: Clustering Big Data
- Kapitola: Generování regresních modelů a tvorba predikcí
- Cvičení: Tvorba lineárního regresního modelu
Modul 7: Tvorba a využití partitioning modelů
- Kapitola: Tvorba partitioning modelů založených na rozhodovacích stromech
- Kapitola: Testování partitioning modelů
- Cvičení: Tvorba a využití partitioning modelů
Modul 8: Využití Big dat v SQL Serveru a prostředí Hadoop
- Kapitola: Využití R v SQL Serveru
- Kapitola: Využití Hadoop Map/Reduce
- Kapitola: Využití Hadoop Spark
- Cvičení: Zpracování velkého objemu dat pomocí SQL Serveru a prostředí Hadoop
-
Návaznosti