Passer commande via notre portail client

Partager cet article ...Print this pageEmail this to someoneTweet about this on TwitterShare on FacebookShare on Google+Share on LinkedInPin on PinterestShare on TumblrDigg this
Big Data, synthèse technique
BAG / LI-ART-116
OBJECTIFS PEDAGOGIQUES
Ce cours de synthèse vous présentera les enjeux et les apports du Big Data ainsi que les technologies pour sa mise en œuvre. Vous apprendrez à gérer un projet de gestion de données massives depuis l’installation d’une plateforme Big Data, tout en passant par la gestion, l’analyse et la visualisation des données.

PUBLIC
Dataminers, chargés d’études statistiques, développeurs, chefs de projet, consultants en informatique décisionnelle.
PRE-REQUIS
Connaissances de base des modèles relationnels, des statistiques et des langages de programmation. Connaissances de base des concepts de la Business Intelligence.

CONTENU

Comprendre les concepts clés et les enjeux du Big Data
- Les origines du Big Data.
- La valeur de la donnée : un changement d’importance.
- La donnée en tant que matière première.
- Les chiffres clés du marché dans le monde et en France.
- Les enjeux du Big Data : ROI, organisation, confidentialité des données.

Technologies du Big Data
- Architecture et composants de la plateforme Hadoop 2.
- Les modes de stockage (NoSQL, HDFS).
- Fonctionnement de MapReduce et Yarn…
- Principales distributions Hadoop : Hortonworks, Cloudera, MapR…
- Les technologies émergentes : Spark, Storm, Machine Learning Azure…
- Démarche d’installation d’une plateforme Hadoop.
- Présentation des technologies spécifiques pour le Big Data (Talend, Tableau, Qlikview …).

Traitement des données Big Data
- Fonctionnement de Hadoop Distributed File System (HDFS).
- Importer des données vers HDFS.
- Traitement des données avec PIG.
- Requêtes SQL avec HIVE.
- Création de flux de données massives avec un ETL.

Méthodes d’analyse et traitements des données pour le Big Data
- Les méthodes d’exploration.
- Segmentation et classification.
- Machine Learning, estimation et prédiction.
- Le temps réel, l’IA.
- L’implémentation des modèles.

Data Visualisation, représenter des données de façon visuelle
- Principales solutions du marché.
- Aller au-delà des rapports statiques.
- La Data Visualisation et l’art de raconter des chiffres de manière créative et ludique.
- Mesurer l’e-réputation, la notoriété d’une marque, l’expérience et la satisfaction clients…

Conclusion
- Les conditions du succès.
- Synthèse des meilleures pratiques.
- Bibliographie.

SESSIONS PROGRAMMEES

 

Accès au calendrier

VALIDATION

Evaluation en fin de session

PEDAGOGIE INTERVENANTS
Spécialiste Big Data

MODALITES PRATIQUES
Durée : 2 jours soit 14 heures avec 7 heures par jour
Prix stagiaire : 1 561,00 € TTC
Horaires : 09h00 – 17h30

Durée: