Passer commande via notre portail client

Partager cet article ...Print this pageEmail this to someoneTweet about this on TwitterShare on FacebookShare on Google+Share on LinkedInPin on PinterestShare on TumblrDigg this
Flink, développer des applications pour le Big Data
FKB / LI-REQ-253
OBJECTIFS PEDAGOGIQUES 

À la fin du cours, le stagiaire sera capable de :

  • Maîtriser les concepts fondamentaux de Flink
  • Développer des applications à l’aide de DataSet et DataStream API
  • Traitement de données distribué avec Flink et Hadoop
  • Exploiter des données avec Table API
  • Avoir une première approche du machine learning
PUBLIC 

Développeurs, architectes.

PRE-REQUIS 

Bonnes connaissances du langage Scala ou Java.

CONTENU

Introduction à Apache Flink

- Historique du framework.
- Les différentes versions de Flink.
- Comparaison avec l’environnement Apache Hadoop et Apache Spark.
- Les différents modules de Flink.

Traitement de données à l’aide de l’API DataStream

- Environnement d’exécution et sources de données.
- Les transformations: Map, FlatMap, Filter, KeyBy, Reduce…
- Les opérations sur des flux multiples : Union, Cogroup, Connect, Join, Iterate…
- Les opérations sur Windows : Global, Tumbling, Sliding, Session…
- Le partitionnement physique personnalisé, aléatoire, rééquilibrage et redimensionnement.
- Les DataSink et les connecteurs : Kafka, Twitter, ElasticSerch…

Traitement de données à l’aide de l’API Batch

- Les différents types de sources de données.
- Les transformations et agrégations.
- L’écriture des données.
- Les DataSink et les connecteurs : HDFS, S3, Avro, MongoDB.

Traitement de données à l’aide de l’API Table

- Enregistrement et lecture des tables enregistrées.
- Les opérateurs : sélection, filtre, jointure, orderBy…
- Utiliser du SQL sur le flux de données.
- Les fonctions Scala dans SQL.
- Traitement des événements complexes.

Machine Learning avec FlinkML

- Introduction au machine learning.
- Les différentes classes d’algorithmes.
- Présentation de FlinkML et des différents algorithmes.

API Flink Graph – Gelly

- Qu’est-ce qu’un graphe ?
- Les différentes opérations.
- Créer des graphes.
- Transformations de graphes.
- Présentation de différents algorithmes.

Déploiement de Flink

- Flink sur YARN Configurations.
- Lancement et arrêt d’un cluster.
- Soumettre un travail à Flink.
- Flink sur Google Cloud.
- Flink sur AWS.

SESSIONS PROGRAMMEES 

Accès au calendrier

VALIDATION

Evaluation en fin de session

PEDAGOGIE 

Alternance d’exposés et de travaux pratiques

INTERVENANTS 

Spécialiste

MODALITES PRATIQUES

Durée : 3 jours soit 21 heures avec 7 heures par jour
Prix stagiaire : 1 779,00 € TTC
Horaires : 9h – 17h30

Durée: