Passer commande via notre portail client

Partager cet article ...Print this pageEmail this to someoneTweet about this on TwitterShare on FacebookShare on Google+Share on LinkedInPin on PinterestShare on TumblrDigg this
Talend Open Studio for Data Quality, gérer la qualité des données
TDQ / LI-BDD-134
OBJECTIFS PEDAGOGIQUES
Ce cours vous apprendra à exploiter efficacement l’outil Talend Open Studio for Data Quality de manière à évaluer le niveau de qualité des données d’un système d’information. Vous mettrez en œuvre des analyses, vérifierez des règles métiers et définirez des stratégies de correction pour les données erronées.

PUBLIC
Analystes métiers, intégrateurs de données, gestionnaires de données.
PRE-REQUIS
Bonnes connaissances des bases de données relationnelles et du SQL. Connaissances de base de Talend Open Studio for Data Integration.

CONTENU

La problématique de la qualité des données
- L’évaluation de la qualité des données d’un système d’information.
- Critères fondamentaux : exhaustivité, précision et intégrité des données.
- Positionnement du produit Talend Open Studio for Data Quality dans la suite Talend.

Les concepts fondamentaux de TOS for Data Quality
- Les métadonnées : connexions aux bases, fichiers délimités et fichiers Excel.
- Présentation des différents types d’analyses.
- Les outils et indicateurs d’aide à la réalisation des analyses.
- L’explorateur de données.

Les analyses simples
- Recherche de doublons, respect de contraintes d’intervalle, format de date, d’email…
- Métriques d’une table, dépendances fonctionnelles entre colonnes.
- Identification des redondances de valeurs.
- Contrôles de cohérence entre clefs étrangères et primaires.
- Utiliser les indicateurs, les modèles, les règles et les fichiers sources.

Les analyses avancées
- Analyse de schéma et de la structure des tables via l’explorateur de données.
- Analyse multitable et multicolonne, respect de règles métiers.
- Recherche et visualisation de corrélation entre colonnes.
- Créer ses propres indicateurs et fichiers sources.
- Gérer les analyses.

Eléments avancés
- Utiliser des variables de contexte.
- Créer des modèles basés sur des expressions régulières.
- Exporter/importer les analyses et les données analysées.
- Corriger les données erronées avec Talend Data Integration.

SESSIONS PROGRAMMEES

 

Accès au calendrier

VALIDATION

Evaluation en fin de session

PEDAGOGIE
Alternance d’exposés et de travaux pratiques
INTERVENANTS
Spécialiste Talend

MODALITES PRATIQUES
Durée : 2 jours soit 14 heures avec 7 heures par jour
Prix stagiaire : 1 314,00 € TTC
Horaires : 9h – 17h30

Durée: