Ne pas tenir compte du tarif indiqué en bas de page
Rendez-vous sur le portail client et cliquer sur Passer commande
Les prix 2020 sont indiqués


Partager cet article ...Print this pageEmail this to someoneTweet about this on TwitterShare on FacebookShare on Google+Share on LinkedInPin on PinterestShare on TumblrDigg this
Big Data Analytics avec Julia, Modélisation et représentation des données
TBD / LI-REQ-264
OBJECTIFS PEDAGOGIQUES
Le Big Bata Analytics repose sur la maîtrise des techniques d’exploration de données fondamentales : statistiques descriptives, prédictives ou exploratoires. Ce cours pratique vous présentera des méthodes telles que les régressions et les ACP et vous apprendra à les mettre en œuvre avec le langage Julia.

PUBLIC
Responsables Infocentre (Datamining, Marketing, Qualité…), utilisateurs et gestionnaires métiers de bases de données.
PRE-REQUIS
Connaissances de base en statistiques, ou avoir suivi le cours “Statistiques, maîtriser les fondamentaux” (Réf. STA).

CONTENU

Introduction au langage Julia
- L’environnement du langage de programmation Julia.
- Les types de données.
- L’importation et l’exportation de données.
- Les techniques pour tracer des courbes et des graphiques.
- L’utilisation des librairies R, Python et Spark.

Analyse en composantes
- Analyse en composantes principales.
- Analyse factorielle de données mixtes.
- Analyse des correspondances multiples.
- Classification hiérarchique sur composantes principales.

La modélisation
- Les étapes de construction d’un modèle.
- Les algorithmes supervisés et non supervisés.
- Le choix entre la régression et la classification.

Procédures d’évaluation de modèles
- Les techniques de ré-échantillonnage en jeu d’apprentissage, de validation et de test.
- Test de représentativité des données d’apprentissage.
- Mesures de performance des modèles prédictifs.
- Matrice de confusion, de coût et la courbe ROC et AUC.

Les algorithmes non supervisés
- Le clustering hiérarchique.
- Le clustering non hiérarchique.
- Les approches mixtes.

Les algorithmes supervisés
- Le principe de régression linéaire univariée.
- La régression multivariée.
- La régression polynomiale.
- La régression régularisée.
- Le Naive Bayes.
- La régression logistique.

Analyse de données textuelles
- Collecte et prétraitement des données textuelles.
- Extraction d’entités primaires, d’entités nommées et résolution référentielle.
- Étiquetage grammatical, analyse syntaxique, analyse sémantique.
- Lemmatisation. Représentation vectorielle des textes. Pondération TF-IDF.

SESSIONS PROGRAMMEES
 Accès au calendrier
VALIDATION
Evaluation en fin de session

PEDAGOGIE
Alternance d’exposés et de travaux pratiques
INTERVENANTS
Spécialiste

MODALITES PRATIQUES
Durée : 4 jours soit 28 heures avec 7 heures par jour
Prix stagiaire : 2307€ TTC
Horaires : 9h – 17h30

 

Durée: