Analyse Big data avec R
OBJECTIFS :
- Connaître et apprendre à utiliser l’environnement R pour l’exploration des données issues de différentes sources
- Être capable de visualiser les données en utilisant des graphiques et des nuages de points
- Comprendre comment transformer et nettoyer des ensembles de données
- Être capable de construire et évaluer les modèles de régressions
- Être en mesure de créer, marquer et déployer des modèles de partition
- Savoir utiliser R dans les environnements SQL Server et Hadoop
PROGRAMME DE FORMATION :
Microsoft R server et R client
- Définition d’un serveur Microsoft R
- Utilisation du client Microsoft R
- Les fonctions ScaleR
Explorer de grandes données
- Comprendre les sources de données ScaleR
- Lecture de données dans un objet XDF
- Résumer des données dans un objet XDF
Visualisation d’un grand nombre de données
- Visualisation des données en mémoire
- Visualisation d’un grand nombre de données
Traitement d’un grand nombre de données
- Transformer un grand nombre de données
- Gestion d’un ensemble de données
Opérations d’analyse en parallèle
- Utilisation du contexte de calcul RxLocalParallel avec rxExec
- Utilisation du package revoPemaR
Création et évaluation de modèles de régression
- Clustering Big Data
- Générer des modèles de régression et faire des prédictions
Création et évaluation de modèles de partitionnement
- Création de modèles de partitionnement basés sur des arbres de décision
- Tester les modèles de partitionnement en effectuant et en comparant des prédictions
Traitement d’un grand nombre de données dans sql server et hadoop
- Utilisation de R dans SQL Server
- Utilisation de Hadoop Map / Reduce
- Utilisation de Hadoop Spark
INFORMATIONS COMPLÉMENTAIRES :
PUBLIC VISÉ
- Analystes
- Statisticiens
- Gestionnaires de bases de données
PRÉ-REQUIS
- Connaissances de base en programmation
- Connaissances de base en techniques statistiques
RESSOURCES
- Supports pédagogiques
- 30% de théorie
- 70% de pratique
MODALITÉS D’ACCÈS
- Présentiel
- A distance
- Interentreprises
- Intra-entreprise
MÉTHODES PÉDAGOGIQUES
- Apport magistral et interactivité
- Travaux pratiques
ÉVALUATION
- Exercices pratiques
- Mise en situation