Big Data

DURÉE:
4 jours
ID:
BAR

Analyse Big data avec R


OBJECTIFS :

  • Connaître et apprendre à utiliser l’environnement R pour l’exploration des données issues de différentes sources
  • Être capable de visualiser les données en utilisant des graphiques et des nuages de points
  • Comprendre comment transformer et nettoyer des ensembles de données
  • Être capable de construire et évaluer les modèles de régressions
  • Être en mesure de créer, marquer et déployer des modèles de partition
  • Savoir utiliser R dans les environnements SQL Server et Hadoop

PROGRAMME DE FORMATION :

Microsoft R server et R client

  • Définition d’un serveur Microsoft R
  • Utilisation du client Microsoft R
  • Les fonctions ScaleR

Explorer de grandes données

  • Comprendre les sources de données ScaleR
  • Lecture de données dans un objet XDF
  • Résumer des données dans un objet XDF

Visualisation d’un grand nombre de données

  • Visualisation des données en mémoire
  • Visualisation d’un grand nombre de données

Traitement d’un grand nombre de données

  • Transformer un grand nombre de données
  • Gestion d’un ensemble de données

Opérations d’analyse en parallèle

  • Utilisation du contexte de calcul RxLocalParallel avec rxExec
  • Utilisation du package revoPemaR

Création et évaluation de modèles de régression

  • Clustering Big Data
  • Générer des modèles de régression et faire des prédictions

Création et évaluation de modèles de partitionnement

  • Création de modèles de partitionnement basés sur des arbres de décision
  • Tester les modèles de partitionnement en effectuant et en comparant des prédictions

Traitement d’un grand nombre de données dans sql server et hadoop

  • Utilisation de R dans SQL Server
  • Utilisation de Hadoop Map / Reduce
  • Utilisation de Hadoop Spark

INFORMATIONS COMPLÉMENTAIRES :

PUBLIC VISÉ

  • Analystes
  • Statisticiens
  • Gestionnaires de bases de données

PRÉ-REQUIS

  • Connaissances de base en programmation
  • Connaissances de base en techniques statistiques

RESSOURCES

  • Supports pédagogiques
  • 30% de théorie
  • 70% de pratique

MODALITÉS D’ACCÈS

  • Présentiel
  • A distance
  • Interentreprises
  • Intra-entreprise

MÉTHODES PÉDAGOGIQUES

  • Apport magistral et interactivité
  • Travaux pratiques

ÉVALUATION

  • Exercices pratiques
  • Mise en situation