Datascience & Intelligence Artificielle

DURÉE:
5 jours
ID:
BMLG

Machine learning – Gestion de projet Data


OBJECTIFS :

  • Savoir comment analyser les données non-structurées
  • Découvrir les méthodes de prédictions automatiques
  • Apprendre comment booster son chiffre d’affaires avec un moteur de recommandation
  • Être en mesure d’extraire le maximum de valeurs des traces numériques
  • Améliorer ses méthodes et les rendre efficaces en environnement de production

PROGRAMME DE FORMATION :

Essentiel de Python et préparation des données

  • L’essentiel du langage Python et son environnement de développement
  • Nettoyage, exploration et préparation des données avec Pandas

Préambule

  • Un tour d’horizon du Machine Learning
  • Les limites du Machine Learning. Quels sont les pièges à éviter ?
  • Apprendre à réduire la complexité de la solution (feature selection)
  • Sur-apprentissage. Détection et remèdes

Méthodes de prédictions automatiques

  • Comment prédire des catégories ?
  • Comment extraire des tendances ?
  • Comment regrouper les données en familles naturelles ?

Text Mining : analyse des données non-structurées

  • Exposé des méthodes et Use case et exemples complets :
  • Analyse de sentiments
  • Découverte et extraction automatique de thèmes et sujets de documents textes
  • Text Mining : détection automatique de personnes, de noms de lieux et d’organisations

Exercices pratiques

Analyse de données structurées

  • Découverte de catégories
  • Algorithme de forêts aléatoires
  • Critères de choix de modèles de décision
  • Prédiction d’attribution de prêt bancaire

Mise en production des modèles d’analyse

  • Apprendre à construire de nouveaux prédicteurs (feature engineering)
  • Comment régler la valeur des paramètres ?
  • Comment réutiliser les modèles prédictifs appris ?

Analyse de données structurées

  • Extraction de tendances
  • Régression linéaire et non-linéaire

Ticket Mining : analyse des données non-structurées

  • Comment prédire un panier et un parcours dans un magasin
  • Analyse de ticket de caisse

Comment Gérer efficacement un projet Data ?

  • Quelles sont les méthodes & outils ?
  • Quels écueils éviter ?
  • Quel acteur de son organisation impliquer pour gérer les projets Data ?
  • Quels sont les différents profils dans un projet Data ?
  • Comment gérer les compétences dans une équipe data ?

Gouvernance des données

  • Le Règlement européen de gestion des données personnelles

Ethique des algorithmes

  • Qu’est-ce que c’est ?
  • Quelles sont les valeurs que doivent véhiculer les algorithmes ?

Compétition de Data Science sur Kaggle.com

  • Mise en œuvre des notions apprises
  • Test de divers algorithmes de Machine Learning sur des data-sets réels

INFORMATIONS COMPLÉMENTAIRES :

PUBLIC VISÉ

  • Ingénieurs
  • Data scientist
  • Développeurs
  • Analyste BI
  • Chargés d’études

PRÉ-REQUIS

  • Connaissances de base en codage
  • Connaissances de base en langage informatique type Python

RESSOURCES

  • Supports pédagogiques
  • 40% de théorie
  • 60% de pratique

MODALITÉS D’ACCÈS

  • Présentiel
  • A distance
  • Interentreprises
  • Intra-entreprise

MÉTHODES PÉDAGOGIQUES

  • Apport magistral et interactivité
  • Travaux pratiques

ÉVALUATION

  • Exercices pratiques
  • Mise en situation