Datascience & Intelligence Artificielle

DURÉE:
3 jours
ID:
BMLA

Machine learning – Approfondissement


OBJECTIFS :

  • Savoir comment analyser les données non-structurées
  • Découvrir les méthodes de prédictions automatiques
  • Être en mesure d’extraire le maximum de valeurs des traces numériques
  • Améliorer ses méthodes et les rendre efficaces en environnement de production

PROGRAMME DE FORMATION:

Préambule

  • Un tour d’horizon du Machine Learning
  • Les limites du Machine Learning.
  • Quels sont les pièges à éviter ?
  • Apprendre à réduire la complexité de la solution (feature selection)
  • Sur-apprentissage
  • Détection et remèdes

Essentiel de Python et préparation des données

  • L’essentiel du langage Python et son environnement de développement
  • Nettoyage, exploration et préparation des données avec Pandas

Méthodes de prédictions automatiques

  • Comment prédire des catégories ?
  • Comment extraire des tendances ?
  • Comment regrouper les données en familles naturelles ?

Text Mining : analyse des données non-structurées

  • Exposé des méthodes et Use case et exemples complets :
    Analyse de sentiments
  • Découverte et extraction automatique de thèmes et sujets de documents textes
  • Text Mining : détection automatique de personnes, de noms de lieux et d’organisations

Exercices pratiques

Analyse de données structurées

  • Découverte de catégories
  • Algorithme de forêts aléatoires
  • Critères de choix de modèles de décision
  • Prédiction d’attribution de prêt bancaire

Extraction de tendances

  • Régression linéaire et non-linéaire

Mise en production des modèles d’analyse

  • Apprendre à construire de nouveaux prédicteurs (feature engineering)
  • Comment régler la valeur des paramètres ?
  • Comment réutiliser les modèles prédictifs appris ?

Compétition de Data Science sur Kaggle.com

  • Mise en œuvre des notions apprises
  • Test de divers algorithmes de Machine Learning sur des data-sets réels

Participation à une compétition de Data Science


INFORMATIONS COMPLÉMENTAIRES :

PUBLIC VISÉ

  • Ingénieurs
  • Data scientist
  • Développeurs
  • Analyste BI
  • Chargés d’études

PRÉ-REQUIS

  • Connaissances de base en codage
  • Connaissances de base en langage informatique type Python

RESSOURCES

  • Supports pédagogiques
  • 40% de théorie
  • 60% de pratique

MODALITÉS D’ACCÈS

  • Présentiel
  • A distance
  • Interentreprises
  • Intra-entreprise

MÉTHODES PÉDAGOGIQUES

  • Apport magistral et interactivité
  • Travaux pratiques

ÉVALUATION

  • Exercices pratiques
  • Mise en situation