Machine learning – Gestion de projet Data
OBJECTIFS :
- Savoir comment analyser les données non-structurées
- Découvrir les méthodes de prédictions automatiques
- Apprendre comment booster son chiffre d’affaires avec un moteur de recommandation
- Être en mesure d’extraire le maximum de valeurs des traces numériques
- Améliorer ses méthodes et les rendre efficaces en environnement de production
PROGRAMME DE FORMATION :
Essentiel de Python et préparation des données
- L’essentiel du langage Python et son environnement de développement
- Nettoyage, exploration et préparation des données avec Pandas
Préambule
- Un tour d’horizon du Machine Learning
- Les limites du Machine Learning. Quels sont les pièges à éviter ?
- Apprendre à réduire la complexité de la solution (feature selection)
- Sur-apprentissage. Détection et remèdes
Méthodes de prédictions automatiques
- Comment prédire des catégories ?
- Comment extraire des tendances ?
- Comment regrouper les données en familles naturelles ?
Text Mining : analyse des données non-structurées
- Exposé des méthodes et Use case et exemples complets :
- Analyse de sentiments
- Découverte et extraction automatique de thèmes et sujets de documents textes
- Text Mining : détection automatique de personnes, de noms de lieux et d’organisations
Exercices pratiques
Analyse de données structurées
- Découverte de catégories
- Algorithme de forêts aléatoires
- Critères de choix de modèles de décision
- Prédiction d’attribution de prêt bancaire
Mise en production des modèles d’analyse
- Apprendre à construire de nouveaux prédicteurs (feature engineering)
- Comment régler la valeur des paramètres ?
- Comment réutiliser les modèles prédictifs appris ?
Analyse de données structurées
- Extraction de tendances
- Régression linéaire et non-linéaire
Ticket Mining : analyse des données non-structurées
- Comment prédire un panier et un parcours dans un magasin
- Analyse de ticket de caisse
Comment Gérer efficacement un projet Data ?
- Quelles sont les méthodes & outils ?
- Quels écueils éviter ?
- Quel acteur de son organisation impliquer pour gérer les projets Data ?
- Quels sont les différents profils dans un projet Data ?
- Comment gérer les compétences dans une équipe data ?
Gouvernance des données
- Le Règlement européen de gestion des données personnelles
Ethique des algorithmes
- Qu’est-ce que c’est ?
- Quelles sont les valeurs que doivent véhiculer les algorithmes ?
Compétition de Data Science sur Kaggle.com
- Mise en œuvre des notions apprises
- Test de divers algorithmes de Machine Learning sur des data-sets réels
INFORMATIONS COMPLÉMENTAIRES :
PUBLIC VISÉ
- Ingénieurs
- Data scientist
- Développeurs
- Analyste BI
- Chargés d’études
PRÉ-REQUIS
- Connaissances de base en codage
- Connaissances de base en langage informatique type Python
RESSOURCES
- Supports pédagogiques
- 40% de théorie
- 60% de pratique
MODALITÉS D’ACCÈS
- Présentiel
- A distance
- Interentreprises
- Intra-entreprise
MÉTHODES PÉDAGOGIQUES
- Apport magistral et interactivité
- Travaux pratiques
ÉVALUATION
- Exercices pratiques
- Mise en situation