Machine learning – Approfondissement
OBJECTIFS :
- Savoir comment analyser les données non-structurées
- Découvrir les méthodes de prédictions automatiques
- Être en mesure d’extraire le maximum de valeurs des traces numériques
- Améliorer ses méthodes et les rendre efficaces en environnement de production
PROGRAMME DE FORMATION:
Préambule
- Un tour d’horizon du Machine Learning
- Les limites du Machine Learning.
- Quels sont les pièges à éviter ?
- Apprendre à réduire la complexité de la solution (feature selection)
- Sur-apprentissage
- Détection et remèdes
Essentiel de Python et préparation des données
- L’essentiel du langage Python et son environnement de développement
- Nettoyage, exploration et préparation des données avec Pandas
Méthodes de prédictions automatiques
- Comment prédire des catégories ?
- Comment extraire des tendances ?
- Comment regrouper les données en familles naturelles ?
Text Mining : analyse des données non-structurées
- Exposé des méthodes et Use case et exemples complets :
Analyse de sentiments
- Découverte et extraction automatique de thèmes et sujets de documents textes
- Text Mining : détection automatique de personnes, de noms de lieux et d’organisations
Exercices pratiques
Analyse de données structurées
- Découverte de catégories
- Algorithme de forêts aléatoires
- Critères de choix de modèles de décision
- Prédiction d’attribution de prêt bancaire
Extraction de tendances
- Régression linéaire et non-linéaire
Mise en production des modèles d’analyse
- Apprendre à construire de nouveaux prédicteurs (feature engineering)
- Comment régler la valeur des paramètres ?
- Comment réutiliser les modèles prédictifs appris ?
Compétition de Data Science sur Kaggle.com
- Mise en œuvre des notions apprises
- Test de divers algorithmes de Machine Learning sur des data-sets réels
Participation à une compétition de Data Science
INFORMATIONS COMPLÉMENTAIRES :
PUBLIC VISÉ
- Ingénieurs
- Data scientist
- Développeurs
- Analyste BI
- Chargés d’études
PRÉ-REQUIS
- Connaissances de base en codage
- Connaissances de base en langage informatique type Python
RESSOURCES
- Supports pédagogiques
- 40% de théorie
- 60% de pratique
MODALITÉS D’ACCÈS
- Présentiel
- A distance
- Interentreprises
- Intra-entreprise
MÉTHODES PÉDAGOGIQUES
- Apport magistral et interactivité
- Travaux pratiques
ÉVALUATION
- Exercices pratiques
- Mise en situation