Big Data / Etat de l’Art – Enjeux pour l’entreprise et tendances
OBJECTIFS :
- Découvrir les concepts du Big Data
- Savoir évaluer les avantages et les inconvénients du Big Data
- Identifier les problèmes et les solutions apportés par le Big Data
- Connaître les méthodes de base et les champs d’application du Big Data
PROGRAMME DE FORMATION:
Historique et contexte de l’explosion des usages autour des données
- Les origines du Big Data : un monde de données numériques, chronologie
- Une définition par les trois V, et les V complémentaires
- La valeur de la donnée : une prise de conscience
- La donnée en tant que matière première : pourquoi et comment comparer pétrole et données
- La prise de décision : origine et évolution des outils d’aide à la décision
L’Economie des données
- Principes de l’économie des données et des algorithmes
- Etudes de cas liés à la transformation numérique
- Analyse illustrée de différents modèles économiques liés à l’analyse de données
- Les métiers liés à la donnée
- Les entreprises du domaine de la donnée
- Exercice pratique de réflexion sur l’analyse de données non structurées
Gestion du patrimoine informationnel et pilotage de la valeur
- Préparation d’un projet Big Data : définition des cas d’usage
- Construction d’un Business Model Canvas et d’une matrice d’évaluation
- Les architectures techniques : data warehouse, data lake, etc.
- Les acteurs du Big Data
- Analyse détaillée des évolutions technologiques dans les domaines de l’acquisition des données, du stockage et de la restitution
- Exercice pratique de rétro-analyse d’une architecture Big Data
Big Data : Acquisition des données
- L’enchaînement des opérations. L’acquisition.
- Le recueil des données : crawling, scraping.
- La gestion de flux événementiel (Complex Event Processing, CEP).
- L’indexation du flux entrant.
- L’intégration avec les anciennes données.
- La qualité des données
Big Data : Stockage des données
- Les différentes formes de stockage des données structurées : SQL, OLAP, Bases Graphes
- NoSQL : différences et apports
- Panorama des solutions NoSQL
- HADOOP : de quoi s’agit-il ?
- Détails du fonctionnement et de l’architecture d’un système HADOOP
- L’écosystème Hadoop : Hive, Pig. Les difficultés d’Hadoop
- HADOOP et Big Data sont-ils indissociables ?
- Les autres solutions de stockage de données (Data Lake)
- Le modèle d’architecture des Clouds publics et privés
- Les objectifs et avantages des architectures Cloud
- Les infrastructures
- Les égalités et les différences entre Cloud et Big Data
- Les Clouds de stockage
- Les outils de restitution : de la Data Visualization au Data Storytelling
- Panorama des outils tels que Qlik, Tableau, TIBCO Spotfire, Microsoft PowerBI.
Machine Learning, Deep Learning, Intelligence Augmentée
- Comprendre les concepts et les définitions
- Différences entre intelligence artificielle et intelligence augmentée
- Qu’est-ce que le machine learning
- Détails du processus d’apprentissage machine : modélisation, apprentissage, exécution, rétroaction
- Cas pratiques de mises en place
- Exercice pratique de conception d’une matrice d’apprentissage
Cas d’usage à travers des exemples et conclusion
- L’anticipation : besoins des utilisateurs dans les entreprises, maintenance des équipements.
- La sécurité : des personnes, détection de fraude (postale, taxes), le réseau.
- La recommandation. Analyses marketing et analyses d’impact.
- Analyses de parcours. Distribution de contenu vidéo.
- Big Data pour l’industrie automobile ? Pour l’industrie pétrolière
- Faut-il se lancer dans un projet Big Data ?
- Gouvernance du stockage des données : rôle et recommandations, le Data Scientist, les compétences d’un projet Big Data
INFORMATIONS COMPLÉMENTAIRES :
PUBLIC VISÉ
- Toute personne s’intéressant au Big data et ayant des connaissances de base en architecture technique
PRÉ-REQUIS
RESSOURCES
MODALITÉS D’ACCÈS
- Présentiel
- A distance
- Interentreprises
- Intra-entreprise
MÉTHODES PÉDAGOGIQUES
- Apport magistral et interactivité
- Travaux pratiques
ÉVALUATION
- Exercices pratiques
- Mise en situation