Formation BIG DATA Les fondamentaux
Objectifs
Identifier les concepts fondamentaux du Big Data, y compris ses caractéristiques et ses bénéfices.
Expliquer les dimensions du Big Data (volume, variété, vélocité) et les technologies populaires comme Hadoop et MongoDB.
Utiliser les outils de Data Mining pour analyser des données provenant de différentes sources.
Analyser les données de l’entreprise et des réseaux sociaux pour en extraire des informations pertinentes.
Intégrer les techniques descriptives et prédictives pour résoudre des problèmes spécifiques.
Évaluer les impacts éthiques et de vie privée liés à l’utilisation du Big Data.
Concevoir et configurer un environnement Hadoop pour le traitement des données.
Préparer et passer l’examen de certification Big Data Foundation.
Pré-requis
Participants
Programme de formation
INTRODUCTION
LES FONDAMENTAUX DU BIG DATA
-
Un peu d'histoire...
-
Définition, caractéristiques et bénéfices
-
Les dimensions (volume, variété, vélocité)
-
Les technologies les plus populaires (Hadoop, MongoDB)
-
Ethique et vie privée
LES SOURCES DU BIG DATA
-
Les données de l'entreprise (Oracle, SAP, Microsoft, Data Warehouses, données non-structurées)
-
Réseaux sociaux (Facebook, Twitter, autres)
-
Données publiques (économiques, financières, comportementales, etc.)
DATA MINING
-
Définition
-
Les techniques descriptives et prédictives (Classification, association, segmentation, etc.)
-
Exemples d'outils (Weka, KNIME, R)
ZOOM SUR HADOOP
-
Présentation de Hadoop (Les principaux composants, les extensions)
-
Installation et configuration
-
MapReduce
-
Data Processing avec Hadoop
ZOOM SUR MONGODB
-
Présentation de MongoDB
-
Réplication et sharding
-
Ecosystèmes (langages, drivers, outils, intégration avec Hadoop)
-
Installation et configuration
-
Base de données de documents
-
Modèle de données de documents