03 20 61 95 06

formation Data Lake


  • FDLD
  • Durée : 2 jours
  • Tarif : 1350 € HT

97%

Taux de satisfaction clients
(sur 1838 évaluations du 19/05/21 au 18/03/26)

Voir les avis

Objectifs

A l’issue de la formation le participant sera capable de :
Comprendre le métier de Data Engineer
Monter un Datalake
Mettre à disposition rapidement un important volume de données prêtes à l’emploi

Prérequis

Une expérience en exploitation de bases de données relationnelles est un plus. Pour vous aider à bien choisir votre formation, nous vous proposons un entretien au préalable avec notre expert. Cela vous assurera que vous disposez des connaissances nécessaires pour suivre la formation dans des conditions optimales.

Cette formation ne peut être financée que dans le cadre d’un projet d’entreprise (prise en charge entreprise ou OPCO). Les dossiers à financement personnel et CPF ne sont pas pris en compte.

Public

Architectes de données, ingénieurs de données, analystes de données

Toute personne souhaitant acquérir des compétences en data lakes

Dernière mise à jour

Programme mis à jour le 13 avril 2026
enveloppe Cette formation vous intéresse ? Contactez-nous

Bon à savoir

Evaluez votre niveau

Pour vous aider à bien choisir votre formation, nous vous proposons soit un entretien avec le formateur soit un test d’évaluation. Cela vous assurera que vous disposez des connaissances nécessaires pour suivre la formation dans des conditions optimales.

Sessions garanties

La majorité de nos sessions proposées en distanciel sont garanties. Elles peuvent être enregistrées à la demande.

Travaux pratiques

Nos formations comprennent de nombreux travaux pratiques pour un meilleur apprentissage (60 % de pratique). Nous proposons également de travailler sur vos données pour une meilleure expérience.

Nos prestations

Nous réalisons certaines prestations IT pour vous : développement sur-mesure, refonte logicielle, TMA, interfaçage ERP.
modules

Les Modules
de formation

Module1
Introduction au Big Data

• Définition du Big Data

• Définition du Data Engineering
• Cartographie des compétences
• Principaux use cases de Data Engineering
Atelier pratique : mise en place de l’environnement
Module2
Introduction au Data Lake

• Théorème de CAP

• Qu’est-ce qu’un ETL et un ELT ?
• Définition d’un datalake
• Système de fichiers distribués
Atelier pratique : manipulation de noeuds HDFS
Module3
Ingestion des données

• Manipulation de données en temps réel avec Kafka

• Gestion des flux de données avec Nifi
Atelier pratique : ingestion de données en temps réel dans un datalake avec Nifi et Kafka
Module4
Transformation des données

• Différence entre données structurées et non structurées

• Le paradigme MapReduce
• L’écosystème Hadoop
• Transformation de données avec Spark
Atelier pratique : uniformisation du format et enrichissement des données sur un Data lake
Module5
Mise à disposition de la donnée

• Définition d’un Datawarehouse

• Valeur ajoutée de Hyve pour l’exposition des données
• Atelier pratique : mise à disposition des données structurées avec Hyve
• Visualisation de données structurées
Module6
Architecture Lambda

• Qu’est-ce qu’une architecture Lambda

• Implémentation d’une architecture Lambda dans un Datalake
Atelier pratique : implémentation d’une Architecture Lambda

Les prochaines
sessions de formation

Sur demande
Vous souhaitez organiser cette formation à une date spécifique ?Contactez-nous en remplissant le formulaire ci-dessous
08 juin 2026
03 août 2026
28 septembre 2026
16 novembre 2026

Cette formation vous intéresse ? Contactez-nous !

    Les données personnelles collectées sont destinées à Access IT Company...