03 20 61 95 06

Formation Microsoft 20775 – Réaliser de l’ingénierie de données avec Microsoft HD Insight


  • 20775
  • Durée : 5 jours
  • Tarif : 2815 € HT

96%

Taux de satisfaction clients
(sur 1596 évaluations du 19/05/21 au 16/12/24)

Voir les avis

Objectifs

A l’issue de la formation, l’apprenant sera capable de :
– Déployer des clusters HDInsight
– Charger des données dans HDInsight
– Dépanner HDInsight
– Mettre en place des solutions batch
– Concevoir des solutions Batch ETL pour le Big Data avec Spark
– Analyser les données avec Spark SQL, Hive et Phoenix
– Implémenter Spark Streaming en utilisant l’API DStream
– Développer des solutions de traitement Big Data en temps réel avec Apache Storm
– Construire des solutions qui utilisent Kafka et HBase

Certification

MCSE Data Management and Analytics

Prérequis

Disposer d’une connaissance des méthodes statistiques communes et des meilleures pratiques d’analyse de données
Connaissances de base du système d’exploitation Microsoft Windows et de ses fonctionnalités principales
Connaissance pratique des bases de données relationnelles

Cette formation ne peut être financée que dans le cadre d’un projet d’entreprise (prise en charge entreprise ou OPCO). Les dossiers à financement personnel et CPF ne sont pas pris en compte.

Public

Ingénieurs de données, architectes de données, Data Scientist et les développeurs de données qui envisagent d’implémenter de grands workflows d’ingénierie de données sur HDInsight.

Dernière mise à jour

Programme mis à jour le 31 janvier 2024
enveloppe Cette formation vous intéresse ? Contactez-nous

Bon à savoir

Evaluez votre niveau

Pour vous aider à bien choisir votre formation, nous vous proposons soit un entretien avec le formateur soit un test d’évaluation. Cela vous assurera que vous disposez des connaissances nécessaires pour suivre la formation dans des conditions optimales.

Sessions garanties

La majorité de nos sessions proposées en distanciel sont garanties. Elles peuvent être enregistrées à la demande.

Travaux pratiques

Nos formations comprennent de nombreux travaux pratiques pour un meilleur apprentissage (60 % de pratique). Nous proposons également de travailler sur vos données pour une meilleure expérience.
modules

Les Modules
de formation

Module1
Mise en route de HDINSIGHT

Qu’est ce que le Big Data
Introduction à Hadoop
Travailler avec la fonction MapReduce
Présentation de HDInsight

Module2
Déploiement de clusters HDINSIGHT

Identification des types de cluster HDInsight
Gérer les clusters HDInsight en utilisant le portail Azure
Gérer les clusters HDInsight en utilisant Azure PowerShell

Module3
Autoriser les utilisateurs à accéder aux ressources

Clusters non liés à un domaine
Configuration de clusters HDInsight connectés au domaine
Gestion des clusters HDInsight connectés au domaine

Module4
Chargement des données dans HDInsight

Stockage des données pour le traitement HDInsight
Utilisation des outils de chargement de données
Maximiser la valeur des données stockées

Module5
Dépannage de HDInsight

Analyse des logs HDInsight
logs YARN
Heap dumps (décharge)
Operations Management Suite

Module6
Implémentation de solutions batch

Stockage Apache Hive
Requêtes de données HDInsight utilisant Hive and Pig
Mise en oeuvre HDInsight

Module7
Concevoir des solutions batch etl pour le big data avec batch

Qu’est-ce que Spark ?
ETL avec Spark
Performance Spark

Module8
Analyser les données avec spark sql

Implémentation de requêtes itératives et interactives
Effectuer une analyse de données exploratoire

Module9
Analyser les données avec Hive et Phoenix

Mettre en place des requêtes interactives pour le Big Data avec Hive interactive
Effectuer une analyse de données exploratoire à l’aide de Hive
Effectuer un traitement interactif en utilisant Apache Phoenix

Module10
Stream Analytics

Analyse de flux
Processus de diffusion des données à partir de l’analyse des flux
Gestion des travaux d’analyse de flux

Module11
Mettre en oeuvre des solutions de streaming avec Kafka et Hbase

Construction et déploiement d’un cluster Kafka
Publication, consommation et traitement des données à l’aide du cluster Kafka
Utilisation de HBase pour stocker et requêter des données

Module12
Développer des solutions de traitement big data en temps réel avec Apache Storm

Persistance des données à long terme
Transmission des données avec Storm
Création de topologies Storm
Configuration d’Apache Storm

Module13
Créer des applications Spark streaming

Utilisation de Spark Streaming
Création d’applications Spark Streaming structurées
Persistance et visualisation

Module14
Validation et sanction de la formation

Une attestation mentionnant les objectifs, la nature et la durée de l’action et les résultats de l’évaluation des acquis de la formation sera remise au stagiaire à l’issue de sa formation

Module15
Moyens pédagogiques et techniques mis en œuvre

Lors des formations en présentiel, nous mettons à disposition tout le matériel de formation nécessaire :
1 PC et 1 support de cours par participant + 1 PC animateur + 1 vidéo projecteur + 1 paperboard.
Les postes sont équipés de l’environnement (logiciel et matériel) recommandé par les éditeurs.
Chaque poste est connecté à internet à notre serveur.
En amont de la formation,
un audit (entretien physique ou téléphonique) préalable nous permet de déterminer et fixer la meilleure approche pédagogique pour atteindre une qualité de formation optimale.
Chaque participant reçoit :
– Le programme de la journée et du module
– Un support de formation
– Un suivi de formation et des échanges entre le formateur et les participants sont proposés

Module16
Modalité d’évaluation des acquis

Durant la formation, le participant est amené à mettre en pratique les éléments du cours par la réalisation de travaux pratiques réalisés sur PC.
La validation des acquis du stagiaire est faite par le formateur à la fin de chaque atelier. Cette validation individuelle est possible du fait du faible nombre de participants par session de formation (6 personnes maximum).
A la fin de la formation, le stagiaire a donc atteint les objectifs fixés par la formation.

Une évaluation de fin de stage est également remplie par le stagiaire à la fin de la formation (évaluation de la formation, du formateur, du centre de formation)

Module17
Moyens permettant de suivre l’exécution de l’action

Le contrôle de la présence des stagiaires sera assuré par la vérification de l’assiduité des participants. Le stagiaire signera une feuille de présence par demi-journée de formation. Celle-ci sera également signée par le formateur

Les prochaines
sessions de formation

Sur demande
Vous souhaitez organiser cette formation à une date spécifique ?Contactez-nous en remplissant le formulaire ci-dessous
25 novembre 2024
27 janvier 2025
24 mars 2025
19 mai 2025

Cette formation vous intéresse ? Contactez-nous !

    Les données personnelles collectées sont destinées à Access IT Company et utilisées pour traiter votre demande et, lorsque vous ne vous y êtes pas opposé, vous communiquer nos offres commerciales. Les données obligatoires vous sont signalées sur le formulaire par un astérisque. L’accès aux données est strictement limité par Access IT Company aux collaborateurs en charge du traitement de votre demande. Conformément au Règlement européen n°2016/679/UE du 27 avril 2016 sur la protection des données personnelles et à la loi « informatique et libertés » du 6 janvier 1978 modifiée, vous bénéficiez d’un droit d’accès, de rectification, d’effacement, de portabilité et de limitation du traitement des donnés vous concernant ainsi que du droit de communiquer des directives sur le sort de vos données après votre mort. Vous avez également la possibilité de vous opposer au traitement des données vous concernant. Vous pouvez exercer vos droits en contactant le DPO à l’adresse suivante : [email protected] ou à l’adresse postale suivante 2, Allée Lavoisier, 59650 Villeneuve d’Ascq. Pour plus d’informations sur le traitement de vos données personnelles par Access IT Company, veuillez consulter notre politique de confidentialité disponible sur notre site internet à l’adresse suivante : https://formation.access-it.fr/politique-de-confidentialite/