A l’issue de la formation le participant sera capable de :
Savoir utiliser les principaux outils de traitement et d’analyse de données pour Python
Extraire des données d’un fichier et les manipuler
Apprendre à mettre en place un modèle d’apprentissage simple
- BDD & Décisionnel
- Python
Formation Big Data – Python pour l’analyse de données
Objectifs
Prérequis
Maîtrise de la programmation Python
Un entretien en amont avec notre expert permet de prendre en compte le profil de chaque participant (niveau, objectifs et résultats attendus, contexte professionnel, enjeux…)
Cette formation ne peut être financée que dans le cadre d’un projet d’entreprise (prise en charge entreprise ou OPCO). Les dossiers à financement personnel et CPF ne sont pas pris en compte.
Public
Développeurs en Python
Formation(s) associée(s)
Dernière mise à jour
Bon à savoir
Evaluez votre niveau
Formations modulables
Travaux pratiques
Les Modules
de formation
Besoins des data-scientist : calculs, analyse d’images, machine learning, interface avec les bases de données
Apports de python : grande variété d’outils, expertise dans le domaine du calcul scientifique
Tour d’horizon des outils : pandas, agate, bokeh, scikit-learn, pybrain, tensorflow, keras, mxnet, caffe
NumPy : Base du calcul sur des tableaux
SciPy : Scientific Tools for Python, couche scientifique
Manipulation de tableaux, fonctions mathématiques
Représentation graphique avec basemap et matplotlib
Mise en oeuvre de SciPy/NumPy : manipulation d’images, détection de contours
NumPy : Base du calcul sur des tableaux
SciPy : Scientific Tools for Python, couche scientifique
Manipulation de tableaux, fonctions mathématiques
Représentation graphique avec basemap et matplotlib
Mise en oeuvre de SciPy/NumPy : manipulation d’images, détection de contours
Pandas : manipulation de tables de données
Tableaux avec Pandas : indexation, opérations, algèbre relationnelle
Stockage dans des fichiers : CSV, h5py, netCDF
Comparaison et performances Pandas / NumPy
Présentation de TensorFlow, scikit-learn, keras, mxnet, caffe
TensorFlow : principe de fonctionnement, plates-formes supportées, distribution, APIs fournies en standard, modèles d’apprentissage
Projet scikit-learn : classification, régression, validation de modèles prédictifs
Démonstrations avec les modèles fournis par scikit-learn
Positionnement et comparaison avec Keras, mxnet, caffe