03 20 61 95 06

Formation Les fondamentaux du Machine Learning


  • MLIB
  • Durée : 3 jours
  • Tarif : 1880 € HT

96%

Taux de satisfaction clients
(sur 1392 évaluations du 19/05/21 au 22/04/24)

Voir les avis

Objectifs

A l’issue de la formation, l’apprenant sera capable de :
Comprendre les différences entre apprentissage automatique supervisé, non supervisé et méta-apprentissage
Savoir transformer un gros volume de données à priori hétérogènes en informations utiles
Maîtriser l’utilisation d’algorithmes d’auto-apprentissage adaptés à une solution d’analyse
Comprendre comment exploiter de gros volumes de données textuelles
Être capable d’appliquer ces différentes techniques aux projets Big Data

Prérequis

Connaître l’utilité du Data Mining et les problématiques du Big Data dans le ciblage économique

Cette formation ne peut être financée que dans le cadre d’un projet d’entreprise (prise en charge entreprise ou OPCO). Les dossiers à financement personnel et CPF ne sont pas pris en compte.

Public

Ingénieurs, analystes, responsables marketing
Data Analysts, Data Scientists, Data Steward
Toute personne intéressée par les techniques de Data Mining et de Machine Learning

Dernière mise à jour

Programme mis à jour le 31 janvier 2024
enveloppe Cette formation vous intéresse ? Contactez-nous

Bon à savoir

Evaluez votre niveau

Pour vous aider à bien choisir votre formation, nous vous proposons soit un entretien avec le formateur soit un test d’évaluation. Cela vous assurera que vous disposez des connaissances nécessaires pour suivre la formation dans des conditions optimales.

Formations modulables

Toutes nos formations sont disponibles en présentiel comme en distanciel, en mode coaching individuel ou en groupe de 3 à 6 participants maximum.

Travaux pratiques

Nos formations comprennent de nombreux travaux pratiques pour un meilleur apprentissage (60 % de pratique). Nous proposons également de travailler sur vos données pour une meilleure expérience.
modules

Les Modules
de formation

Module1
L’APPRENTISSAGE MACHINE (INTRODUCTION)

Introduction
Champs de compétences
Focus Data Science (Data Mining)
Focus Machine Learning
Focus Big Data
Focus Deep Learning
Définition de l’apprentissage machine
Exemples de tâches du machine Learning
Que peuvent apprendre les machines
Les différents modes d’entraînement

Module2
LES FONDAMENTAUX DE L'APPRENTISSAGE MACHINE

Préambule : – Un problème d’optimisation – Quête de la capacité optimale du modèle – Relation capacité et erreurs – Un apport philosophique – Cadre statistique – Anatomie d’un modèle d’apprentissage machine
Jeux de données d’entraînement : – Cadre statistique – Les variables prédictives – Chaîne de traitement des variables prédictives – Les variables à prédire
Fonctions hypothèses : – Principe : jeux de fonctions hypothèses – Contexte de sélection des fonctions hypothèses – Caractéristiques des fonctions hypothèses – Modèles probabilistes Fréquentistes et Bayésiens
Fonctions de coûts : – Les estimateurs – Principe du maximum de vraisemblance (MLE*) – MAP – Maximum A Posteriori – Le biais d’un estimateur – La variance d’un estimateur – Le compromis biais – variance – Les fonctions de coûts – La régularisation des paramètres
Algorithmes d’optimisations : – Les grandes classes d’algorithmes d’optimisation – La descente de gradient (1er ordre) – Descente de gradient (détails) – Les approches de Newton (2nd ordre) – Optimisation batch et stochastique – Pour aller plus loin
Lab : Mise en oeuvre de l’environnement de travail machine Learning

Module3
LA CLASSIFICATION

Introduction : – Choisir un algorithme de classification
La régression logistique : – Du Perceptron à la régression logistique – Hypothèses du modèle – Apprentissage des poids du modèle – Exemple d’implémentation : scikit-learn – Régression logistique – Fiche Synthèse
SVM : – Classification à marge maximum – La notion de marge souple (soft margin) – Les machines à noyau (kernel machines) – L’astuce du noyau (kernel trick) – Les fonctions noyaux – SVM – Maths – SVM – Fiche Synthèse
Arbres de décision : – Principe de base – Fonctionnement – Maximisation du Gain Informationnel – Mesure d’impureté d’un noeud – Exemple d’implémentation : scikit-learn -Arbres de décision – Fiche Synthèse
K plus proches voisins (kNN) : – L’apprentissage à base d’exemples – Principe de fonctionnement – Avantages et désavantages – kNN – Fiche synthèse
Synthèse
Lab : Expérimentation des algorithmes de classification sur cas concrets

Module4
LES PRATIQUES

Prétraitement : – Gestion des données manquantes – Transformateurs et estimateurs – Le traitement des données catégorielles – Le partitionnement des jeux de données – Mise à l’échelle des données
Ingénierie des variables prédictives (Feature Engineering) : – Sélection des variables prédictives – Sélection induite par régularisation L1 – Sélection séquentielle des variables – Déterminer l’importance des variables – Réduction dimensionnelle par Compression des données – L’extraction de variables prédictives – Analyse en composante principale (ACP) – Analyse linéaire discriminante (ADL) – l’ACP à noyau (KPCA)
Réglages des hyper-paramètres et évaluation des modèles : – Bonnes pratiques – La notion de Pipeline – La validation croisée (cross validation) – Courbes d’apprentissage – Courbes de validation – La recherche par grille (grid search) – Validation croisée imbriquée (grid searchcv) – Métriques de performance
Synthèse
Lab : Expérimentation des pratiques du machine learning sur cas concrets

Module5
L’APPRENTISSAGE D’ENSEMBLES (ENSEMBLE LEARNING)

Introduction
L’approche par vote
Une variante : l’empilement (stacking)
Le bagging
Les forêts aléatoires
Le boosting
La variante Adaboost
Gradient Boosting
Fiches synthèses
Lab : L’apprentissage d’ensemble sur un cas concret

Module6
LA RÉGRESSION

Régression linéaire simple
Régression linéaire multi-variée
Relations entre les variables
Valeurs aberrantes (RANSAC)
Évaluation de la performance des modèles de régression
La régularisation des modèles de régression linéaire
Régression polynomiale
La régression avec les forêts aléatoires
Synthèse
Lab : La régression sur un cas concret

Module7
LE CLUSTERING

Introduction
Le regroupement d’objets par similarité avec les k-moyens (k-means)
k-means : algorithme
L’inertie d’un cluster
Variante k-means ++
Le clustering flou
Trouver le nombre optimal de clusters avec la méthode Elbow
Appréhender la qualité des clusters avec la méthode des silhouettes
Le clustering hiérarchique
Le clustering par mesure de densité DBSCAN
Autres approches du Clustering
Synthèse
Lab : Le clustering sur un cas concret

Module8
LES PLUS DE CETTE FORMATION

Une formation très pratique : 70% du temps de la formation est dédié à la mise en pratique pour une meilleure assimilation de notions de base.
Cette formation est basée sur des exercices principalement proposés par le formateur et tirés de l’ouvrage qui sert de support pour la formation.
Les travaux pratiques sont principalement réalisés avec R et Python.
Des consultants expérimentés partagent leur savoir-faire avec les participants.

Les prochaines
sessions de formation

Sur demande
Vous souhaitez organiser cette formation à une date spécifique ?Contactez-nous en remplissant le formulaire ci-dessous
29 avril 2024
24 juin 2024
26 août 2024
21 octobre 2024

Cette formation vous intéresse ? Contactez-nous !

    Les données personnelles collectées sont destinées à Access IT Company et utilisées pour traiter votre demande et, lorsque vous ne vous y êtes pas opposé, vous communiquer nos offres commerciales. Les données obligatoires vous sont signalées sur le formulaire par un astérisque. L’accès aux données est strictement limité par Access IT Company aux collaborateurs en charge du traitement de votre demande. Conformément au Règlement européen n°2016/679/UE du 27 avril 2016 sur la protection des données personnelles et à la loi « informatique et libertés » du 6 janvier 1978 modifiée, vous bénéficiez d’un droit d’accès, de rectification, d’effacement, de portabilité et de limitation du traitement des donnés vous concernant ainsi que du droit de communiquer des directives sur le sort de vos données après votre mort. Vous avez également la possibilité de vous opposer au traitement des données vous concernant. Vous pouvez exercer vos droits en contactant le DPO à l’adresse suivante : [email protected] ou à l’adresse postale suivante 2, Allée Lavoisier, 59650 Villeneuve d’Ascq. Pour plus d’informations sur le traitement de vos données personnelles par Access IT Company, veuillez consulter notre politique de confidentialité disponible sur notre site internet à l’adresse suivante : https://formation.access-it.fr/politique-de-confidentialite/