Objectifs
Approfondir la connaissance de la détection d’anomalies dans un contexte de données numériques et/ou fonctionnelles à l’aide de méthodes principalement non-supervisées
Compétences visées
- Différencier une anomalie des valeurs influentes et extrêmes
- Comprendre l'intérêt de détecter les anomalies
- Mettre en œuvre les différentes méthodes statistiques pour la détection selon le contexte des données : méthodes univariées, méthodes multivariées basées sur un modèle probabiliste, sur la détermination d’un sous-espace ou sur la notion de proximité, méthodes pour des données fonctionnelles, méthodes pour des données en HDLSS
- Comprendre l'intérêt de détecter les anomalies
- Mettre en œuvre les différentes méthodes statistiques pour la détection selon le contexte des données : méthodes univariées, méthodes multivariées basées sur un modèle probabiliste, sur la détermination d’un sous-espace ou sur la notion de proximité, méthodes pour des données fonctionnelles, méthodes pour des données en HDLSS
Public
Data Scientists ou statisticiens, chercheurs, ingénieurs, ...
Pré-requis
Pour suivre ce stage dans de bonnes conditions, il est recommandé d'avoir suivi en amont les formations Statistique descriptive (exploratoire) : savoir décrire des observations et Statistique décisionnelle (inférentielle) : savoir décider au vu des observations ou d'avoir atteint par la pratique un niveau équivalent
Méthode pédagogique
Pédagogie active mêlant exposés, exercices et applications pratiques.
Chaque participant pourra mettre en oeuvre les applications dans le logiciel de son choix parmi JMP ou R.
Chaque participant pourra mettre en oeuvre les applications dans le logiciel de son choix parmi JMP ou R.
Programme
- Introduction
- Qu’est-ce qu’une anomalie ? une valeur influente ? une valeur extrême ?
- Les différentes motivations à la détection d’anomalies
- La notion de robustesse
- Les méthodes univariées
- La règle du k-sigma et test de Grubbs
- Règles du boxplot
- Tests en fonction de la distribution
- Les méthodes multivariées - généralités
- Les grandes approches dans la détection d’anomalies
- Évaluation des méthodes
- Caractéristiques souhaitées
- Métriques
- Contributeurs ou signature des défauts
- Les méthodes multivariées basées sur un modèle probabiliste
- T2 de Hotelling, la distance de Mahalanobis et sa version robuste
- Notion de profondeur et notion d’angles
- Les méthodes multivariées basées sur la détermination d’un sous-espace
- L’ACP et sa version robuste
- Les réseaux de neurones
- Les méthodes multivariées basées sur la notion de proximité
- La classification non supervisée
- Le LOF basé sur la densité
- Les méthodes pour des données fonctionnelles
- Introduction au contexte de données fonctionnelles
- L’analyse de données fonctionnelles
- Méthode de lissage
- Spline cubique
- Polynômes locaux
- Réduction de dimension
- Grandeurs statistiques (moyenne…)
- Décomposition en coefficients d’ondelettes
- Méthodes de détection d’anomalies dans un contexte univarié
- Méthodes de détection d’anomalies dans un contexte multivarié
- Les méthodes pour des données en HDLSS (grande dimension, faible taille d’échantillonnage)
- Présentation des challenges induits par ce contexte
- Les principales méthodes
Modalités d'évaluation
Un formulaire d'auto-évaluation proposé en amont de la formation nous permettra d'évaluer votre niveau et de recueillir vos attentes. Ce même formulaire soumis en aval de la formation fournira une appréciation de votre progression.
Des exercices pratiques seront proposés à la fin de chaque séquence pédagogique pour l'évaluation des acquis.
En fin de formation, vous serez amené(e) à renseigner un questionnaire d'évaluation à chaud.
Une attestation de formation vous sera adressée à l'issue de la session.
Trois mois après votre formation, vous recevrez par email un formulaire d'évaluation à froid sur l'utilisation des acquis de la formation.
Des exercices pratiques seront proposés à la fin de chaque séquence pédagogique pour l'évaluation des acquis.
En fin de formation, vous serez amené(e) à renseigner un questionnaire d'évaluation à chaud.
Une attestation de formation vous sera adressée à l'issue de la session.
Trois mois après votre formation, vous recevrez par email un formulaire d'évaluation à froid sur l'utilisation des acquis de la formation.
Solutions de financement
Cette formation peut être financée :
- dans le cadre du plan de développement des compétences de votre Entreprise
- par l’OPCO (opérateur de compétences) de votre Entreprise ou le FAF (Fonds d’Assurance Formation) pour les professionnels libéraux
- par France Travail dans le cadre du dispositif de l'Aide Individuelle à la Formation (soumis à accord de votre Agence)
- à titre personnel
Accessibilité
Vous souhaitez suivre notre formation Détection d’anomalies – Outlier Detection et êtes en situation de handicap ? Merci de nous contacter afin que nous puissions envisager les adaptations nécessaires et vous garantir de bonnes conditions d'apprentissage