Objectifs
Apprendre à utiliser le logiciel R pour analyser des données.
Mettre en oeuvre dans R les méthodes de statistique descriptive, décisionnelle, analyse de la variance, régression linéaire et analyse de données multidimensionnelles.
Mettre en oeuvre dans R les méthodes de statistique descriptive, décisionnelle, analyse de la variance, régression linéaire et analyse de données multidimensionnelles.
Compétences visées
- Importer, manipuler et analyser des données dans R
- Effectuer des analyses statistiques univariées
- Établir avec R des intervalles de confiance autour de paramètres comme moyenne, proportion et variance
- Réaliser les principaux tests d'hypothèses paramétriques et non paramétriques dans le logiciel
- Étudier numériquement et graphiquement la liaison entre 2 variables quantitatives, qualitatives ou de chaque nature
- Mettre en œuvre des analyses de la variance à un ou plusieurs facteurs pour la comparaison de moyennes de population
- Élaborer un modèle établissant une relation linéaire entre une variable à expliquer et une (régression simple) ou plusieurs (régression multiple) variables explicatives.
- Découvrir les principales méthodes d'analyse multidimensionnelle des données à l'aide du package FactoMineR
- Effectuer des analyses statistiques univariées
- Établir avec R des intervalles de confiance autour de paramètres comme moyenne, proportion et variance
- Réaliser les principaux tests d'hypothèses paramétriques et non paramétriques dans le logiciel
- Étudier numériquement et graphiquement la liaison entre 2 variables quantitatives, qualitatives ou de chaque nature
- Mettre en œuvre des analyses de la variance à un ou plusieurs facteurs pour la comparaison de moyennes de population
- Élaborer un modèle établissant une relation linéaire entre une variable à expliquer et une (régression simple) ou plusieurs (régression multiple) variables explicatives.
- Découvrir les principales méthodes d'analyse multidimensionnelle des données à l'aide du package FactoMineR
Public
Toute personne souhaitant analyser des données avec R
Pré-requis
Pour suivre ce stage dans de bonnes conditions, il est recommandé d'avoir suivi en amont la formation R – Prise en main, analyses statistiques et graphiques ou d'avoir atteint par la pratique un niveau équivalent
Méthode pédagogique
Pédagogie active mêlant exposés, exercices et applications pratiques dans le logiciel R.
Programme
- Statistiques descriptives
- Gestion d’un jeu de données - dataframe
Importation, caractérisation, sélection, sous-ensembles - Premières analyses d’un jeu de données
Premières vérifications, valeurs manquantes, recodage - Résumé d’une variable quantitative – numeric
Indicateurs numériques, représentations graphiques - Résumé d’une variable qualitative – factor
Indicateurs numériques, représentations graphiques
- Intervalle de confiance
- Le raisonnement à partir d’un échantillon
Généralités, échantillonnage, estimation d’un paramètre - Intervalle de confiance d’une moyenne
- Intervalle de confiance d’une proportion
- Intervalle de confiance d’une variance
- Tests d’hypothèses
- Qu’est-ce qu’un test d’hypothèse ?
Généralités, règle de décision, risques d’erreur, puissance - Les tests de conformité ou de comparaison à une norme
Conformité d’une moyenne, d’une proportion - Les tests de comparaison de deux populations
Comparaison de deux moyennes, de deux proportions - Test d’ajustement à une loi de probabilité normale
Le test de Shapiro-Wilk - Introduction aux tests non paramétriques
Test de Wilcoxon, Mann et Whitney, Kruskal Wallis, Friedman
- Liaisons entre deux variables
- Liaison entre deux variables quantitatives
Nuage de points, intensité de la liaison, significativité - Liaison entre deux variables qualitatives
Tableau de contingence, intensité et significativité du lien de dépendance : test du khi2 - Liaison entre une variable qualitative et quantitative
Comparaison de plusieurs populations, le rapport de corrélation - Liaisons entre plusieurs variables
Approches graphiques : matrice de nuages de points, treillis
Caractériser des sous-populations par plusieurs variables
- L’analyse de la variance – Anova
- Analyse de la variance à un facteur
Variabilité inter, intra, totale – Rapport de corrélation - Le test de Fisher - Comparaisons multiples de moyennes
Analyses post hoc, la procédure de Tukey - Analyse de la variance à deux facteurs et interaction
- Extensions de l’Anova
Modèle à effet fixe ou aléatoire, modèle hiérarchisé
- Régression linéaire simple et multiple
- De la corrélation à la régression
L’intérêt d’un modèle - Variables à expliquer, explicatives, erreur - La régression linéaire simple
Ajustement par la méthode des moindres carrés - Tests et validation du modèle - La régression linéaire multiple
- Choix d’un modèle de régression
Pourquoi sélectionner un sous-ensemble de variables explicatives ?
Les différentes approches et critères de sélection d’un modèle
- Analyse de données multidimensionnelles
- Un panorama des méthodes multidimensionnelles
Analyses factorielles, classification – Le package FactoMineR - ACP : Analyse en Composantes principales
- AFC : Analyse Factorielle des Correspondances
- ACM : Analyse des correspondances Multiples
- CAH : Classification Ascendante Hiérarchique
Modalités d'évaluation
Un formulaire d'auto-évaluation proposé en amont de la formation nous permettra d'évaluer votre niveau et de recueillir vos attentes. Ce même formulaire soumis en aval de la formation fournira une appréciation de votre progression.
Des exercices pratiques seront proposés à la fin de chaque séquence pédagogique pour l'évaluation des acquis.
En fin de formation, vous serez amené(e) à renseigner un questionnaire d'évaluation à chaud.
Une attestation de formation vous sera adressée à l'issue de la session.
Trois mois après votre formation, vous recevrez par email un formulaire d'évaluation à froid sur l'utilisation des acquis de la formation.
Des exercices pratiques seront proposés à la fin de chaque séquence pédagogique pour l'évaluation des acquis.
En fin de formation, vous serez amené(e) à renseigner un questionnaire d'évaluation à chaud.
Une attestation de formation vous sera adressée à l'issue de la session.
Trois mois après votre formation, vous recevrez par email un formulaire d'évaluation à froid sur l'utilisation des acquis de la formation.
Solutions de financement
Cette formation peut être financée :
- dans le cadre du plan de développement des compétences de votre Entreprise
- par l’OPCO (opérateur de compétences) de votre Entreprise ou le FAF (Fonds d’Assurance Formation) pour les professionnels libéraux
- par France Travail dans le cadre du dispositif de l'Aide Individuelle à la Formation (soumis à accord de votre Agence)
- à titre personnel
Accessibilité
Vous souhaitez suivre notre formation Réaliser ses analyses statistiques avec R et êtes en situation de handicap ? Merci de nous contacter afin que nous puissions envisager les adaptations nécessaires et vous garantir de bonnes conditions d'apprentissage
Ce que pensent nos clients de la formation Réaliser ses analyses statistiques avec R
Mme Clara M., Ingénieur Agronome R&D chez Elicit Plant
Formation très claire et très équilibrée entre apport théoriques et mise en pratique sur des cas concrets.
Mme Julie G, Data Analyst chez Engie Entreprises et Collectivités
Excellente formation : claire et concrète, sans se perdre dans la théorie. On se sent tout de suite en capacité d'utiliser les acquis. Un grand merci au formateur pour sa pédagogie et de s'être adapté aux besoins de chacun !
Mme Audrey F., Research manager Coffee & Cocoa chez Nestlé Research
La formation a répondu parfaitement à mes attentes. La formatrice a su s'adapter à mes besoins et à mon rythme avec une très bonne pédagogie. Un grand merci à elle.
M. Vincent D, économiste chez Business France
Formatrice de très bon niveau et très à l'écoute. Elle m'a permis de lever certains verrous sur l'utilisation de R, un déblocage très utile pour mener mes explorations de données plus sereinement.