Objectifs
Apprendre à réécrire sous R un programme SAS faisant appel à des étapes de manipulation, de traitement, d'analyse et de visualisation de données
Compétences visées
- Comprendre les principales différences et similitudes entre SAS et R
- Découvrir les principales fonctions R natives et celles des packages incontournables pour le traitement et l'analyse de données
- Transformer un code SAS en R
- Découvrir les principales fonctions R natives et celles des packages incontournables pour le traitement et l'analyse de données
- Transformer un code SAS en R
Public
Toute personne souhaitant utiliser le logiciel R et connaissant déjà SAS.
Pré-requis
Connaissance du langage SAS
Méthode pédagogique
Pédagogie active mêlant exposés, applications pratiques dans le logiciel R et exemples de code SAS à transposer.
Programme
- Introduction
- Présentation de R et son interface R Studio
- Spécificités de l'approche R (par rapport à SAS)
- Spécificités de la syntaxe R (par rapport à SAS)
- Manipulations de base sous R
- Généralités sur le langage R "historique"
- Installation et chargement de packages
- Types de données sous R
- Importer des fichiers sous R (textes bruts, Excel, dataset SAS)
- Récupérer les caractéristiques d'un objet (équivalent procédure CONTENTS)
- Calculer des indicateurs statistiques, et comparaison par rapport aux procédures type MEANS / FREQ de SAS
- Pratique : importer un fichier SAS depuis R, le décrire et calculer des statistiques descriptives
- Traitement de données sous R
- Le dataframe et ses manipulations courantes : équivalent sous R des dataset SAS
- Package dyplr : manipuler les données dans une logique similaire à celle des étapes data / proc SQL
- Autres packages du tidyverse : manipulations sur les dates, facteurs, chaînes de caractère, transpositions de données
- Pratique : manipuler sous R un fichier de données
- Visualisations
- Présentation succincte des fonctions natives de visualisation sous R
- Package ggplot2 : principes, syntaxe et comparaison par rapport aux procédures GPLOT et SGPLOT
- Pratique : produire sous R différentes visualisations graphiques
- Analyse de données et machine learning
- Tests statistiques et ACP : mise en œuvre sous R et interprétation des sorties
- Régression linéaire : comparaison des approches et sorties de R par rapport à SAS (proc REG)
- Introduction rapide au machine learning sous R
- Pratique : mettre en œuvre une régression et / ou une ACP sous R et comparer les sorties obtenues avec celles de SAS
- Aperçu des possibilités de R avec des packages additionnels
- Packages SQL : pour rester dans la syntaxe d'une proc SQL
- Markdown : pour générer des fichiers de sortie html / pdf dans la logique des sorties ODS de SAS
- Shiny et/ou plotly : pour aller plus loin dans la visualisation interactive
- Caret : pour aller plus loin dans le machine learning
- Pratique : avoir un aperçu concret de ce que permettent ces packages à partir d'exemples déjà fournis
- Programmation sous R
- Boucles et conditions sous R
- Fonctions sous R : une alternative au macro langage de SAS
- Fonctions de type apply : une autre alternative au macro langage
- Pratique : transposer une macro SAS existante en un traitement automatisé sous R
- Cas pratique récapitulatif : transposer un code SAS en R
- Réécrire sous R un programme SAS constitué de plusieurs étapes data, de macros / macro-variables et de procédures de visualisations
- Etudier les différentes alternatives possibles sous R
- Conclusion
- Forces et faiblesses de R par rapport à SAS
- Récapitulatif des équivalents R sur les principales procédures SAS
- Bonnes pratiques à acquérir et pratiques issues de SAS à bannir
Modalités d'évaluation
Un formulaire d'auto-évaluation proposé en amont de la formation nous permettra d'évaluer votre niveau et de recueillir vos attentes. Ce même formulaire soumis en aval de la formation fournira une appréciation de votre progression.
Des exercices pratiques seront proposés à la fin de chaque séquence pédagogique pour l'évaluation des acquis.
En fin de formation, vous serez amené(e) à renseigner un questionnaire d'évaluation à chaud.
Une attestation de formation vous sera adressée à l'issue de la session.
Trois mois après votre formation, vous recevrez par email un formulaire d'évaluation à froid sur l'utilisation des acquis de la formation.
Des exercices pratiques seront proposés à la fin de chaque séquence pédagogique pour l'évaluation des acquis.
En fin de formation, vous serez amené(e) à renseigner un questionnaire d'évaluation à chaud.
Une attestation de formation vous sera adressée à l'issue de la session.
Trois mois après votre formation, vous recevrez par email un formulaire d'évaluation à froid sur l'utilisation des acquis de la formation.
Solutions de financement
Cette formation peut être financée :
- dans le cadre du plan de développement des compétences de votre Entreprise
- par l’OPCO (opérateur de compétences) de votre Entreprise ou le FAF (Fonds d’Assurance Formation) pour les professionnels libéraux
- par France Travail dans le cadre du dispositif de l'Aide Individuelle à la Formation (soumis à accord de votre Agence)
- à titre personnel
Accessibilité
Vous souhaitez suivre notre formation R pour les utilisateurs SAS et êtes en situation de handicap ? Merci de nous contacter afin que nous puissions envisager les adaptations nécessaires et vous garantir de bonnes conditions d'apprentissage
Ce que pensent nos clients de la formation R pour les utilisateurs SAS
M. Mikael L., Responsable pilotage au sein du DataLab de Gan Assurances
Très bonne formation, très intéressante et personnalisée à nos besoins.
Mme Missie F., Data Manager au sein du DataLab de Gan Assurances
La formation était de très bonne qualité, le formateur était très pédagogue et à l'écoute de la moindre préoccupation des participants. J'ai beaucoup appris pendant cette formation, je peux dire que mon objectif est atteint, reste à mettre toutes ces notions en pratique