Produire des graphiques et recoder des variables sans écrire de code R

Addins
Graphique
Recodage
Auteur·rice
Affiliation

Bénédicte Garnier

Ined

Date de publication

10 juillet 2023

Résumé

Rstudio possède des Addins qui permettent d’exécuter des fonctions R de façon interactive. Le code généré peut être sauvegardé pour l’insérer dans ses scripts R. Nous illustrons notre propos ici avec les packages esquisse pour visualiser des données ou produire des graphiques simples et questionr pour recoder des variables.

Fonctions utilisées dans la fiche
Packages Fonctions
esquisse ggplot2
questionr irec

Dans cette fiche vous verrez comment utiliser des Addins associés à certains packages de R qui permettent de produire le code R de façon interactive pour :

Ces exemples s’inspire des fiches pédagogiques produites dans le cadre de l’école d’été du Collège International des Sciences Territoriales.

Le fichier utilisé ici contient 10% des individus de la table Ménages extraite de l’enquête DHS passée au Bénin en 2017 (vague 7).

Documentation:

Installation des packages

install.packages("esquisse")
install.packages("questionr")

Addins esquisse

Chargement du package et des données P3_Menages
library(esquisse)
load("datas/P3_Menages.RData")

On peut accéder à esquisse via le menu Addins de RStudio et en sélectionnant ggplot2 builder.

Ou directement par la console:

esquisser()

Chargement des données

Lorsque l’application est ouverte, on accède directement à la fenêtre de chargement des données. Ici, comme les données ont été chargée dans R, elles sont directement accessibles <\>environnement.

Sélection et visualisation de la table à l’aide de l’onglet View.

Sous le nom de chaque variable, on peut voir son type R : integer, factor, character.

On peut visualiser les modalités associées aux variables avec le bouton Data (en bas de la fenêtre).

Production d’un graphique

La fenêtre d’esquisse permet de choisir les données à représenter et propose un graphique adapté au type de la variable dans R. Ici une box-plot

On Sélectionne les variables par un glisser/déposer dans les zones correspondantes au paramétrage du graphique (x, y, fill, colors, size, … du package ggplot2).

Le rôle de ces options sont données en cliquant sur le bouton display settings qui se trouve en haut à droite de la fenêtre principale.

Pour en savoir plus sur les graphiques à produire en fonction des données à représenter, on peut se reporter au site de Y. Holtz From data to Viz.

Pour l’exemple, on va représenter le nombre de ménages par pays d’enquête hv000 avec un graphique en barres.

Si on souhaite modifier orienter les barres à l’horizontal (recommandé) on va dans l’onglet Plot options puis on coche Flip coordinate.

On utilise le bouton Plot options pour changer la disposition (ici barres horizontales).

On peut égalemet changer les titres du graphique dans l’onglet Ad Labels & Titles, et son apparence (couleurs, thème) dans l’onglet Appearance.

Exporter le code

L’onglet Code affiche le code généré par l’application. On peut le récupérer par simple copier/coller

Comme l’interface ne permet pas de modifier la couleur du contour des barres, on peut le faire en modifiant légèrement le script. Après avoir collé le code du graphique dans un script, on ajoute par exemple à la fonction geom_bar() l’option color="black"

library(ggplot2)
Warning: le package 'ggplot2' a été compilé avec la version R 4.3.2
ggplot(P3_Menages) +
  aes(x = hv000) +
  geom_bar(fill = "#FF6992", color="black") +
  labs(
    x = "Enquête",
    y = "Nombre de ménages",
    title = "Ménages par pays et vagues d'enquête",
    caption = "Source: DHS 2017"
  ) +
  coord_flip() +
  theme_light()

L’animation qui suit résume les différentes étapes (cliquer sur l’image pour la faire redémarrer au début et l’agrandir)

Addins de questionr

De la même façon, questionr permet de générer du code à partir du menu Tools/Addins de RStudio).

Préparation de l’environnement

# Appel du package questionr
library(questionr)
# Si besoin, on charge la table à visualiser (ici P3_Menages)
#load("datas/P3_Menages.RData")

On accède à la fenêtre de recodage en cliquant sur Levels recoding. Par exemple pour la variable Pays et vague de l’enquête (hv000). On peut modifier le nom et type de variable à générer (ici hv000_rec de type caractère).

On change l’intitulé des modalités (bouton Recodage).

On génère le code et on visualise le résultat (bouton Code et Résultat).

De la même façon, on peut changer l’ordre des modalités d’une variable en sélectionnant l’Addin Levels Ordering.