1  Présentation de Stata

1.1 Petit historique de Stata

L’entreprise Stata Corp Lp a été fondée par William Gould. Il est toujours à la tête de l’entreprise.

  • Première version (sous MS Dos) en janvier 1985.
  • Première version Windows en 1995 [Stata 4].
  • La version la plus récente est la 18 [avril 2023].
  • Le rythme de changement de version est de 2 ans. Attention tout de même, il s’agit plutôt de grosses mises à jour, dont l’acquisition systématique est dispensable.
Versions 18 et 17

Version 18

  • Une autosave des programmes (enfin)
  • Nouveau format .dtas pour enregistrer une liste de frames générées dans un programme.
  • Graphiques:
    • Nouvelle palette qualitative et nouveau thème par défaut (enfin). Vous trouverez une courte présentation et quelques visuels ici [[Lien][https://mthevenin.github.io/stata_fr/articles/index/posts/palette_style/palette_style.html]]
    • Une nouvelle option colorvar (cf fill, color dans R ou python) qui permet d’empiler automatiquement ou presque plusieurs objets graphiques (autrefois un objet par valeur dans une expression conditionnelle.
  • Non testé: une commande dtable pour générer et exporter des tableaux de statistiques descriptives.

On peut consulter la liste des mises à jour sur le site officiel: [Lien]

Version 17

Une rapide présentation a été faite il y a plus d’un an [Lien].

En résumé pour la version 17:

  • Amélioration de la vitesse d’exécution (je confirme)
  • Suite collect pour générer des outputs des commandes statistiques et exportables dans plusieurs formats (.doc, .xlsx, .tex, .html, .md). Rapidement testé pour des régressions, c’est plutôt pas mal même si, comme d’habitude avec Stata qui se raccroche aux branche, cela peut vite tourner à l’usine à gaz [rapide présentation]

Mise à jour d’une version

Régulièrement Stata corrige des bugs ou autres erreurs. On peut obtenir la liste des mises à jour en tapant dans la fenêtre de commande update query.


Update status
    Last check for updates:  30 Aug 2023
    New update available:    13 Jul 2023  (what's new)
    Current update level:    15 May 2023  (what's new)


Possible actions

    Install available updates             (or type -update all-)

1.1.1 A l’Ined

Pour réaliser la mise à jour, vous devrez vous mettre sur votre compte administrateur (adm_nom). Si vous le connaissez pas le nom de votre compte administrateur et/ou le mot de passe, contacter le service informatique.

1.2 Versions Stata à l’Ined

  • Version 18 Window SE est normalement en cours de déploiement. La version 17 Windows SE a été déployée au printemps 2022.
  • Version 17 SE sous Linux (serveur margaux).

Petit rappel pour l’Ined pour Sas et Stata: Quel que soit le logiciel choisi sous environnement Windows (SAS v9.4 ou Stata) vous avez accès à une version de l’autre application sous Linux via le serveur Margaux (SAS Studio ou STATA v17 SE).

Version SE: Standard Edition

  • Nombre d’observations: 2.14 milliards
  • Nombre de variables dans les bases: 32 767
  • Nombre de variables RHS (limite nombre de colonnes des matrices: 10998)

Il existe également des versions dites MP (Multiple Process), dont la plus puissante gère 120000 variables et 20 milliards d’observations).

1.3 Les ressources

1.3.1 Les ressources externes

  • Les manuels édités par STATA. Certains, anciennement à la bibliothèque de l’Ined, sont disponibles au GED [http://www.stata.com/bookstore/books-on-stata]

  • *Stata Journal, la revue trimestrielle éditée par Stata [http://www.stata-journal.com]. Depuis 2015 accès total aux versions PDF (via portail GED maintenant). L’accès et le sommaire des 4 derniers numéro est disponible ici: Lien

  • Une chaîne Youtube [http://www.youtube.com/user/statacorp/videos?view=0] qui propose des tutoriels via les manipulations par les boites de dialogue.

  • Un forum particulièrement actif (https://www.statalist.org/)

1.3.2 Les ressources internes

  • Le manuel de Stata est directement intégré au logiciel. Pour y accéder à partir du menu : help => PDF documentation. Il est vraiment de très bonne qualité et reconnu comme tel.

  • Pour une instruction, on peut obtenir son aide en tapant dans la fenêtre command de l’environnement principal help nom_commande.

    • Pour les commandes internes, un lien permet d’accéder à l’entrée du manuel officiel.
    • Dans les fenêtres de dialogue, on peut accéder directement au fichier d’aide en cliquant sur le point d’interrogation.
Utiliser l'aide interne
help generate

L’animation suivante n’est bien évidemment pas disponible en format pdf

L’aide comprend généralement:

  • Le nom de la commande

  • Le lien vers l’entrée du manuel si commande officielle. Pour les commandes externes, un lien vers le site support peut-être proposé.

  • La description de la syntaxe

  • Le détail des options

  • Des exemples avec éventuellement une exécution directe (voir avec help tw)

  • Les informations sauvegardées temporairement (jusqu’à l’exécution d’une autre commande) => stored results. C’est informations peuvent être des valeurs, des matrices, qui pourront être réutilisés dans la suite d’un programme (voir le chapitre sur la syntaxe).

  • L’instruction findit nom_command permet d’obtenir la liste de toutes les ressources disponibles d’une commande, internes ou externes. Exemple: findit fitstat

Warning: compatibilité entre les versions

Des problèmes de compatibilité entre les versions de Stata se sont posés. Cela affecte la lecture des bases entre les différentes versions du logiciel. Le dernier cas en date est maintenant assez ancien (version 14).

Version 14: refonte total du système d’encodage vers le standard UTF8.
Les versions inférieures de Stata ne peuvent pas ouvrir les bases au format actuel, qui doivent être enregistrées avec une commande particulière (saveold) sous Stata 14 à 17. Les accents ne sont pas lu après cette conversion, et ce qui nécessite d’exécuter un programme pour les convertir (au secours!!!!).
A l’Ined, depuis le déploiement de la version 14 et le passage à la version 15 Linux, il n’y a plus de problème.

On peut également regréter que Stata n’offre pas un certain niveau de rétrocompatibilité avec, au moins avec la version précédente. Par exemple la nouvelle palette de couleurs et le nouveau thème pour les graphiques par défaut, aurait pu être proposés comme maj aux versions 16 ou 17.

1.4 Les users packages

Stata fonctionne avec un système hybride de commandes officielles ou usines et de commandes externes (idem R, Python…).
Commandes externes ou user package:

  • Il s’agit d’instructions créees par les utilisateurs

  • Ces instructions couvrent le data management et l’analyse statistique (descriptive, modélisation, graphiques)

  • Même syntaxe que les instructions officielles

  • La liste (triée par année) de ces instructions se trouve à cette adresse [http://ideas.repec.org/s/boc/bocode.html]. Elle n’est pas exhaustive, seulement celles sur le dépôt de Stata. Les dépôts dans les gits, en particulier Github tendent à se développer. Tout comme R, les dépôts usines ne sont pas forcément les plus à jour.

Installation directe d’une commande externe
Pour télécharger un package, on peut utiliser la ligne de commande:

Installation d'une commande
ssc install nom_commande, replace
  • Il est possible d’installer un package après avoir consulté les fichiers avec la commande findit.
  • On peut également consulter le fichier d’aide de lacommande avant de l’installer.

Les programmes des packages externes se trouvent dans un répertoire spécifique plus/ado, souvent installé dans la racine du lecteur C:. On peut déplacer ce répertoire, et c’est conseillé si on dispose, comme à l’Ined, d’une sauvergarde régulière sur un autre lecteur via un serveur. On peut vérifier la localisation de ce répertoire avec la commande sysdir, et plus généralement la localisation des répertoires d’utilisation de Stata.

sysdir
   STATA:  C:\PROGRA~1\Stata17\
    BASE:  C:\PROGRA~1\Stata17\ado\base\
    SITE:  C:\PROGRA~1\Stata17\ado\site\
    PLUS:  D:\D\ado\plus\
PERSONAL:  D:\D\ado\personal\
OLDPLACE:  c:\ado\

Exercice

Ouvrir la base d’exemple auto
Dans la fenêtre Command: sysuse auto, clear

  • [1] Accéder à l’aide (pdf) de l’instruction tabulate. Faire un tableau croisé entre la variable foreign et rep78.
  • [2] Installer le package externe findname, exécuter findname t* et chercher les variables de type chaine de caractère (string).
profile.do

Attention: Avec la version 18, la technique permettant avec un profile.do de récupérer une sauvegarde d’un programme n’a plus aucune utilité, Stata ayant (enfin) une autosave des programmes.

Pour en savoir plus sur le paramétrage des sessions avec un fichier profile.do [Lien]