Introduction à l’analyse biographique des durées

Support de formation 2023

Auteur·rice

Marc Thévenin

Date de publication

26 décembre 2023

1 Présentation - Bibliographie - Outils

Le support

Ce document est utilisé comme support de formation, principalement pour des formations internes à l’Ined, des formations dans le cadre d’HED, et le cours de master 2 de démographie de l’Université de Strasbourg. En terme de contenu il reste classique, il s’agit d’une introduction, même si certaines nouveautés méthodologiques (pas si récentes non plus) sont présentées comme l’estimation des RMST1. Une méthode modélisation reposant des pseudo-observations2 est en cours d’évaluation, et devrait être introduite dans le support en 20243

Pour cette version 2023, le principal ajout concerne un chapitre sur les manipulations des données biographiques [Lien]. C’est un premier jet, il ne peut pas être exhaustif ou représentatif de toutes les manipulations auxquelles on pourrait être confrontées.

Sur la forme, le support a été passé en format ouvrage (sans en avoir l’ambition je précise) et une version pdf peut-être directement téléchargée. Il est identique à la version html, sauf pour le chapitre programmation ou seulement les éléments relatifs à R sont inclus.

Un petit mot sur l’application présente dans le support. Issu du champ de la médecine (essai clinique), soit l’analyse de la survie de personnes souffrant d’une insuffisance cardiaque, elle pourrait décevoir vu son éloignement avec des problématiques issues des sciences sociales. Cependant, cette base d’analyse permet de couvrir avec peu d’informations, la quasi totalité des points traités dans ce support. Je l’admets qu’il serait préférable de trouver un jour autre chose, ou de donner par exemple en annexe, quelques exemples d’applications plus proches des sciences sociales.
Néanmoins pour les personnes participant à la formation, les jeux de données sont bien issus des sciences sociales.

Il ne s’agit pas d’un support validé institutionnellement. J’assume seul et totalement les partis pris ou erreurs conceptuelles. J’en profite également pour remercier, quelques soient leur statut, l’ensemble des personnes ayant fait appel à mon assistance sur ce domaine d’analyse, ainsi que l’ensembe les participant.e.s aux formations et cours. Par leurs remarques, les problématiques traitées, ils me permettent de réviser et mettre à jour régulièrement ce document. Enfin, je remercie plus particulierement Eva Lelièvre et Arnaud Bringé pour l’ensemble du savoir qu’ils m’ont transmis.

Bibliographie

Les éléments bibliographiques qui figurent ci-dessous proviennent du champ des sciences sociales. Elle est volontairement courte, mais efficace. Quelle que soit la langue, le nombre de cours ou support sont très nombreux en médecine, qui est ici l’espace privilégié de l’ingénierie méthodologique. On trouve également de (trop) nombreux tutoriels généraliste à dominante mise en pratique avec R, dont je ne conseille pas forcément l’utilisation.

Accès en ligne

  • Cours Gilbert Colletaz (Université d’Orléans - Master d’économétrie).
    • Le cours est mis à jour tous les ans, applications uniquement avec Sas.
    • Dernière version 2020: lien
  • Document de travail de Simon Quantin (Insee).
    • Couvre l’ensemble des techniques de base d’analyse des durées en durée dite continue. Il propose surement la meilleure introduction en langue française à la problématique de la fragilité, qui sera ici seulement présenté trop brièvement.
    • Application en R seulement (Attention au passage de la v3 du package survival)
    • 2019 - pas de mise à jour: lien
  • Les notes de cours de German Rodriguez (en)
    • Démographe à l’université de Princeton.
    • Les dernières mises à jour doivent dater de 2017-2018: lien

Ouvrage de référence en démographie:

  • L’analyse démographique des biographies de Daniel Courgeau et Eva Lelièvre (Edition de l’Ined - 1989). Malheureusement cet ouvrage ne dispose pas de version epub ou pdf disponible en ligne 4.

Outils


  1. Restricted Mean of Survival Time↩︎

  2. Résidus du Jackknife↩︎

  3. Très intéressante comme technique de modélisation des RMST et pour palier à certaines contraintes des modèles à risques proportionnels, on peut déjà dire que sa généralisation sera compliquée dans le domaine des sciences sociales en raison de l’hypothèse d’indépendance des covariables avec la censure.↩︎

  4. Pour les résident.e.s du campus Condorcet, l’ouvrage est disponible au GED [lien]↩︎