2  L’analyse biographique des durées

2.1 Questions

On dispose de données dites “longitudinales”, et on cherche à appréhender l’occurence d’un évènement au sein d’une population. Les problématiques se basent sur les questions suivantes:

  • Observe-t-on la survenue de l’évènement pour l’ensemble des individus?
  • Quelle est la durée jusqu’à la survenue de l’évènement?
  • Quels sont les facteurs qui favorisent la survenue de cet évènement? Facteurs fixes ou facteurs pouvant apparaitre/changer au cours de la période d’observation: variables dynamiques (TVC: Time Varying Covariate)

2.2 Terminologies

Français Anglais
Analyse des durées Duration analysis
Analyse de survie/séjour Survival analysis
Analyse de fiabilité Failure time data analysis
Analyse des transitions Event-history analysis

2.3 Exemples d’analyse

  • Nuptialité, Mise en couple: cohabiter, décohabiter, se marier, Rompre une union …

  • Logement: Changement de statut (locataire <=> propriétaire), mobilité résidentielle/migration …

  • Emploi: Trouver un 1er emploi, changer d’emploi, entrée ou sortie du chômage …

  • Fécondité: Avoir un premier enfant, avoir un nouvel enfant …

  • Mortalité: Décéder après diagnostic, survivre après l’administration un traitement, rechute…

2.4 Elements nécessaire à l’analyse

  1. Un processus temporel

    • Une échelle de mesure ou métrique temporelle: minutes, heures, jours, mois, années….
    • Une origine commune définissant un évènement de départ 1: naissance, mariage si on analyse la séparation, …..
    • Une définition précise de l’évènement d’étude.
    • Une durée entre le début et la fin de la période d’observation, si nécessaire avec la fin de la période d’exposition au risque. Cette sortie d’exposition devrait être également calculée à l’aide des informations de datation, ce qui n’est pas toujours le cas.
  2. Une population soumise au risque de connaître l’évènement (Risk Set)

  3. Des variables explicatives ou covariables

    • Fixes: sexe/genre, génération, niveau de diplôme le plus élevé,…… Ce sont généralement des caractéristiques en début d’exposition.
    • Dynamiques (TVC: Time varying covariates):
      • Mesurées à tout moment entre le début et la sortie de l’observation: statut matrimonial, taille du ménage, statut d’activité…
      • Pour les modèles,et à l’exception du semi-paramétrique de Cox, la durée ou une transformation de celle-ci, est une variable dynamique introduite comme variable indépendante pour assurer le bon ajustement des données. L’introduction directe d’une fonction de la durée comme variable dépendante seule ne peut se faire qu’en absence d’observation censurée, en particulier à droite. Il s’agit là d’une caractéristique propre aux modèles pleinement paramétriques: usuels basés sur une loi de distribution des évènements dans le temps (Weillbul, Gompertz…) ou les modèles dits à durée discrète (logit, probit…).

  1. Attention, dans le cadre des données prospectives ou de suivi, cela ne peut pas être le moment de l’inclusion à la base données↩︎