2 L’analyse biographique des durées
2.1 Questions
On dispose de données dites “longitudinales”, et on cherche à appréhender l’occurence d’un évènement au sein d’une population. Les problématiques se basent sur les questions suivantes:
- Observe-t-on la survenue de l’évènement pour l’ensemble des individus?
- Quelle est la durée jusqu’à la survenue de l’évènement?
- Quels sont les facteurs qui favorisent la survenue de cet évènement? Facteurs fixes ou facteurs pouvant apparaitre/changer au cours de la période d’observation: variables dynamiques (TVC: Time Varying Covariate)
2.2 Terminologies
Français | Anglais |
---|---|
Analyse des durées | Duration analysis |
Analyse de survie/séjour | Survival analysis |
Analyse de fiabilité | Failure time data analysis |
Analyse des transitions | Event-history analysis |
2.3 Exemples d’analyse
Nuptialité, Mise en couple: cohabiter, décohabiter, se marier, Rompre une union …
Logement: Changement de statut (locataire <=> propriétaire), mobilité résidentielle/migration …
Emploi: Trouver un 1er emploi, changer d’emploi, entrée ou sortie du chômage …
Fécondité: Avoir un premier enfant, avoir un nouvel enfant …
Mortalité: Décéder après diagnostic, survivre après l’administration un traitement, rechute…
2.4 Elements nécessaire à l’analyse
Un processus temporel
- Une échelle de mesure ou métrique temporelle: minutes, heures, jours, mois, années….
- Une origine commune définissant un évènement de départ 1: naissance, mariage si on analyse la séparation, …..
- Une définition précise de l’évènement d’étude.
- Une durée entre le début et la fin de la période d’observation, si nécessaire avec la fin de la période d’exposition au risque. Cette sortie d’exposition devrait être également calculée à l’aide des informations de datation, ce qui n’est pas toujours le cas.
Une population soumise au risque de connaître l’évènement (Risk Set)
Des variables explicatives ou covariables
- Fixes: sexe/genre, génération, niveau de diplôme le plus élevé,…… Ce sont généralement des caractéristiques en début d’exposition.
- Dynamiques (TVC: Time varying covariates):
- Mesurées à tout moment entre le début et la sortie de l’observation: statut matrimonial, taille du ménage, statut d’activité…
- Pour les modèles,et à l’exception du semi-paramétrique de Cox, la durée ou une transformation de celle-ci, est une variable dynamique introduite comme variable indépendante pour assurer le bon ajustement des données. L’introduction directe d’une fonction de la durée comme variable dépendante seule ne peut se faire qu’en absence d’observation censurée, en particulier à droite. Il s’agit là d’une caractéristique propre aux modèles pleinement paramétriques: usuels basés sur une loi de distribution des évènements dans le temps (Weillbul, Gompertz…) ou les modèles dits à durée discrète (logit, probit…).
Attention, dans le cadre des données prospectives ou de suivi, cela ne peut pas être le moment de l’inclusion à la base données↩︎