2 L’analyse biographique des durées
2.1 Questions
On dispose de données dites “longitudinales”, et on cherche à appréhender l’occurence d’un évènement au sein d’une population. Les problématiques se basent sur les questions suivantes:
- Observe-t-on la survenue de l’évènement pour l’ensemble des individus?
- Quelle est la durée jusqu’à la survenue de l’évènement?
- Quels sont les facteurs qui favorisent la survenue de cet évènement? Facteurs fixes ou facteurs pouvant apparaitre/changer au cours de la période d’observation: variables dynamiques (TVC: Time Varying Covariate)
2.2 Terminologies
Français | Anglais |
---|---|
Analyse des durées | Duration analysis |
Analyse de survie/séjour | Survival analysis |
Analyse de fiabilité | Failure time data analysis |
Analyse des transitions | Event-history analysis |
Pour ce support, le choix de son titre me pose toujours problème pour éviter qu’il soit trop à rallonge. Si j’avais à trancher, il devrait un peu s’éterniser sous l’appelation Introduction à l’analyse biographique des durées en présence de données censurée (à droite1).
2.3 Exemples d’analyse
Nuptialité, Mise en couple: cohabiter, décohabiter, se marier, Rompre une union …
Logement: Changement de statut (locataire <=> propriétaire), mobilité résidentielle/migration …
Emploi: Trouver un 1er emploi, changer d’emploi, entrée ou sortie du chômage …
Fécondité: Avoir un premier enfant, avoir un nouvel enfant …
Mortalité: Décéder après diagnostic, survivre après l’administration un traitement, rechute…
2.4 Elements nécessaire à l’analyse
Un processus temporel
- Une échelle de mesure ou métrique temporelle: minutes, heures, jours, mois, années….
- Une origine commune définissant un évènement de départ 2: naissance, mariage si on analyse la séparation, …..
- Une définition précise de l’évènement d’étude.
- Une durée entre le début et la fin de la période d’observation, si nécessaire avec la fin de la période d’exposition au risque. Cette durée doit être généralement calculée à l’aide des informations de datation.
Une population soumise au risque de connaître l’évènement (Risk Set)
Des variables explicatives ou covariables
- Fixes: sexe/genre, génération, niveau de diplôme le plus élevé,……
- Dynamiques (TVC: Time varying covariates):
- Mesurées à tout moment entre le début et la sortie de l’observation: statut matrimonial, taille du ménage, statut d’activité…
- Pour les modèles à l’exception du semi-paramétrique de Cox, en présence de données censurées la durée ou une transformation de celle-ci est une variable dynamique introduite comme variable indépendante pour assurer le bon ajustement des données. L’introduction directe d’une fonction de la durée comme variable dépendante seule ne peut se faire qu’en absence d’observation censurée, en particulier à droite. Quelle que soit leur forme c’est une caractéristique propre aux modèles pleinement paramétriques.