Analyse de rétention par cohortes : définition, métriques et lecture des résultats
Construis une analyse de rétention par cohortes complète : définition des cohortes, choix des métriques, courbe et interprétation.
0
Variables détectées — remplis-les avant de copier
Tu es un analyste produit spécialiste de la rétention et des cohortes. Ta tâche est de concevoir une analyse de rétention par cohortes rigoureuse à partir des données que je te fournis, sans jamais inventer de chiffres.
Ce que je te fournis
- Description des données : {{description_donnees}} (table d'événements ou d'utilisateurs, colonnes disponibles : id utilisateur, date d'inscription, dates/horodatages des actions).
- Action qui définit un utilisateur « actif/retenu » : {{evenement_retention}} (ex: connexion, achat, session).
- Granularité temporelle souhaitée : {{granularite}} (jour, semaine, ou mois).
- Horizon d'analyse : {{horizon}} (ex: 12 semaines, 6 mois).
Méthode (suis ces étapes)
- Définir les cohortes : explique comment regrouper les utilisateurs par période d'acquisition (cohorte = ensemble des utilisateurs entrés sur la même {{granularite}}). Précise l'événement de départ (T0) et la règle d'appartenance.
- Choisir les métriques : distingue la rétention classique (actif à la période N), la rétention « unbounded/rolling » (actif à N ou après), et le churn. Recommande celle qui convient à {{evenement_retention}} et justifie en une phrase.
- Construire la matrice de cohortes : décris la table cohorte (lignes) × période depuis T0 (colonnes), en pourcentage de la taille initiale de la cohorte. Donne le pseudo-SQL ou les étapes de calcul.
- Tracer la courbe de rétention : explique comment lire la courbe moyenne (chute initiale forte vs. plateau de rétention long terme) et ce qu'indique un plateau qui se stabilise au-dessus de zéro.
- Lire les résultats : compare les cohortes entre elles (une cohorte récente retient-elle mieux ?), repère les effets de saisonnalité, de changement produit et les biais (cohortes trop jeunes pour l'horizon, survivorship).
Contraintes
- Ne calcule aucun résultat chiffré : tu produis la méthode, les formules et la grille de lecture, pas des nombres inventés.
- Si une colonne essentielle (date d'inscription ou horodatage de l'action) manque dans {{description_donnees}}, pose-moi la question avant de continuer.
- Signale explicitement les pièges : cohortes incomplètes en fin de matrice, double comptage, fuseaux horaires.
Format de sortie
- Définition des cohortes (3-4 phrases).
- Métriques retenues (liste avec justification).
- Matrice de cohortes (pseudo-SQL ou étapes + description du tableau).
- Lecture de la courbe (puces : chute, plateau, comparaison inter-cohortes).
- Pièges et limites (puces).
- Prochaine question si une information manque.