Salud Femenina · Work in Progress Women's Health · Work in Progress Bloque 2 en curso Block 2 in progress

Detección temprana de deterioro fisiológico premenstrual

Early detection of premenstrual physiological deterioration

Detectar el pródromo antes del síntoma. No diagnosticar PMDD.

Detect the prodrome before the symptom. Not diagnose PMDD.

Qué es mcPHASES

Dataset público multimodal del menstrual cycle phase identification study, recogido durante 2022 y 2024 en una cohorte de mujeres en edad reproductiva. Combina sensorización pasiva con Fitbit (HRV, frecuencia cardíaca en reposo, temperatura nocturna, frecuencia respiratoria, sueño), verdad de terreno hormonal con dispositivo Mira Plus (LH, E3G, PdG) y autoinforme diario de síntomas premenstruales.


El objetivo es construir un sistema que detecte el pródromo PMS/PMDD antes de que la mujer reporte síntomas.

What mcPHASES is

Public multimodal dataset from the menstrual cycle phase identification study, collected during 2022 and 2024 from a cohort of women of reproductive age. It combines Fitbit passive sensing (HRV, resting heart rate, nocturnal temperature, breathing rate, sleep), hormonal ground truth via the Mira Plus device (LH, E3G, PdG) and daily self-report of premenstrual symptoms.


The goal is to build a system that detects the PMS/PMDD prodrome before the woman reports symptoms.

42 sujetos únicos unique subjects
62 sujeto-intervalos subject-intervals
2 intervalos (2022, 2024) intervals (2022, 2024)
114 ventanas de detección detection windows
5 sub-fases del ciclo cycle sub-phases
El hueco que ocupa

A fecha de mayo 2026, ninguna app comercial ni publicación aplica un marco idiográfico fase-condicional con regla de convergencia multidimensional al pródromo PMS/PMDD. Las apps actuales (Clue, Flo, Natural Cycles) hacen tracking pasivo o predicción de calendario, pero no detección idiográfica de pródromo basada en biomarcadores fisiológicos. El propio Fitbit ya aplica baseline idiográfico solo a temperatura cutánea — LUTEA demuestra cómo extender ese principio a HRV, dimensión respiratoria, sueño y otras señales del mismo dispositivo.

The gap it fills

As of May 2026, no commercial app or publication applies an idiographic phase-conditional framework with a multidimensional convergence rule to the PMS/PMDD prodrome. Current apps (Clue, Flo, Natural Cycles) do passive tracking or calendar prediction, but not idiographic prodrome detection based on physiological biomarkers. Fitbit itself already applies an idiographic baseline only to skin temperature — LUTEA shows how to extend that principle to HRV, respiratory rate, sleep and other signals from the same device.

Qué hace este proyecto distinto

Cambia la pregunta. En lugar de "¿se parece esta mujer al perfil PMS/PMDD?", pregunta "¿se está esta mujer alejando de su propio patrón fisiológico, separando lo que es variación cíclica normal de lo que es desviación idiográfica genuina?". Cada mujer es su propia referencia, y dentro de cada mujer cada fase del ciclo tiene su propio baseline. El sistema detecta convergencia sostenida en al menos dos de las cuatro dimensiones núcleo durante la fase lútea tardía — la ventana en la que el pródromo se manifiesta antes que el síntoma reportado.

What makes this project different

It changes the question. Instead of "does this woman look like the PMS/PMDD profile?", it asks "is this woman drifting away from her own physiological pattern, separating what is normal cyclical variation from what is genuine idiographic deviation?". Each woman is her own reference, and within each woman each cycle phase has its own baseline. The system detects sustained convergence across at least two of the four core dimensions during the late luteal phase — the window in which the prodrome manifests earlier than the reported symptom.

El dataset y los conceptos del proyecto

The dataset and project concepts

El dataset y sus señales

mcPHASES recoge datos de 42 sujetos a lo largo de dos intervalos separados por dos años: 2022 y 2024. 20 sujetos están presentes en ambos intervalos. Cada combinación (sujeto, intervalo) se trata como una unidad N-of-1 independiente, lo que da 62 sujeto-intervalos como unidades de análisis. Cada sujeto-intervalo cubre aproximadamente 90 días, suficiente para observar 2 o 3 ciclos menstruales completos.


Las señales se organizan en cuatro dimensiones núcleo (autonómica, termorregulación, respiratoria, sueño) y dos dimensiones secundarias (estrés, actividad). Una dimensión exploratoria — glucosa por monitor continuo (CGM) — está disponible solo en el intervalo 2022.

The dataset and its signals

mcPHASES collects data from 42 subjects across two intervals two years apart: 2022 and 2024. 20 subjects are present in both intervals. Each (subject, interval) combination is treated as an independent N-of-1 unit, yielding 62 subject-intervals as units of analysis. Each subject-interval spans roughly 90 days, enough to observe 2 or 3 full menstrual cycles.


Signals are organized into four core dimensions (autonomic, thermoregulation, respiratory, sleep) and two secondary dimensions (stress, activity). An exploratory dimension — glucose via continuous monitor (CGM) — is available only in the 2022 interval.

Las cuatro dimensiones núcleo

Las cuatro dimensiones del núcleo capturan los cuatro sistemas fisiológicos que la literatura documenta como implicados en el pródromo PMS/PMDD.

Autonómica: regulación cardiovascular durante el sueño. La construyen HRV (RMSSD nocturno) y frecuencia cardíaca en reposo.
Termorregulación: temperatura corporal nocturna. Sube de forma natural en la fase lútea por efecto de la progesterona, pero la magnitud y la persistencia son altamente individuales.
Respiratoria: frecuencia respiratoria durante el sueño profundo, sensible a cambios autonómicos y hormonales.
Sueño: score global de sueño y restlessness nocturno. La estructura objetiva del sueño cambia antes que el reporte subjetivo de mala noche.

El sistema vigila las cuatro a la vez. La regla de detección requiere convergencia: el pródromo rara vez se manifiesta en una sola dimensión.

The four core dimensions

The four core dimensions capture the four physiological systems documented in the literature as involved in the PMS/PMDD prodrome.

Autonomic: cardiovascular regulation during sleep. Built from HRV (nocturnal RMSSD) and resting heart rate.
Thermoregulation: nocturnal body temperature. Naturally rises in the luteal phase due to progesterone, but magnitude and persistence are highly individual.
Respiratory: breathing rate during deep sleep, sensitive to autonomic and hormonal changes.
Sleep: overall sleep score and nocturnal restlessness. Objective sleep structure changes before the subjective report of a bad night.

The system watches all four at once. The detection rule requires convergence: the prodrome rarely manifests in a single dimension.

El baseline fase-condicional

Las señales fisiológicas tienen variación cíclica intrínseca normal: HRV cae en lútea, temperatura sube, frecuencia respiratoria aumenta. Si el baseline se calcula como un único patrón estable sobre 21 días que mezclen folicular y lútea, la varianza queda inflada por esa variación cíclica y enmascara la desviación idiográfica genuina.


El proyecto introduce un baseline fase-condicional sobre cinco sub-fases — menstrual, folicular, ovulación, lútea temprana, lútea tardía — con estimadores robustos (mediana y MAD) para cada una. Cada día se traduce en un z-score intra-sujeto-fase: la distancia respecto al patrón propio de esa mujer en esa fase del ciclo. El baseline es expandible: el primer ciclo solo calibra, el segundo ya permite detección, el tercero refina.

The phase-conditional baseline

Physiological signals have intrinsic normal cyclical variation: HRV drops in luteal, temperature rises, breathing rate increases. If the baseline is computed as a single stable pattern over 21 days mixing follicular and luteal, the variance is inflated by that cyclical variation and masks genuine idiographic deviation.


The project introduces a phase-conditional baseline over five sub-phases — menstrual, follicular, ovulation, early luteal, late luteal — with robust estimators (median and MAD) for each. Each day translates into an intra-subject-phase z-score: the distance from that woman's own pattern in that cycle phase. The baseline is expandable: the first cycle only calibrates, the second already enables detection, the third refines.

Marco metodológico

Methodological framework

Diseño longitudinal intra-sujeto + Control Estadístico de Procesos + ML supervisado + SHAP

Intra-subject longitudinal design + Statistical Process Control + Supervised ML + SHAP

Diseño

Diseño longitudinal intra-sujeto

Cada mujer actúa como su propio grupo de control, con la diferencia respecto a GLOBEM de que la unidad de análisis es el sujeto-intervalo: cada uno de los 62 sujeto-intervalos del dataset se trata como una unidad N-of-1 independiente, con su propio baseline y su propia detección.


Para los 20 sujetos con datos en ambos intervalos (2022 y 2024), separados 2 años, se tratan como dos unidades independientes, no como seguimiento continuo.

Design

Intra-subject longitudinal design

Each woman acts as her own control group, with the difference from GLOBEM that the unit of analysis is the subject-interval: each of the dataset's 62 subject-intervals is treated as an independent N-of-1 unit, with its own baseline and its own detection.


For the 20 subjects with data in both intervals (2022 and 2024), two years apart, they are treated as two independent units, not as continuous follow-up.

Técnica estadística

Arquitectura de tres capas

Capa 1 — SPC como feature engineering con criterio clínico. Construye baseline fase-condicional, z-scores intra-sujeto-fase, estadísticas móviles, EWMA, CUSUM, change point detection (BOCPD, PELT) y la regla de convergencia 2/4 con persistencia M=3 como sistema base de detección.


Capa 2 — ML supervisado. Sobre los z-scores y derivados temporales construidos por la capa 1, árboles de decisión y Random Forest aprenden a refinar el índice de desviación capturando interacciones entre dimensiones.


Capa 3 — SHAP. Identifica fenotipos de pródromo: en qué dimensión se manifiesta antes el cambio en cada mujer.

Statistical technique

Three-layer architecture

Layer 1 — SPC as feature engineering with clinical criteria. Builds the phase-conditional baseline, intra-subject-phase z-scores, rolling statistics, EWMA, CUSUM, change point detection (BOCPD, PELT) and the 2/4 convergence rule with persistence M=3 as the base detection system.


Layer 2 — Supervised ML. On the z-scores and temporal derivatives built by layer 1, decision trees and Random Forest learn to refine the deviation index capturing interactions across dimensions.


Layer 3 — SHAP. Identifies prodrome phenotypes: which dimension manifests change earliest in each woman.

Por qué la combinación funciona y por qué cada capa por separado no: SPC sola es demasiado rígida — las reglas 2/4 y umbral z=1.5 son auditables y robustas, pero no capturan interacciones complejas entre dimensiones. ML poblacional sola sobre datos crudos falla en problemas idiográficos (lo demuestra el propio benchmark de GLOBEM). La combinación SPC + ML opera sobre features ya individualizadas: SPC absorbe la heterogeneidad inter-sujeto e intra-sujeto cíclica; ML opera sobre ese espacio normalizado y captura los patrones complejos. SHAP cierra el ciclo dando interpretabilidad clínica y fenotipado.
Why the combination works and why each layer alone does not: SPC alone is too rigid — the 2/4 rules and z=1.5 threshold are auditable and robust, but do not capture complex interactions across dimensions. Population-level ML alone on raw data fails on idiographic problems (the GLOBEM benchmark itself demonstrates this). The SPC + ML combination operates on already-individualized features: SPC absorbs inter-subject and intra-subject cyclical heterogeneity; ML operates on that normalized space and captures complex patterns. SHAP closes the loop providing clinical interpretability and phenotyping.

Estado del proyecto

Project status

Dónde estamos y adónde va

Where we are and where it's going

Fase CRISP-DM
CRISP-DM phase
Bloque(s)
Block(s)
Estado
Status
Fase 1 Comprensión del negocio Phase 1 Business understanding
Bloque 1 Block 1
Problem framing · Definición operativa de pródromo PMS/PMDD
Problem framing · Operational definition of PMS/PMDD prodrome
Completado Completed
Fase 2 Comprensión de los datos Phase 2 Data understanding
Bloque 0 Block 0
Validación del dataset · Cobertura · Sujeto-intervalos · Viabilidad
Dataset validation · Coverage · Subject-intervals · Feasibility
Completado Completed
Fase 3 Preparación de datos Phase 3 Data preparation
Bloque 2 Block 2
Baseline fase-condicional expandible
Phase-conditional expandable baseline
Bloque 3 Block 3
Z-score intra-sujeto-fase
Intra-subject-phase z-score
Bloque 4 Block 4
Series temporales · Ventanas rolling sobre z-scores
Time series · Rolling windows on z-scores
Bloque 5 Block 5
Feature engineering temporal cíclico
Cyclical temporal feature engineering
En curso In progress Pendiente Pending Pendiente Pending Pendiente Pending
Fase 4 Modelado Phase 4 Modeling
Bloque 6 Block 6
ML supervisado · Árboles y Random Forest sobre z-scores
Supervised ML · Trees and Random Forest on z-scores
Pendiente Pending
Fase 5 Evaluación Phase 5 Evaluation
Bloque 7 Block 7
Evaluación orientada a intervención · Antelación · Regla 2/4
Intervention-oriented evaluation · Lead time · 2/4 rule
Bloque 8 Block 8
Análisis individual · Trayectorias por mujer y fenotipos
Individual analysis · Per-woman trajectories and phenotypes
Bloque 9 Block 9
Interpretabilidad SHAP · Fenotipos de pródromo
SHAP interpretability · Prodrome phenotypes
Pendiente Pending Pendiente Pending Pendiente Pending
Fase 6 Despliegue Phase 6 Deployment
Bloque 10 Block 10
Umbral de intervención · Caso de uso comercial
Intervention threshold · Commercial use case
Pendiente Pending

Timeline del proyecto

Bloque 1 - Problem framing
Definición operativa de pródromo PMS/PMDD. Definición de ciclo con pródromo manifiesto. Regla de credibilidad.
Bloque 0 - Validación de datos
Validación de mcPHASES, cobertura por dimensión mapeada, identificación de los 62 sujeto-intervalos como unidades de análisis.
Bloque 2 - Preparación de datos 1
Baseline fase-condicional expandible. Segmentación de ciclos. Identificación de las 5 sub-fases. Filtro de ciclos anovulatorios. Cálculo de (mediana, MAD) por sujeto-intervalo, sub-fase, dimensión.
Bloque 3 - Preparación de datos 2
Z-score intra-sujeto-fase con baseline expandido.
Bloque 4 - Preparación de datos 3
Series temporales sobre z-scores. Ventanas rolling de 3 estadísticas: media móvil, varianza móvil, autocorrelación móvil.
Bloque 5 - Feature Engineering
Feature engineering temporal específico al ciclo: días desde inicio de Luteal, días estimados hasta próxima Menstrual, lag de z-scores, pendientes, acumulación. Construcción del índice continuo de desviación.
Bloque 6 - Modelado con validación temporal
Árboles de decisión y Random Forest sobre z-scores. Target: índice de desviación construido en Bloque 5. Validación temporal estricta.
Bloque 7 - Evaluación orientada a intervención
Métricas de antelación detección-síntoma
Regla de convergencia 2/4 con M=3
Change-point detection:   BOCPD - PELT
Control Estadístico de Procesos:   CUSUM - EWMA
Comparación con baseline trivial (calendario menstrual)
Bloque 8 - Análisis individual
Trayectorias por mujer. Identificación de fenotipos de pródromo (qué dimensión empuja la alerta en cada persona).
Bloque 9 - Evaluación e interpretabilidad
SHAP para explicabilidad clínica. Fenotipos de pródromo a nivel de sub-cohorte. Análisis exploratorio sobre subconjunto 2022 con glucose.
Bloque 10 - Umbral de intervención y Plan de acción
Umbral de intervención calibrado por trade-off de errores
Caso de uso comercial: dashboard tipo, formato de alerta, API hipotética

Bloques del proyecto

Project blocks

Cada bloque, su flujo de trabajo completo

Each block, its complete workflow

Cada bloque cierra con cuatro preguntas no negociables — decisión, renuncia, uso real, trade-off — y documenta las lecturas técnicas que lo sustentan. Este es mi sistema de control: si un bloque no responde a las cuatro, no se cierra.

Each block closes with four non-negotiable questions — decision, trade-off given up, real-world use, trade-off accepted — and documents the technical readings that support it. This is my control system: if a block does not answer all four, it does not close.

FASE 1 · BLOQUE 1 — COMPRENSIÓN DEL NEGOCIO PHASE 1 · BLOCK 1 — BUSINESS UNDERSTANDING Problem framing — Definición operativa del pródromo PMS/PMDD Problem framing — Operational definition of PMS/PMDD prodrome
Completado Completed
Pregunta resuelta: ¿Cómo se define operativamente "pródromo PMS/PMDD" cuando el autoinforme de síntomas no puede ser target directo (predeciría el final del proceso, no el proceso anticipatorio)?
Question solved: How is "PMS/PMDD prodrome" operationally defined when symptom self-report cannot be the direct target (it would predict the end of the process, not the anticipatory process)?
Reid, R. L. & Soares, C. N. (2018) — "Premenstrual Dysphoric Disorder: Contemporary Diagnosis and Management".
Manejo clínico de PMDD: criterios DSM-5, ventana lútea tardía como periodo crítico, prevalencia y carga de la enfermedad. Fundamento clínico para definir la ventana de pródromo.
PMDD clinical management: DSM-5 criteria, late luteal phase as critical period, disease prevalence and burden. Clinical grounding to define the prodrome window.
DOMINIO
Halbreich, U. (2003) — "The etiology, biology, and evolving pathology of premenstrual syndromes".
Biología del PMS/PMDD: variabilidad inter-individual extrema, papel del eje hormonal, expresión multisistémica. Justifica metodológicamente por qué el enfoque idiográfico es necesario, no opcional.
PMS/PMDD biology: extreme inter-individual variability, role of the hormonal axis, multisystem expression. Methodological justification for why the idiographic approach is necessary, not optional.
DOMINIO
Yamakawa, T. et al. (2016, 2020) — "Epileptic Seizure Prediction Based on Multivariate Statistical Process Control of Heart Rate Variability Features" (IEEE TBE) y "Wearable Epileptic Seizure Prediction System with Machine-Learning-Based Anomaly Detection of HRV" (Sensors, MDPI).
Precedente publicado directo del paradigma SPC + HRV + wearable + pródromo. Sistema de predicción de pródromo de crisis epilépticas mediante MSPC sobre HRV en wearable. Estructuralmente idéntico a LUTEA en otro dominio: pródromo fisiológico, HRV como ventana al sistema nervioso autónomo, anomaly monitoring multivariado. Constituye precedente publicado y citable que valida la elección metodológica.
Direct published precedent of the SPC + HRV + wearable + prodrome paradigm. Epileptic seizure prediction system using MSPC on wearable HRV. Structurally identical to LUTEA in another domain: physiological prodrome, HRV as window to the autonomic nervous system, multivariate anomaly monitoring. Constitutes a published, citable precedent that validates the methodological choice.
SPC
Decisión
Decision
Definir el pródromo como ventana de días -7 a -1 antes del primer día de menstruación. Verdad de terreno biológica con etiqueta de fase y hormonas (Mira). Verdad clínica idiográfica: ciclo con pródromo manifiesto cuando la media de síntomas clave en lútea tardía supera en ≥1 punto Likert la media del resto del ciclo (cobertura ≥4/7 días).
Define the prodrome as days -7 to -1 before the first day of menstruation. Biological ground truth via phase label and hormones (Mira). Idiographic clinical ground truth: a cycle has manifest prodrome when the mean of key symptoms in late luteal exceeds the mean of the rest of the cycle by ≥1 Likert point (coverage ≥4/7 days).
Renuncia
Trade-off given up
Diagnóstico clínico de PMDD por entrevista estructurada. El proyecto detecta el proceso fisiológico anticipatorio, no diagnostica el trastorno. Los síntomas reportados son capa de validación posterior, no target del modelo de detección.
Clinical diagnosis of PMDD via structured interview. The project detects the anticipatory physiological process, it does not diagnose the disorder. Reported symptoms are a downstream validation layer, not the detection model's target.
Uso real
Real-world use
Monitorización pasiva continua a través del wearable que la usuaria ya usa. Alerta anticipatoria días antes del síntoma para permitir intervención preventiva (medicación intermitente, ajuste de carga, planificación). Sin cuestionarios ni evaluaciones periódicas.
Continuous passive monitoring through the wearable the user already wears. Anticipatory alert days before the symptom to enable preventive intervention (intermittent medication, workload adjustment, planning). No questionnaires or periodic assessments.
Trade-off
Trade-off
Se gana detección anticipatoria fisiológica con margen de intervención. Se pierde la certeza de cumplir criterios DSM-5 estrictos para PMDD. Es un trade-off consciente y defendible: el sistema orienta intervención, no etiqueta clínica.
Anticipatory physiological detection with intervention lead time is gained. Strict DSM-5 PMDD criteria certainty is lost. It is a conscious and defensible trade-off: the system orients intervention, not a clinical label.
FASE 2 · BLOQUE 0 — VALIDACIÓN TÉCNICA DEL DATASET PHASE 2 · BLOCK 0 — TECHNICAL DATASET VALIDATION Validación del dataset — Cobertura, sujeto-intervalos y viabilidad Dataset validation — Coverage, subject-intervals and feasibility
Completado Completed
Pregunta resuelta: ¿Qué dimensiones, sujetos e intervalos del dataset mcPHASES son técnicamente viables para construir un sistema de detección idiográfica del pródromo PMS/PMDD?
Question solved: Which dimensions, subjects and intervals of the mcPHASES dataset are technically feasible to build an idiographic PMS/PMDD prodrome detection system?
Schmalenberger, K. M. et al. (2021) — "How to study the menstrual cycle: practical tools and recommendations".
Manual operativo para investigación de ciclo menstrual: cómo segmentar fases, cómo identificar ciclos anovulatorios, qué señales son fiables. Base técnica para procesar mcPHASES.
Operational manual for menstrual cycle research: how to segment phases, identify anovulatory cycles, which signals are reliable. Technical foundation for processing mcPHASES.
DOMINIO
Decisión
Decision
Trabajar con 62 sujeto-intervalos como unidades de análisis (42 sujetos × 1 o 2 intervalos). Cuatro dimensiones núcleo en regla de convergencia (autonómica, termorregulación, respiratoria, sueño). Estrés y actividad como secundarias. Glucose solo en intervalo 2022. Excluir 2 sujetos sin Fitbit.
Work with 62 subject-intervals as units of analysis (42 subjects × 1 or 2 intervals). Four core dimensions in the convergence rule (autonomic, thermoregulation, respiratory, sleep). Stress and activity as secondary. Glucose only in 2022 interval. Exclude 2 subjects without Fitbit.
Renuncia
Trade-off given up
Tratar a los 20 sujetos con dos intervalos como seguimiento continuo. Se eligen como dos unidades N-of-1 independientes porque están separadas 2 años — la persona ha cambiado lo suficiente para que el baseline antiguo no sea válido. wrist_temperature, steps.csv (redundante con active_minutes), heart_rate (1.9 GB), height_and_weight (50-81% faltante) y sleep.csv (estructura JSON anidada redundante) se excluyen.
Treating the 20 subjects with two intervals as continuous follow-up. They are chosen as two independent N-of-1 units because they are 2 years apart — the person has changed enough that the old baseline is no longer valid. wrist_temperature, steps.csv (redundant with active_minutes), heart_rate (1.9 GB), height_and_weight (50-81% missing) and sleep.csv (redundant nested JSON) are excluded.
Uso real
Real-world use
El sujeto-intervalo es la unidad temporal natural en producción: una mujer empieza a usar la app, da 90 días de datos (~3 ciclos), el sistema construye su baseline expandible y monitoriza. Si la mujer interrumpe y vuelve dos años después, es un nuevo sujeto-intervalo, no continuación.
The subject-interval is the natural temporal unit in production: a woman starts using the app, provides 90 days of data (~3 cycles), the system builds her expandable baseline and monitors. If the woman pauses and returns two years later, it is a new subject-interval, not a continuation.
Trade-off
Trade-off
62 sujeto-intervalos es n efectivo bajo respecto a GLOBEM (155 sujetos), pero compensa con verdad de terreno biológica objetiva (hormonas + fase del ciclo) y diseño que multiplica oportunidades de detección por sujeto (114 ventanas reales en 58 sujeto-intervalos). Demografía concentrada (cohorte de Toronto, mujeres jóvenes 18-29) limita generalización.
62 subject-intervals is a low effective n compared to GLOBEM (155 subjects), but offsets with objective biological ground truth (hormones + cycle phase) and a design that multiplies detection opportunities per subject (114 real windows across 58 subject-intervals). Concentrated demographics (Toronto cohort, young women aged 18-29) limit generalization.
FASE 3 · BLOQUE 2 — PREPARACIÓN DE DATOS PHASE 3 · BLOCK 2 — DATA PREPARATION Construcción del baseline fase-condicional expandible Phase-conditional expandable baseline construction
En curso In progress
Pregunta que resuelve: ¿Qué es el "comportamiento fisiológico normal" de cada mujer en cada fase del ciclo, cómo se mide con estimadores robustos sobre n bajo, y cómo crece el baseline ciclo a ciclo?
Question being solved: What is each woman's "normal physiological behavior" in each cycle phase, how is it measured with robust estimators over low n, and how does the baseline grow cycle by cycle?
Montgomery — "Introduction to Statistical Quality Control - Chapter 5".
Filosofía de SPC: causas fortuitas vs asignables, límites de control, estimadores robustos. La sección sobre aplicaciones fuera de la manufactura es el puente conceptual entre SPC industrial y monitorización individual en salud.
SPC philosophy: chance vs assignable causes, control limits, robust estimators. The section on applications beyond manufacturing is the conceptual bridge between industrial SPC and individual health monitoring.
SPC
Baker, F. C. & Driver, H. S. (2007) — "Circadian rhythms, sleep, and the menstrual cycle".
Respaldo empírico de la variación cíclica intrínseca en HRV, temperatura nocturna, frecuencia respiratoria y sueño. Justifica por qué el baseline debe ser fase-condicional y no plano.
Empirical support for intrinsic cyclical variation in HRV, nocturnal temperature, breathing rate and sleep. Justifies why the baseline must be phase-conditional, not flat.
DOMINIO
Daza (2018) — "Causal Analysis of Self-tracked Time Series Data Using a Counterfactual Framework for N-of-1 Trials".
Marco counterfactual para estudios N-of-1 observacionales. Sustenta la inferencia idiográfica sin randomización, núcleo conceptual del enfoque intra-sujeto-fase del proyecto.
Counterfactual framework for N-of-1 observational studies. Grounds idiographic inference without randomisation, the conceptual core of the project's within-subject-phase approach.
N-of-1
Vieira et al. (2017) — "Dynamic modelling of n-of-1 data: powerful and flexible data analytics applied to individualised studies".
Modelado dinámico de datos N-of-1. Justifica formalmente el tratamiento de tendencia y autocorrelación en series longitudinales individuales, base técnica de los criterios sobre baseline expandible.
Dynamic modelling of N-of-1 data. Provides the formal justification for handling temporal trend and autocorrelation in single-subject longitudinal series, the technical basis for expandable baseline criteria.
N-of-1
Decisión
Decision
Baseline = (mediana, MAD) por sujeto-intervalo, sub-fase y dimensión, sobre cinco sub-fases (menstrual, folicular, ovulación, lútea temprana, lútea tardía). Baseline expandible: ciclo 1 calibra, ciclo 2 detecta con baseline=ciclo 1, ciclo 3 detecta con baseline=ciclos 1+2. Filtro jerárquico de ciclos anovulatorios: PdG > 5 µg/mL durante ≥3 días consecutivos en lútea; si no hay datos PdG suficientes, LH máx > 20 mIU/mL en Fertility; si ninguno aplicable, ciclo marcado como "ovulatorio no verificable" y mantenido en análisis con flag.
Baseline = (median, MAD) per subject-interval, sub-phase and dimension, over five sub-phases (menstrual, follicular, ovulation, early luteal, late luteal). Expandable baseline: cycle 1 calibrates, cycle 2 detects with baseline=cycle 1, cycle 3 detects with baseline=cycles 1+2. Hierarchical anovulatory cycle filter: PdG > 5 µg/mL for ≥3 consecutive days in luteal; if PdG data are insufficient, LH max > 20 mIU/mL in Fertility; if neither applies, cycle flagged as "ovulation not verifiable" and kept in analysis.
Renuncia
Trade-off given up
Baseline plano (estilo GLOBEM) y baseline cíclico día-a-día. Plano enmascara la desviación idiográfica al inflar la varianza con la variación cíclica. Día-a-día requiere muchos más ciclos para estimación. Sub-fases con estimadores robustos es el equilibrio entre granularidad y estabilidad sobre n bajo.
Flat baseline (GLOBEM-style) and day-by-day cyclical baseline. Flat masks idiographic deviation by inflating variance with cyclical variation. Day-by-day requires many more cycles for estimation. Sub-phases with robust estimators are the balance between granularity and stability over low n.
Uso real
Real-world use
El primer mes de uso de la app calibra el baseline sin disparar alertas. A partir del segundo ciclo (mes 2), la mujer ya tiene detección de pródromo en lútea tardía. El baseline crece y se refina con cada ciclo subsiguiente. Es exactamente cómo se vendería el producto: "necesitamos un ciclo para conocerte; a partir del segundo, te avisamos".
The first month of app use calibrates the baseline without triggering alerts. From the second cycle (month 2), the woman already has prodrome detection in late luteal. The baseline grows and refines with each subsequent cycle. This is exactly how the product would be sold: "we need one cycle to know you; from the second one onwards, we alert you".
Trade-off
Trade-off
Se pierde un ciclo entero de detección a cambio de un baseline metodológicamente sólido. Se pierde un baseline universal a cambio de uno fase-condicional auditable. Mediana y MAD aguantan mejor el ruido del wearable y los outliers que media y std, especialmente con n bajo (~14 días por sub-fase).
An entire detection cycle is lost in exchange for a methodologically sound baseline. A universal baseline is lost in exchange for an auditable phase-conditional one. Median and MAD better handle wearable noise and outliers than mean and std, especially with low n (~14 days per sub-phase).
Pendiente de implementar: el código que segmenta ciclos a partir de la etiqueta de fase, identifica las cinco sub-fases, aplica el filtro de ciclos anovulatorios y genera (mediana, MAD) por sujeto-intervalo, sub-fase y dimensión. El diseño está cerrado; la ejecución no.
Pending implementation: the code that segments cycles from the phase label, identifies the five sub-phases, applies the anovulatory cycle filter and generates (median, MAD) per subject-interval, sub-phase and dimension. Design is closed; execution is not.
FASE 3 · BLOQUE 3 — PREPARACIÓN DE DATOS PHASE 3 · BLOCK 3 — DATA PREPARATION Z-score intra-sujeto-fase Intra-subject-phase z-score
Pendiente Pending
Pregunta que resolverá: ¿Qué umbral de z-score intra-sujeto-fase constituye una desviación significativa para cada mujer y cada sub-fase, y cómo se calibra ese umbral sin sobreajustar al ciclo de calibración?
Question to be solved: What intra-subject-phase z-score threshold constitutes a significant deviation for each woman and each sub-phase, and how is that threshold calibrated without overfitting to the calibration cycle?
Montgomery — "Introduction to Statistical Quality Control - Chapter 6".
Cartas de control para mediciones individuales con estimadores robustos. El caso exacto de LUTEA: una observación por día por persona y sub-fase. Base técnica para construir el z-score intra-sujeto-fase con mediana y MAD.
Control charts for individual measurements with robust estimators. LUTEA's exact case: one observation per day per person and sub-phase. Technical basis for building the intra-subject-phase z-score with median and MAD.
SPC
FASE 3 · BLOQUE 4 — PREPARACIÓN DE DATOS PHASE 3 · BLOCK 4 — DATA PREPARATION Series temporales sobre z-scores - Ventanas rolling - Autocorrelación Time series on z-scores - Rolling windows - Autocorrelation
Pendiente Pending
Pregunta que resolverá: ¿Qué tamaño de ventana rolling captura mejor la dinámica de cambio anticipatoria sobre los z-scores intra-sujeto-fase sin introducir lag excesivo dentro de la ventana lútea tardía de 7 días?
Question to be solved: What rolling window size best captures the anticipatory change dynamics on intra-subject-phase z-scores without introducing excessive lag within the 7-day late-luteal window?
Hyndman & Athanasopoulos — "Forecasting: Principles and Practice, Chapters 2,3,4".
Series temporales básicas: tendencias, ventanas rolling, autocorrelación. Los conceptos técnicos del bloque, sin entrar en métodos predictivos como ARIMA que no aplican aquí.
Basic time series: trends, rolling windows, autocorrelation. The technical concepts of the block, without going into predictive methods like ARIMA that do not apply here.
Series temp
Wichers, Smit, Snippe (2020) — "Early Warning Signals Based on Momentary Affect Dynamics can Expose Nearby Transitions in Depression".
Introduce formalmente la idea de que la varianza creciente y la autocorrelación creciente son indicadores anticipatorios de transiciones. Aunque el dominio original es afecto, el principio se transfiere directamente a señales fisiológicas.
Formally introduces the idea that rising variance and rising autocorrelation are anticipatory indicators of transitions. Although the original domain is affect, the principle transfers directly to physiological signals.
DOMINIO
FASE 3 · BLOQUE 5 — PREPARACIÓN DE DATOS PHASE 3 · BLOCK 5 — DATA PREPARATION Feature engineering temporal cíclico Cyclical temporal feature engineering
Pendiente Pending
Pregunta que resolverá: ¿Qué features derivadas y específicas al ciclo (días desde inicio de Luteal, días estimados hasta próxima Menstrual, lag de z-scores, pendientes, acumulación) construyen el índice continuo de desviación que servirá de target para la capa ML supervisada?
Question to be solved: Which cycle-specific derived features (days since Luteal onset, estimated days to next Menstrual, z-score lags, slopes, accumulation) build the continuous deviation index that will serve as the target for the supervised ML layer?
Sin lecturas adicionales planificadas.
No additional readings planned.
Este bloque se aborda directamente con el conocimiento técnico acumulado en los bloques 2–4. La construcción de features se basa en los criterios de baseline fase-condicional, z-scores y ventanas rolling ya cerrados.
This block is addressed directly with the technical knowledge accumulated in blocks 2–4. Feature construction is based on the already-closed phase-conditional baseline, z-score and rolling-window criteria.
FASE 4 · BLOQUE 6 — MODELADO PHASE 4 · BLOCK 6 — MODELING ML supervisado · Árboles y Random Forest sobre z-scores Supervised ML · Trees and Random Forest on z-scores
Pendiente Pending
Pregunta que resolverá: ¿Cómo refina un modelo supervisado el índice continuo de desviación construido por SPC capturando interacciones entre las cuatro dimensiones núcleo, sin recaer en el problema de heterogeneidad inter-sujeto que la capa SPC ya neutralizó?
Question to be solved: How does a supervised model refine the continuous deviation index built by SPC by capturing interactions across the four core dimensions, without falling back into the inter-subject heterogeneity problem that the SPC layer already neutralized?
James et al. — "An Introduction to Statistical Learning - Chapters 5,8".
Validación cruzada y por qué no random split sobre datos longitudinales cíclicos. Árboles de decisión, Random Forest e interpretabilidad nativa.
Cross-validation and why not random split on cyclical longitudinal data. Decision trees, Random Forest and native interpretability.
ML
Géron — "Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow - Chapters 5,6".
Implementación práctica en Python de árboles de decisión, ensemble learning y pipelines de modelado.
Practical Python implementation of decision trees, ensemble learning and modeling pipelines.
ML
FASE 5 · BLOQUE 7 — EVALUACIÓN PHASE 5 · BLOCK 7 — EVALUATION Evaluación orientada a intervención:   Antelación  |  CUSUM-EWMA  |  BOCPD-PELT  |  Regla 2/4 Intervention-oriented evaluation:   Lead time  |  CUSUM-EWMA  |  BOCPD-PELT  |  2/4 rule
Pendiente Pending
Pregunta que resolverá: ¿Cuántos días antes del primer síntoma reportado detecta el sistema el pródromo en cada ciclo con pródromo manifiesto? ¿La regla de convergencia 2/4 con M=3 supera al baseline trivial de calendario menstrual?
Question to be solved: How many days before the first reported symptom does the system detect the prodrome in each cycle with manifest prodrome? Does the 2/4 convergence rule with M=3 outperform the trivial menstrual-calendar baseline?
Smit, A. C., Snippe, E., & Wichers, M. (2019) — "Increasing restlessness signals impending increase in depressive symptoms more than 2 months before it happens in individual patients".
Demostró que señales monitorizadas con SPC predicen aumentos sintomáticos con antelación de semanas-meses en pacientes individuales. La evidencia metodológica más directa para el enfoque de antelación detección-síntoma.
Demonstrated that signals monitored with SPC predict symptomatic increases weeks-to-months in advance in individual patients. The most direct methodological evidence for the detection-symptom lead-time approach.
DOMINIO
Smit, A. C., & Snippe, E. (2023) — "Real-time monitoring of increases in restlessness to assess idiographic risk of recurrence of depressive symptoms".
Replicación a mayor escala con EWMA aplicado a datos EMA durante meses. Demuestra que el enfoque intra-sujeto con EWMA es viable en producción clínica real.
Larger-scale replication with EWMA applied to multi-month EMA data. Demonstrates that the intra-subject approach with EWMA is viable in real clinical production.
DOMINIO
Montgomery — "Introduction to Statistical Quality Control - Chapter 9, 10".
CUSUM y EWMA: detección de desviaciones pequeñas sostenidas. Monitoreo con variables múltiples para combinar las 4 dimensiones núcleo (autonómica, termorregulación, respiratoria, sueño).
CUSUM and EWMA: detection of small sustained deviations. Multivariate monitoring to combine the 4 core dimensions (autonomic, thermoregulation, respiratory, sleep).
SPC
Aminikhanghahi & Cook (2017) — "A Survey of Methods for Time Series Change Point Detection".
Revisión de referencia. Cubre métodos clásicos (CUSUM, Bayesian) y modernos. Punto de partida para situar las técnicas elegidas en el ecosistema completo.
Reference review. Covers classical (CUSUM, Bayesian) and modern methods. Starting point to place the chosen techniques within the full ecosystem.
Change point
Killick, Fearnhead & Eckley (2012) — "Optimal Detection of Changepoints with a Linear Computational Cost".
Paper original de PELT, el algoritmo más usado en change-point detection offline. Implementado en la mayoría de librerías Python (ruptures).
Original PELT paper, the most-used algorithm in offline change-point detection. Implemented in most Python libraries (ruptures).
Change point
Adams & MacKay (2007) — "Bayesian Online Changepoint Detection".
Paper original de BOCPD, alternativa bayesiana a CUSUM para detección online en tiempo real. Su consideración explícita demuestra que se conoce el espacio de soluciones.
Original BOCPD paper, Bayesian alternative to CUSUM for real-time online detection. Its explicit consideration shows knowledge of the solution space.
Change point
Van den Burg & Williams (2020) — "An Evaluation of Change Point Detection Algorithms".
Referencia para defender la elección de algoritmo en el Bloque 7 frente a alternativas modernas.
Reference for defending algorithm choice in Block 7 against modern alternatives.
Change point
FASE 5 · BLOQUE 8 — EVALUACIÓN PHASE 5 · BLOCK 8 — EVALUATION Análisis individual - Trayectorias por mujer y fenotipos Individual analysis - Per-woman trajectories and phenotypes
Pendiente Pending
Pregunta que resolverá: ¿Cómo se evalúa el sistema mujer a mujer y ciclo a ciclo, no solo en métricas globales? ¿Qué patrones de pródromo emergen al analizar trayectorias individuales? ¿Qué dimensión empuja la alerta en cada mujer?
Question to be solved: How is the system evaluated woman-by-woman and cycle-by-cycle, not only in global metrics? Which prodrome patterns emerge when analyzing individual trajectories? Which dimension drives the alert in each woman?
Sin lecturas adicionales planificadas.
No additional readings planned.
Este bloque se aborda con las herramientas técnicas acumuladas (SPC, change-point detection, z-score intra-sujeto-fase, ML supervisado) aplicadas al análisis individual de trayectorias y a la identificación preliminar de fenotipos.
This block is addressed with the accumulated technical tools (SPC, change-point detection, intra-subject-phase z-score, supervised ML) applied to individual trajectory analysis and preliminary phenotype identification.
FASE 5 · BLOQUE 9 — EVALUACIÓN PHASE 5 · BLOCK 9 — EVALUATION Interpretabilidad - SHAP - Fenotipos de pródromo Interpretability - SHAP - Prodrome phenotypes
Pendiente Pending
Pregunta que resolverá: ¿Qué dimensiones explican el pródromo en cada mujer de forma individual? ¿Existen fenotipos identificables a nivel de sub-cohorte (mujeres en las que la alerta la dispara HRV vs termorregulación vs sueño)? ¿Cómo se traduce esa explicación a un lenguaje accionable para el clínico y para la usuaria?
Question to be solved: Which dimensions explain the prodrome in each woman individually? Are there identifiable phenotypes at the sub-cohort level (women in whom the alert is driven by HRV vs thermoregulation vs sleep)? How is that explanation translated into actionable language for the clinician and the user?
Christoph Molnar — "Interpretable Machine Learning - Chapters 17, 18".
Libro de referencia para entender SHAP. Explica cómo abrir un modelo de machine learning y ver qué variables han pesado más en cada predicción concreta. Aplicable a la identificación de fenotipos de pródromo a nivel individual y de sub-cohorte.
Reference book for understanding SHAP. Explains how to open up a machine learning model and see which variables weighed most in each specific prediction. Applicable to prodrome phenotype identification at individual and sub-cohort level.
DOMINIO
FASE 6 · BLOQUE 10 — DESPLIEGUE PHASE 6 · BLOCK 10 — DEPLOYMENT Umbral de intervención - Caso de uso comercial Intervention threshold - Commercial use case
Pendiente Pending
Pregunta que resolverá: ¿Cómo se traduce la señal estadística de pródromo en una regla de disparo accionable que una plataforma de femtech, una farma con ensayo PMDD o un programa de RPM puedan usar sin necesitar entender el modelo? ¿Cómo se calibra el umbral para el trade-off de errores que cada caso de uso exige?
Question to be solved: How is the statistical prodrome signal translated into an actionable trigger rule that a femtech platform, a pharma running a PMDD trial or an RPM program can use without needing to understand the model? How is the threshold calibrated for the error trade-off each use case demands?
Montgomery — "Introduction to Statistical Quality Control - Chapter 11".
Monitoreo con variables múltiples y diseño de OCAP (out-of-control action plan). El puente entre detección estadística y regla de intervención auditable, requisito para sectores regulados (farma, dispositivos médicos).
Multivariate monitoring and OCAP (out-of-control action plan) design. The bridge between statistical detection and an auditable intervention rule, required for regulated sectors (pharma, medical devices).
SPC

Bibliografía consolidada

Consolidated references

Índice completo de fuentes del proyecto

Full index of project sources

Las lecturas se distribuyen dentro de cada bloque para mostrar qué sustenta cada decisión. Esta sección recoge el índice consolidado, ordenado por para qué sirve cada fuente.

Readings are distributed within each block to show what supports each decision. This section collects the consolidated index, ordered by what each source is used for.

Daza, E. J. (2018) — "Causal Analysis of Self-tracked Time Series Data Using a Counterfactual Framework for N-of-1 Trials". Methods of Information in Medicine, 57(Open 1), e10–e21.
Marco
Vieira et al. (2017) — "Dynamic modelling of n-of-1 data: powerful and flexible data analytics applied to individualised studies". Health Psychology Review, 11(3), 222–234.
Marco
Montgomery — "Introduction to Statistical Quality Control".
La base de SPC, CUSUM y EWMA. Toda la capa 1 del sistema (baseline fase-condicional, z-score intra-sujeto-fase, regla de convergencia 2/4, CUSUM/EWMA, OCAP) se implementa sobre los principios de este libro. Es la columna vertebral técnica del proyecto, presente del Bloque 2 al Bloque 10.
The foundation of SPC, CUSUM and EWMA. The entire layer 1 of the system (phase-conditional baseline, intra-subject-phase z-score, 2/4 convergence rule, CUSUM/EWMA, OCAP) is implemented on this book's principles. It is the technical backbone of the project, present from Block 2 through Block 10.
SPC
Yamakawa, T. et al. (2016) — "Epileptic Seizure Prediction Based on Multivariate Statistical Process Control of Heart Rate Variability Features". IEEE Transactions on Biomedical Engineering.
Yamakawa, T. et al. (2020) — "Wearable Epileptic Seizure Prediction System with Machine-Learning-Based Anomaly Detection of Heart Rate Variability". Sensors (MDPI).
Precedente publicado directo de la combinación SPC + HRV + wearable + pródromo. Mismo paradigma estructural aplicado a predicción de pródromo de crisis epilépticas. Valida la transferibilidad del marco a otros dominios fisiológicos con pródromo, incluido el ciclo menstrual.
Direct published precedent of the SPC + HRV + wearable + prodrome combination. Same structural paradigm applied to seizure prodrome prediction. Validates the transferability of the framework to other physiological domains with a prodrome, including the menstrual cycle.
SPC
Aminikhanghahi & Cook (2017) — "A Survey of Methods for Time Series Change Point Detection". KAIS.
La revisión de referencia para situar CUSUM/EWMA dentro del ecosistema más amplio de change point detection. Permite defender por qué se eligen estos métodos frente a alternativas modernas.
The reference review for situating CUSUM/EWMA within the broader change point detection ecosystem. Allows defending why these methods are chosen over modern alternatives.
Change point
Adams & MacKay (2007) — "Bayesian Online Changepoint Detection".
El paper original de BOCPD. Se evalúa como alternativa bayesiana a CUSUM para detección online. Su consideración explícita demuestra que se conoce el espacio de soluciones, no solo la solución elegida.
The original BOCPD paper. Evaluated as a Bayesian alternative to CUSUM for online detection. Its explicit consideration shows knowledge of the solution space, not just the chosen solution.
Change point
Killick, Fearnhead & Eckley (2012) — "Optimal Detection of Changepoints with a Linear Computational Cost".
Paper original del algoritmo PELT, implementado en la librería ruptures. El algoritmo offline que se usará en la fase de análisis retrospectivo de trayectorias.
Original paper of the PELT algorithm, implemented in the ruptures library. The offline algorithm that will be used in the retrospective trajectory analysis phase.
Change point
Van den Burg & Williams (2020) — "An Evaluation of Change Point Detection Algorithms".
Aplicación específica de change-point detection a datos de wearables y salud. Conecta directamente con el dominio del proyecto y demuestra la viabilidad del enfoque en producción.
Specific application of change-point detection to wearables and health data. Connects directly with the project's domain and demonstrates the viability of the approach in production.
Change point
Reid, R. L. & Soares, C. N. (2018) — "Premenstrual Dysphoric Disorder: Contemporary Diagnosis and Management".
Manejo clínico de PMDD y definición de la ventana lútea tardía como periodo crítico. Fundamento clínico para la definición operativa del pródromo (días -7 a -1 antes del primer día de menstruación).
PMDD clinical management and definition of the late luteal phase as critical period. Clinical grounding for the operational definition of the prodrome (days -7 to -1 before the first day of menstruation).
Dominio
Halbreich, U. (2003) — "The etiology, biology, and evolving pathology of premenstrual syndromes".
Justifica metodológicamente la elección del enfoque idiográfico. Documenta la variabilidad inter-individual extrema en la expresión de PMS/PMDD — evidencia directa de que un enfoque poblacional no puede capturar la heterogeneidad real.
Methodologically justifies the choice of the idiographic approach. Documents the extreme inter-individual variability in PMS/PMDD expression — direct evidence that a population-level approach cannot capture real heterogeneity.
Dominio
Baker, F. C. & Driver, H. S. (2007) — "Circadian rhythms, sleep, and the menstrual cycle".
Respaldo empírico directo para la elección de las cuatro dimensiones núcleo. Documenta la variación cíclica intrínseca normal en HRV, temperatura nocturna, frecuencia respiratoria y sueño — la base empírica de por qué el baseline tiene que ser fase-condicional.
Direct empirical support for the choice of the four core dimensions. Documents normal intrinsic cyclical variation in HRV, nocturnal temperature, breathing rate and sleep — the empirical foundation for why the baseline must be phase-conditional.
Dominio
Schmalenberger, K. M. et al. (2021) — "How to study the menstrual cycle: practical tools and recommendations".
Manual operativo de referencia para investigación de ciclo menstrual. Cómo segmentar fases, identificar ciclos anovulatorios, qué señales son fiables. Base técnica para procesar mcPHASES y construir las cinco sub-fases.
Reference operational manual for menstrual cycle research. How to segment phases, identify anovulatory cycles, which signals are reliable. Technical foundation for processing mcPHASES and building the five sub-phases.
Dominio
Wichers, Smit & Snippe (2020) — "Early Warning Signals Based on Momentary Affect Dynamics can Expose Nearby Transitions in Depression".
Base teórica para el Bloque 4. Introduce formalmente que la varianza creciente y la autocorrelación creciente son indicadores anticipatorios de transiciones — el principio se transfiere directamente de afecto a señales fisiológicas en el ciclo menstrual.
Theoretical basis for Block 4. Formally introduces that rising variance and rising autocorrelation are anticipatory indicators of transitions — the principle transfers directly from affect to physiological signals in the menstrual cycle.
Dominio
Olthof, Hasselman & Strunk (2020) — "Critical Fluctuations as an Early-Warning Signal for Sudden Gains and Losses in Patients Receiving Psychotherapy for Mood Disorders".
Validación empírica del enfoque de señales tempranas. Demuestra sobre 328 casos clínicos reales que las fluctuaciones críticas anticipan cambios sostenidos — evidencia directa de que el deterioro tiene firma estadística detectable antes de manifestarse.
Empirical validation of the early-warning approach. Demonstrates on 328 real clinical cases that critical fluctuations anticipate sustained changes — direct evidence that deterioration has a detectable statistical signature before it manifests.
Dominio
Smit, Snippe & Wichers (2019) — "Increasing restlessness signals impending increase in depressive symptoms more than 2 months before it happens in individual patients".
Justificación empírica del Bloque 7 (CUSUM/EWMA). Demostró que señales monitorizadas con SPC predicen aumentos sintomáticos con antelación de meses en pacientes individuales — la evidencia metodológica más directa para el enfoque de antelación detección-síntoma de LUTEA.
Empirical justification for Block 7 (CUSUM/EWMA). Demonstrated that signals monitored with SPC predict symptomatic increases months in advance in individual patients — the most direct methodological evidence for LUTEA's detection-symptom lead-time approach.
Dominio
Smit & Snippe (2023) — "Real-time monitoring of increases in restlessness to assess idiographic risk of recurrence of depressive symptoms".
Replicación y extensión del estudio anterior. Aplicando EWMA a datos EMA de varios meses, los episodios podían preverse con semanas de antelación. Demuestra que el enfoque intra-sujeto con EWMA es viable en producción clínica real.
Replication and extension of the previous study. Applying EWMA to multi-month EMA data, episodes could be foreseen weeks in advance. Demonstrates that the intra-subject approach with EWMA is viable in real clinical production.
Dominio
James et al. — "An Introduction to Statistical Learning" (ISLR).
Base de los métodos de modelado supervisado de la capa 2 (Bloque 6). Cubre validación cruzada respetando estructura temporal, árboles de decisión, Random Forest e interpretabilidad nativa. Lectura en paralelo desde el Bloque 2.
Foundation of the supervised modeling methods in layer 2 (Block 6). Covers cross-validation respecting temporal structure, decision trees, Random Forest and native interpretability. Read in parallel from Block 2.
ML
Géron — "Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow".
Implementación práctica de los pipelines de ML. Especialmente relevante para árboles de decisión, ensemble learning y pipelines de modelado del Bloque 6.
Practical implementation of ML pipelines. Especially relevant for decision trees, ensemble learning and the modeling pipelines of Block 6.
ML
Hyndman, R. J. & Athanasopoulos, G. (2021) — "Forecasting: Principles and Practice (3ª ed.)". OTexts.
Cubre análisis exploratorio de series temporales — descomposición, autocorrelación, features y ventanas móviles. Base técnica del Bloque 4.
Covers exploratory time series analysis — decomposition, autocorrelation, features and rolling windows. Technical foundation of Block 4.
Series temp.
Christoph Molnar — "Interpretable Machine Learning".
Referencia del Bloque 9 (SHAP). Explica cómo abrir un modelo de machine learning y ver qué variables han pesado en cada predicción concreta. Necesario para identificar fenotipos de pródromo y para traducir la señal a un lenguaje accionable para el clínico y la usuaria.
Reference for Block 9 (SHAP). Explains how to open up a machine learning model and see which variables weighed in each specific prediction. Necessary to identify prodrome phenotypes and to translate the signal into actionable language for the clinician and the user.
ML

Glosario

Glossary

Términos técnicos del proyecto

Project technical terms

¿Quieres bajar al código?

Would you like to download the code?

El notebook técnico documenta cada decisión implementada. El análisis exploratorio, la construcción del baseline fase-condicional y el pipeline de detección estarán disponibles en GitHub a medida que avancen los bloques.

The technical notebook documents every decision that is implemented. The exploratory analysis, phase-conditional baseline construction, and detection pipeline will be available on GitHub as the blocks progress.

Ver notebook en GitHub → View the notebook on GitHub → Actualizado a medida que avanzan los bloques Updated as the blocks progress