banner
Centro de Noticias
Corporación integrada

Comparación de redes bayesianas, G

Mar 06, 2024

BMC Medical Research Methodology volumen 23, número de artículo: 191 (2023) Citar este artículo

202 Accesos

6 altmétrico

Detalles de métricas

La agregación de una serie de ensayos N de 1 presenta un diseño de estudio innovador y eficiente, como alternativa a los ensayos clínicos aleatorios tradicionales. Los desafíos para el análisis estadístico surgen cuando hay transferencia o dependencias complejas del efecto del tratamiento de interés.

En este estudio, evaluamos y comparamos métodos para el análisis de ensayos N-de-1 agregados en diferentes escenarios con transferencia y dependencias complejas de los efectos del tratamiento sobre las covariables. Para ello, simulamos datos de una serie de ensayos N de 1 para el dolor lumbar crónico inespecífico en función de supuestas relaciones causales parametrizadas por gráficos acíclicos dirigidos. Además de los métodos estadísticos existentes, como los modelos de regresión, las redes bayesianas y la estimación G, introducimos un modelo paramétrico ajustado por arrastre (COAPM).

Los resultados muestran que todos los modelos existentes evaluados tienen un buen desempeño cuando no hay transferencia ni dependencia del tratamiento. Cuando hay arrastre, COAPM produce estimaciones insesgadas y más eficientes, mientras que todos los demás métodos muestran cierto sesgo en la estimación. Cuando se conoce la dependencia del tratamiento, todos los enfoques que son capaces de modelarla arrojan estimaciones insesgadas. Finalmente, la eficiencia de todos los métodos disminuye ligeramente cuando faltan valores y el sesgo en las estimaciones también puede aumentar.

Este estudio presenta una evaluación sistemática de enfoques existentes y novedosos para el análisis estadístico de una serie de ensayos N de 1. Derivamos recomendaciones prácticas sobre qué métodos pueden ser mejores en qué escenarios.

Informes de revisión por pares

En la última década, la medicina personalizada ha ido en aumento. El tratamiento de los pacientes a nivel individual se ha mejorado gracias a las numerosas posibilidades de medir los resultados de salud con dispositivos inteligentes y la aplicación de enfoques novedosos de ciencia de datos. Para evaluar la eficacia de las intervenciones de salud a nivel individual, se han establecido ensayos N de 1 como estándar de oro [1, 2]. Los ensayos N de 1 son ensayos controlados cruzados múltiples, en los que cada paciente es su propio grupo de control. Además de los análisis a nivel individual para el tratamiento personalizado, se pueden analizar series de ensayos N de 1 de forma conjunta [3], o también combinarse con resultados de ensayos controlados aleatorios (ECA) estándar para obtener estimaciones a nivel poblacional sobre la efectividad de tratamientos con igual o superior eficiencia en comparación con los ECA no cruzados [4, 5]. Además de la investigación sobre modelos estadísticos apropiados para el análisis de ensayos n de 1 agregados e individuales, estudios previos han investigado enfoques para derivar diseños óptimos con respecto al tamaño de la muestra y el número de ciclos [6,7,8]. Para el análisis estadístico agregado de series de ensayos N de 1, los métodos utilizados popularmente incluyen métodos no paramétricos como la prueba de rangos con signo de Wilcoxon [9, 10], pruebas de medias de dos muestras [11], métodos que permiten la covariable ajustes como modelos lineales [12, 13], modelos lineales mixtos [14] y enfoques bayesianos [15, 16]. Además, se han propuesto para el análisis modelos autorregresivos para tener en cuenta las dependencias del tiempo [17]. Daza introdujo un marco contrafactual para tratamientos dependientes del tiempo para estimar los efectos del tratamiento en el período promedio en ensayos N de 1 [18]. Este marco también es aplicable al análisis de estudios observacionales n de 1, donde el orden de las fases de tratamiento no es aleatorio y puede verse afectado por factores de confusión [19].

Algunos estudios han evaluado y comparado diferentes métodos para el análisis. Por ejemplo, Stunnenberg et al. [3] aplicaron modelos mixtos lineales frecuentistas y modelos bayesianos, y compararon los enfoques en un estudio sobre el efecto de la mexiletina sobre la rigidez muscular en pacientes con miotonía no distrófica. Zucker et al. [20] compararon modelos de medidas repetidas, modelos jerárquicos bayesianos y modelos cruzados de resultados promediados, de un solo período y de un solo par más simples en el análisis de una serie publicada de ensayos N de 1 sobre tratamientos reumatólicos. Sus resultados mostraron que, dependiendo de los supuestos, diferentes modelos mixtos produjeron el mejor ajuste y que los modelos bayesianos eran sensibles a la especificación de los antecedentes. Chen y Chen [15] compararon pruebas t y modelos mixtos en un estudio de simulación en el que no había transferencia, y encontraron que las pruebas t arrojaban la mayor potencia bajo este supuesto. Finalmente, Araujo et al. [21] ampliaron el trabajo de Chen y Chen y consideraron pruebas t y modelos lineales mixtos bajo diferentes supuestos del modelo en el diseño del estudio, centrándose en cómo el diseño del estudio incorporó la aleatorización.

En este estudio, nos centramos en dos desafíos particulares para el análisis de ensayos N-de-1 agregados: (i) transferencia y (ii) dependencias complejas e interacciones variables en el tiempo del efecto del tratamiento con covariables. En primer lugar, como un paciente no puede recibir dos tratamientos al mismo tiempo, el tratamiento varía en el tiempo. Esto puede introducir un efecto remanente (es decir, que el efecto de un tratamiento sigue activo cuando se aplica el otro), complicando el análisis de los ensayos y la interpretación de los resultados. Como solución, se pueden introducir períodos de lavado en el diseño del estudio, en los que el paciente no recibe ninguno de los tratamientos. Sin embargo, esto no siempre es posible, por lo que es necesario investigar los métodos estadísticos para determinar su solidez frente al arrastre conocido o desconocido. En segundo lugar, para el análisis agregado de ensayos N de 1, los efectos del tratamiento a menudo pueden depender de covariables, su efecto podría verse modificado por ellas, y esto podría complicarse aún más si existen interacciones que varían en el tiempo entre el tratamiento y los modificadores del efecto. Es necesario considerar la transferencia y dependencias tan complejas para garantizar estimaciones imparciales de los efectos causales del tratamiento, pero no se dispone de recomendaciones de mejores prácticas [22].

Nuestro artículo está organizado de la siguiente manera. En la sección Métodos, describimos un modelo general de generación de datos y cómo lo aplicamos para generar datos para nuestro estudio de simulación. Luego, describimos los modelos estadísticos evaluados que incluyen nuestro modelo paramétrico ajustado por transferencia recientemente propuesto (COAPM). En la sección Resultados, describimos los resultados del estudio de simulación que evalúa el desempeño de estos métodos estadísticos en cuatro escenarios. Concluimos con una discusión en la sección Discusión.

A continuación, investigamos diferentes métodos estadísticos para el análisis de ensayos N de 1 agregados en conjuntos de datos simulados que contienen diferentes niveles de dependencias de covariables de tratamiento y transferencia. Además, comparamos los métodos en conjuntos de datos con y sin datos faltantes debido al abandono de los participantes. Como métodos tradicionales, incluimos una comparación de medias muestrales y un modelo de regresión lineal en el análisis [1, 11]. Además, introducimos un modelo paramétrico que modela específicamente cómo el arrastre modifica el efecto del tratamiento. Finalmente, consideramos las redes bayesianas [23] y la estimación G [18, 24].

Para evaluar y comparar los diferentes métodos estadísticos, realizamos un estudio de simulación Monte Carlo. A continuación, describimos la configuración del estudio de simulación que incluye el modelo de generación de datos, una aplicación específica del modelo de generación de datos para generar datos sintéticos de una serie de ensayos N de 1 sobre dolor lumbar crónico inespecífico y los diferentes métodos estadísticos evaluados. El modelo de generación de datos está disponible a través del paquete Python sinot (https://github.com/HIAlab/sinot) y los métodos estadísticos se implementan en el paquete R cinof1 (https://github.com/HIAlab/cinof1).

En el modelo de simulación, combinamos la generación de datos basada en procesos estocásticos, efectos de tratamiento que varían en el tiempo y dependientes de covariables, y efectos sobre la variable de resultado integrada en un gráfico causal. Para la notación siguiente, sea Z cualquiera de las variables de nuestro modelo, incluido el resultado O, el tratamiento T u otras variables C.

Primero, incorporamos la variable de resultado O y la variable de tratamiento T en un gráfico acíclico dirigido (DAG) con variables adicionales C, que pueden ser constantes o variables en el tiempo, y pueden simularse a partir de varias distribuciones comunes como Bernoulli, Gaussiana, Poisson o uniforme. Las variables que no varían en el tiempo no cambiarían con el tiempo y describirían, por ejemplo, datos demográficos o condiciones iniciales como el diagnóstico previo (de dolor lumbar inespecífico). Las variables que varían en el tiempo pueden cambiar en cada observación y podrían ser mediciones como el número de pasos por día.

Incluimos efectos lineales de las variables \(Z_j\) en \(Z_i\) en el punto de tiempo \(t, t\ge 0\), donde i y j indexan variables distintas:

donde \(w_{j,i}\) denota el efecto causal lineal de \(Z_j\) sobre \(Z_i\) y \(\varepsilon _i\) denota algún ruido aleatorio con media \(\mu _i\) y varianza \(\sigma _i^2\), \(\varepsilon _i \sim N(\mu _i, \sigma _i^2)\). Un período de tratamiento puede consistir en uno o más puntos de tiempo, es decir, días en nuestra simulación.

Para simular variables binarias, definimos un umbral \(\lambda _i \in \mathbb {R}\) y aplicamos una función escalonada f definida como:

Se pueden agregar dependencias de tiempo a la simulación de datos dejando que la variable \(Z^{t}_{i}\) dependa de los valores ponderados de \(Z_{j}\) en los puntos de tiempo \((tl)\) , es decir, agregando retrasos l:

donde L es un conjunto no vacío de números enteros mayores o iguales a 0 y menores o iguales a t.

Las variables de tratamiento T tienen una caída exponencial definida a través del lavado \(\tau\) y el lavado \(\gamma\) para simular el arrastre, similar a Percha et al. [25] (consulte la figura complementaria FS1 para ver una ilustración). Daza describió el arrastre como un inicio lento y una lenta decadencia [18].

Después de extraer las variables exógenas de distribuciones preespecificadas, las variables endógenas se generan en función de los pesos asumidos \(w_{j,i}\) y el DAG.

Para simular el resultado O, modelamos un estado subyacente U con una deriva de referencia como un proceso estocástico de tiempo discreto (proceso de Wiener); consulte el Texto complementario 1 y la Fig. FS2 para obtener más detalles. La deriva de la línea de base aquí describe el cambio observado a lo largo del tiempo en la variable de resultado si no se trata, lo que puede ser una tendencia temporal en casos específicos (consulte el Texto complementario 1 para obtener más detalles). Entonces, O en el momento t es una combinación lineal de los efectos causales de las otras variables y el estado subyacente:

donde \(\varepsilon _o \sim N(\mu _o, \sigma _o^2)\), \(U^t\) denota el estado subyacente en el punto de tiempo t y \(Z^{t}_{i= o}\) denota los efectos causales lineales definidos en el DAG de todas las covariables sobre la variable de resultado O en el momento t como se define en la ecuación 3.

Para el estudio de simulación, nuestro objetivo es generar un conjunto de datos sintéticos realistas a partir de una serie de ensayos N de 1, comparando el efecto de los ejercicios diarios para la fuerza de la espalda (Tratamiento 1) con el efecto de los ejercicios diarios para el estiramiento de la espalda (Tratamiento 2) sobre la reducción de la variable de resultado Dolor lumbar crónico inespecífico. Suponemos que el dolor se mide diariamente. El estudio incluye dos bloques de dos periodos de tratamiento cada uno.

Establecimos cada período de tratamiento en una duración de 4 semanas. El orden de los períodos se selecciona aleatoriamente dentro de cada bloque de tratamiento. Un esquema de estudio ejemplar podría parecerse a ABBA o ABAB, donde AB (o BA) sería un bloque con dos períodos de tratamiento y una duración total del estudio de 4x4 = 16 semanas. Además, el estudio contiene una evaluación basal del uso de medicamentos y diferentes variables sociodemográficas. Identificamos estas variables en una revisión de la literatura que incluyó [26] y entrevistas a expertos.

La demografía abarca variables de género y edad al inicio del estudio, que se modelan como variables constantes en todos los momentos. La educación evalúa si el paciente tenía un título académico o estaba inscrito en un programa académico. La variable Trabajo identifica si el paciente está trabajando o no. Tanto el Trabajo como la Educación se suponen constantes en todos los puntos temporales. El estado de salud se evalúa incluyendo mediciones diarias de medicación (que identifica si un paciente estaba usando analgésicos), diagnóstico previo (de dolor lumbar inespecífico) y enfermedades crónicas (que indica si a un paciente se le han diagnosticado enfermedades crónicas relacionadas, por ejemplo, escoliosis). o trastornos musculares). Además del estado de salud, se realiza un seguimiento diario de los factores del estilo de vida, incluida la actividad física, los niveles de estrés y la calidad del sueño.

Creamos un DAG con las relaciones causales asumidas entre todas las variables identificadas, ver Fig. 1, basado en una revisión de la literatura y el conocimiento de expertos. Asumimos efectos de la Demografía sobre Educación, Actividad, Trabajo, Diagnóstico Previo, Medicación y Enfermedades Crónicas. Además, asumimos que no existe un efecto causal directo de los datos demográficos sobre el dolor lumbar inespecífico, sino un efecto mediado por variables indirectas, lo que conduce a caminos causales indirectos desde los datos demográficos hasta el dolor lumbar inespecífico a través, por ejemplo, de la actividad. Suponemos que el tratamiento tiene un efecto sobre el estrés, la calidad del sueño y el dolor lumbar inespecífico. Asumimos que el Tratamiento no afecta la Demografía, la Educación, el Trabajo, las Enfermedades Crónicas, la Medicación y el Diagnóstico Previo, ya que se supone que son constantes en el tiempo. Como se describirá con más detalle en la siguiente sección de Conjuntos de datos generados, modelamos una dependencia compleja del efecto del tratamiento sobre la Actividad (ver Fig. 3).

DAG de efectos causales supuestos en el estudio simulado. Las variables que tienen un efecto directo o indirecto sobre la Actividad se resaltaron en cuadros rojos ya que Actividad es un término de interacción en el escenario 3. La variable Tratamiento está resaltada en verde

Estos efectos se resumen en el DAG que se muestra en la Fig. 1 y se utilizan para generar los datos. Además de las dependencias que se muestran en el gráfico, se especifican dependencias de tiempo: la calidad del sueño y la actividad dependen del tratamiento en el momento anterior.

Con base en el modelo de generación de datos, el diseño del estudio de dolor lumbar inespecífico, el DAG que se muestra en la Fig. 1 y las dependencias temporales entre las variables descritas anteriormente, generamos conjuntos de datos en cuatro escenarios diferentes, que se muestran en la Tabla 1.

Todos los escenarios incluyen efectos covariables siguiendo el DAG en la Fig. 1, con la excepción de las interacciones y efectos temporales entre Actividad y Tratamiento, que solo se incluyen en algunos escenarios (es decir, 3 y 4). En el escenario 1, generamos los datos como conjunto de datos de referencia para todos los métodos y no incluimos transferencias, dependencias de tiempo ni interacción entre Actividad y Tratamiento. En el escenario 2, los datos se simulan con transferencia, de modo que el efecto del tratamiento depende en gran medida del tiempo dentro de un período de tratamiento a medida que agregamos fases de entrada y salida.

En el escenario 3, se modela en la simulación una dependencia compleja del efecto del Tratamiento sobre la Actividad Física además de las covariables que se muestran en la Fig. 1. La variable de Tratamiento observada que indica si el paciente está expuesto al Tratamiento o no no se ve afectada por la Actividad Física. , pero el efecto del tratamiento subyacente se modifica mediante \(w_{A,T}\). Con eso, hemos modelado una interacción de Tratamiento y Actividad. Además, existe un efecto temporal del tratamiento en \(tl\) sobre la actividad en t, de modo que la distribución de la actividad difiere entre los grupos de tratamiento. En el escenario 4, generamos un conjunto de datos con interacciones tanto de transferencia como de Tratamiento-Actividad como en el escenario 3.

Si el borde de una variable j a una variable i está presente en el DAG, el efecto se establece en \(w_{j,i} \ne 0\). Si el borde no está presente en el DAG, representa nuestra suposición de que no hay efecto de \(Z_j\) en \(Z_i\); equivalentemente \(w_{j,i}=0\). Las dependencias temporales se simulan de la misma manera, donde establecemos \(w^{l}_{j,i} \ne 0\) cuando asumimos una dependencia temporal entre la variable \(Z_{j}^{tl}\ ) y la variable \(Z_{i}^{t}\). Para todos los escenarios, los efectos son idénticos excepto por las especificaciones mencionadas en la Tabla 1. Los efectos del tratamiento se establecieron constantes a lo largo del tiempo. El efecto del tratamiento 1 sobre el resultado se fijó en -2, y el del tratamiento 2 sobre el resultado en -4, ambos en comparación con ningún tratamiento (es decir, deriva inicial y efectos de covariables). Por lo tanto, esto da como resultado una diferencia en el efecto del tratamiento de 2 entre los tratamientos (consulte el Texto complementario 2 para obtener más detalles).

Además de estos cuatro escenarios, investigamos más a fondo cómo funcionan los métodos en conjuntos de datos con valores faltantes replicando los 4 escenarios con valores faltantes. Para esto, utilizamos los mismos parámetros e introducimos valores faltantes en filas (es decir, en todas las variables de un individuo) a través de dos mecanismos. El primer mecanismo elimina \(10\%\) de los puntos de datos aleatoriamente con mayor probabilidad a lo largo del tiempo para imitar el abandono aleatorio. En segundo lugar, agregamos un bloque de 10 días faltantes consecutivos que se extrajeron al azar para cada paciente para simular vacaciones (consulte el Texto complementario 3 para obtener más detalles).

Como se describió en la sección anterior, generamos conjuntos de datos a partir de 4 escenarios diferentes, cada uno de los cuales es una serie de ensayos N de 1 sobre dolor lumbar crónico inespecífico con 1000 participantes. Para la evaluación de los modelos estadísticos, en cada escenario, extraemos 100 muestras de 5, 10, 25, 50 y 100 participantes cada una, para investigar también la influencia del tamaño de la muestra en ensayos agregados N de 1. Luego aplicamos diferentes modelos estadísticos y evaluamos su sesgo y eficiencia al estimar la diferencia del efecto del tratamiento en los resultados entre los grupos de tratamiento 1 y 2 en todos los participantes. Comparamos modelos estadísticos estándar para el análisis de ensayos N-de-1 agregados, COAPM, estimación G y redes bayesianas.

Primero, calculamos las medias muestrales de ambos grupos de tratamiento y la estimación ingenua de la diferencia del efecto del tratamiento. A esto lo llamamos modelo de media muestral. Su error estándar se estima como la desviación estándar empírica de la diferencia estimada del efecto del tratamiento entre las 100 muestras.

En segundo lugar, ajustamos un modelo de regresión lineal múltiple estándar con el dolor como variable de respuesta y el tratamiento y las covariables como predictores. A esto lo llamamos modelo lineal. Por lo tanto, \(\hat{\beta }_1\) en el modelo (6) es una estimación del efecto directo promedio del tratamiento T sobre el resultado del dolor O ajustado para todas las covariables C en la Fig. 1 con efectos directos sobre el resultado. (es decir, excluyendo datos demográficos). Es decir, \(\hat{\beta }_1\) es una estimación del efecto directo de T sobre O:

donde \(\varepsilon\) sigue una distribución normal. Para la implementación, utilizamos la función lm en R del paquete base con configuración predeterminada, asumiendo independencia entre observaciones de diferentes pacientes, para calcular estimaciones de mínimos cuadrados ordinarios no ponderados de los coeficientes de regresión, junto con estimaciones de error estándar y resultados de la prueba de Wald. . Luego, las estimaciones del efecto se promedian entre las 100 muestras como la media empírica, y las estimaciones del error estándar se estiman como la desviación estándar empírica de las estimaciones del efecto.

Para reducir el sesgo debido al arrastre, ajustamos el modelo de regresión lineal múltiple para el lavado \(\tau _k\) y el lavado \(\gamma _k\), donde \(k=1\) indica el tratamiento 1 y \(k=2\) indica el tratamiento 2. Para eso, incluimos una variable continua de efecto del tratamiento dependiente del tiempo en lugar de la variable binaria de asignación de tratamiento. A esto lo llamamos modelo paramétrico ajustado por arrastre (COAPM).

Sea \(T_{k}^t\) indicar si el paciente estuvo expuesto al tratamiento k en el momento t y sea \(E_{k}^{t}\) el indicador de tratamiento de decadencia exponencial, que parametrizamos dado \ (\tau _k\) y \(\gamma _k\):

para \(t \ge 1\). Inicializamos \(E^0_{k=1}=E^0_{k=2}=0\), ya que asumimos que no hay efecto del tratamiento en el punto inicial del estudio. Por ejemplo, considere el tratamiento \(k=1\) y el lavado \(\tau _1 = 2\). Entonces, \(E_1^1 = 1/2, E_1^2 = 3/4, E_1^3 = 7/8, \puntos\). Es decir, en lugar de utilizar un indicador de tratamiento T que toma valores 0 o 1, \(E_{k}\) es un indicador de tratamiento que incorpora lavado de entrada y lavado a través de decaimiento exponencial y apunta al valor 1 (para lavado -in) o 0 (para lavado). Luego estimamos el efecto promedio de cada tratamiento a lo largo del tiempo usando el siguiente modelo de regresión lineal:

Con eso, \(\hat{\beta }_1\) estima el efecto promedio ajustado del tratamiento 1 en comparación con ningún tratamiento (es decir, ni el tratamiento 1 ni el tratamiento 2, que sería el valor inicial), y \(\hat{ \beta }_2\) el efecto promedio ajustado del tratamiento 2 en comparación con ningún tratamiento. En comparación con el modelo de la Ecuación 6, el COAPM estima el efecto de \(E_k^t\), arrojando una estimación del efecto de tratamiento ajustado por arrastre en lugar de la variable indicadora de tratamiento \(T_k\). Por lo tanto, \(\hat{\beta }_1 - \hat{\beta }_2\) es una estimación de la diferencia del efecto del tratamiento ajustada por el arrastre.

Como \(E_k\) es una función de \(\tau _k\) y \(\gamma _k\) que son desconocidas, se aproxima mediante una búsqueda en cuadrícula. Con más detalle, iteramos sobre varias combinaciones de \(\tau _k\) y \(\gamma _k\) y ajustamos un modelo lineal para cada combinación. Luego, estimamos \(\tau _k\) y \(\gamma _k\) del modelo con el valor \(R^2\) más alto. Las estimaciones de \(\beta _1\) y su error estándar se obtienen del modelo final con \(R^2\) más alto, utilizando la función lm en R con la configuración predeterminada. Luego se promedian las estimaciones del efecto y las estimaciones del error estándar en las 100 muestras.

A modo de ilustración, la Fig. 2 muestra los efectos del tratamiento para dos tratamientos con arrastre y el efecto general del tratamiento resultante, que se puede calcular como la suma de los dos efectos del tratamiento \(E_{k}^{t} (T_k, \tau _k,\gamma _k)\). Como el efecto general del tratamiento observado contiene los efectos de ambos tratamientos, sobreestima o subestima los efectos del tratamiento.

Ilustración de los efectos del tratamiento con transferencia para un paciente simulado. El paciente estuvo expuesto al tratamiento 1 hasta el día 14. A partir del día 14, el efecto del tratamiento 1 desaparece y converge a 0 ya que el tratamiento ya no se administra. En este punto, el paciente inició el segundo período de tratamiento. Al estar expuesto al tratamiento 2, el efecto del tratamiento 2 se manifiesta y lleva tiempo hasta que alcance el efecto completo en el resultado.

Las redes bayesianas son redes gráficas en las que se estiman las distribuciones de probabilidad conjunta y condicional dadas por el DAG asumido y se pueden utilizar para inferencia. A esto lo llamamos modelo de red bayesiana no ajustada. Para considerar las dependencias del tiempo, especificamos rezagos de tamaño 1 para la variable de tratamiento y para el dolor lumbar inespecífico (ver Fig. 3). Estos retrasos se crean durante el preprocesamiento y se incluyen en el análisis como variables adicionales. A esto lo llamamos modelo de red bayesiana con ajuste de tiempo.

El DAG muestra la estructura de red supuesta entre los nodos Actividad (A), Tratamiento (T) y Dolor lumbar inespecífico (O) en el punto de tiempo t que se modela en la red bayesiana con ajuste de tiempo con retrasos. Con eso, el modelo tiene en cuenta la Actividad como variable de confusión, aunque no la simulamos. Este es un fragmento de las relaciones entre estas tres variables e integrado en la red más grande de la Fig. 1.

Para la implementación se utiliza el paquete bnlearn. En el primer paso, implementamos una interfaz para convertir el gráfico DAGitty a una red bayesiana y definimos la escala apropiada de cada variable. Luego, la red bayesiana se ajusta a los datos con la función bnlearn::bn.fit con la configuración predeterminada. Estimamos los parámetros por la media empírica de su distribución posterior utilizando el argumento método = "bayes". Para estimar la diferencia promedio en el efecto del tratamiento, utilizamos la función bnlearn::cpdist de la red ajustada [27], y primero generamos dos muestras aleatorias de pacientes bajo el tratamiento 1 y bajo el tratamiento 2, cada una de tamaño 1000 mediante ponderación de probabilidad dada la duración del tratamiento. y las variables de confusión tienen distribuciones de confusión iguales entre los grupos de tratamiento. Luego, estimamos la diferencia promedio del efecto del tratamiento mediante la diferencia media de resultados entre las dos muestras aleatorias. La estimación del error estándar de la diferencia estimada del efecto del tratamiento se calcula como la desviación estándar del efecto promedio estimado del tratamiento en las 100 muestras.

En el análisis aplicamos dos redes bayesianas. El primer modelo se monta en el DAG sin dependencia temporal. El segundo modelo incluye además los retrasos para modelar las dependencias del tiempo como se describe anteriormente.

La estimación G estima los efectos promedio del tratamiento (en nuestro caso, las diferencias promedio del efecto del tratamiento entre grupos de tratamiento) en resultados potenciales en un modelo de media anidada estructural [24, 28], y se puede aplicar a variables de tratamiento que varían e invariantes en el tiempo. [29,30,31].

En el modelo estructural de media anidada, siguiendo la notación de Hernán y Robins (2019), modelamos la diferencia condicional esperada entre el resultado potencial bajo el tratamiento k, \(O^k\), y el resultado potencial bajo la condición inicial, \( O^{k=0}\), como

donde \(\beta _k\) cuantifica el efecto promedio del tratamiento k en comparación con el valor inicial \(k=0\), C incluye todas las variables (con efecto directo o indirecto sobre el resultado) observadas en el conjunto de datos, y \(T_k \) indica si se dio el tratamiento \(k=1\) o el tratamiento \(k=2\). En este modelo, no incorporamos una interacción entre el tratamiento y las covariables ni ajustes por tratamiento dependiente del tiempo como en el COAPM. Entonces, la diferencia promedio del efecto del tratamiento entre los tratamientos \(k=1\) y \(k=2\) es \(\mathbb {E}[O^{2} - O^{k=0} | T=2 , C] - \mathbb {E}[O^{1} - O^{k=0} | T=1, C] = \beta _2 - \beta _1\).

Para estimar esta diferencia promedio del efecto del tratamiento usando la estimación G, buscamos \(\psi\) que minimice \(|\theta _1|\) en la siguiente ecuación:

donde \(\psi\) es el efecto causal individual inducido por el correspondiente modelo supuesto de preservación de rango y \(H(\psi )\) se define como \(H(\psi ) = O -\psi T\). Suponemos que se cumple el supuesto de intercambiabilidad condicional, lo que implica que \(|\theta _1|\) debe ser 0 en el verdadero \(\psi\). De esta manera, minimizar \(|\theta _1|\) nos permite estimar el verdadero \(\psi\). Suponemos que se cumple la preservación del rango aditivo condicional, de modo que \(\psi = \beta _1\), el efecto de tratamiento promedio de interés.

En comparación con la red bayesiana con ajuste de tiempo y la red bayesiana no ajustada, no utilizamos retrasos en este modelo. Aquí, utilizamos ecuaciones de estimación generalizadas con independencia y estructura de correlación de trabajo de orden autorregresivo 1 (AR1) del paquete R geepack [32] para ajustar la ecuación 10. A estas las llamamos estimación G (independencia) y estimación G (AR1). modelos, respectivamente. En el modelo basado en la matriz de correlación AR1 en las ecuaciones de estimación generalizadas, el valor de la diferencia del efecto estimado se basa en la diferencia entre los efectos del tratamiento que incorporan el lavado introducido. La estimación del error estándar de la diferencia estimada del efecto del tratamiento se calcula como la desviación estándar del efecto promedio estimado del tratamiento en las 100 muestras.

Como se describe en la sección Conjuntos de datos generados, consideramos cuatro escenarios diferentes en el estudio de simulación. En cada escenario, todos los métodos se evaluaron en 100 muestras de 5, 10, 25, 50 y 100 pacientes, respectivamente. La Figura 4 muestra las estimaciones medias de la diferencia del efecto del tratamiento para todos los modelos, en todos los escenarios, con y sin valores faltantes, junto con sus respectivas estimaciones de error estándar. El texto complementario 4 proporciona los valores numéricos trazados y otros detalles.

Descripción general de las estimaciones de las diferencias en el efecto del tratamiento (eje y), con un valor verdadero de 2 (línea horizontal roja discontinua), con barras de error estándar, en los cuatro escenarios (1-4 mostrados en orden de arriba a abajo) con y sin valores perdidos, para diferentes tamaños de muestra en el eje x

En el primer escenario sin interacción de Actividad y sin arrastre, todos los métodos proporcionan estimaciones insesgadas de la verdadera diferencia de 2 en el efecto del tratamiento. Como se puede esperar, las estimaciones son más eficientes; es decir, tenía errores estándar más pequeños para tamaños de muestra más grandes. Para el tamaño de muestra más pequeño con 5 pacientes, el modelo de estimación G (AR1) subestima ligeramente el efecto del tratamiento ya que supone autocorrelación, que no está presente en este escenario. Para los datos con valores faltantes, los modelos también proporcionaron estimaciones insesgadas del efecto del tratamiento, con errores estándar esperados ligeramente mayores ya que tenemos menos observaciones.

En el segundo escenario, investigamos las influencias del lavado de entrada y del lavado de nuestras variables de tratamiento. Con estos, el verdadero efecto del tratamiento simulado aumenta ligeramente con el tiempo hasta alcanzar el efecto completo del tratamiento para cada tratamiento en comparación con ningún efecto (es decir, cero). Como resultado, el modelo de media muestral, el modelo lineal, la estimación G (independencia) y la red bayesiana con ajuste de tiempo subestiman la diferencia del efecto del tratamiento simulado de 2. A medida que el efecto del tratamiento aumenta con el tiempo hasta alcanzar el tamaño total del efecto, los modelos no pudieron estimar el tamaño del efecto del tratamiento simulado. En comparación con la red bayesiana no ajustada, esperábamos que la red bayesiana con ajuste de tiempo mejorara la diferencia estimada del efecto del tratamiento, lo que no se reflejó en los resultados ya que el modelo no mejoró la estimación y también subestimó la diferencia del efecto del tratamiento. La estimación G (AR1) supone una estructura de dependencia AR1 dentro de los datos, violada mediante la caída exponencial. Por lo tanto, subestima fuertemente el efecto del tratamiento en la simulación con transferencia. El único modelo que produce estimaciones insesgadas de la diferencia del efecto del tratamiento para todos los tamaños de muestra fue el COAPM con parámetros de entrada y salida, que está cerca del proceso de simulación de datos.

Dentro del conjunto de datos con valores faltantes, el COAPM tiende a sobreestimar el efecto del tratamiento. Los otros modelos tuvieron un desempeño similar (con respecto al sesgo) cuando faltaban valores en comparación con los que no faltaban, pero con errores estándar ligeramente mayores.

En este escenario, estamos considerando dependencias complejas del efecto del tratamiento en la actividad. Como era de esperar, el modelo de media muestral subestima en gran medida el efecto del tratamiento para todos los tamaños de muestra. El modelo lineal, COAPM, Estimación G (AR1) y Estimación G (independencia) proporcionan estimaciones insesgadas para todos los tamaños de muestra. Sorprendentemente, tanto la Red Bayesiana con ajuste de tiempo como la Red Bayesiana no ajustada subestiman ligeramente la diferencia del efecto del tratamiento, que se vuelve más evidente para tamaños de muestra más grandes. Podría ser que los antecedentes no fueran informativos en este escenario o que el número de ciclos fuera demasiado pequeño. Como otra observación, tanto la Red Bayesiana con ajuste de tiempo como la Red Bayesiana no ajustada producen errores estándar mayores en comparación con los modelos lineales. Esto podría deberse al hecho de que modelamos la Actividad como un modificador de efecto y con dependencias temporales. Al aumentar el tamaño de la muestra, todos los errores estándar disminuyen. En este escenario, los valores faltantes producen errores estándar ligeramente mayores.

El último escenario investigado contiene tanto transferencia como interacción de actividad. Observamos que tanto la media de la muestra como la estimación G (AR1) subestiman fuertemente el efecto del tratamiento, tanto para datos completos como para datos con valores faltantes. Tanto la Red Bayesiana con ajuste de tiempo como la Red Bayesiana sin ajustar proporcionan estimaciones de la diferencia del efecto del tratamiento de aproximadamente 1,5, por lo que subestiman la diferencia del efecto, y también producen errores estándar mayores en comparación con los otros métodos, como ya se vio en el escenario 3. La Red Bayesiana con ajuste de tiempo produce resultados ligeramente mejores que la red bayesiana no ajustada, pero no proporciona una mejora importante. El modelo lineal y la estimación G (independencia) proporcionan estimaciones del efecto del tratamiento menos sesgadas, pero también subestiman la diferencia del efecto del tratamiento. Finalmente, el COAPM vuelve a arrojar buenos resultados en este escenario. En todos los tamaños de muestra con datos completos, este modelo produce estimaciones insesgadas de la diferencia del efecto del tratamiento. Cuando faltan puntos de datos, este modelo sobreestima ligeramente el efecto del tratamiento.

En general, COAPM produce resultados sólidos, los mejores resultados entre todos los modelos considerados, en todos los escenarios con datos completos. Sin embargo, cuando faltan datos y hay transferencias, este enfoque tiende a sobreestimar la diferencia en el efecto del tratamiento. Los modelos lineales y las pruebas t de 2 muestras son sólidos frente a los valores faltantes simulados, pero producen estimaciones del efecto sesgadas cuando existe un fuerte arrastre, ya que no se ajustan para tenerlo en cuenta. Además, la media muestral produce estimaciones sesgadas del efecto cuando está presente la interacción de la Actividad. Las redes bayesianas y la estimación G muestran un buen rendimiento general, pero las redes bayesianas producen intervalos de confianza más amplios de las estimaciones de efectos, especialmente para tamaños de muestra pequeños.

En este estudio, como primera contribución, demostramos cómo simular datos para una serie de ensayos N de 1 combinando procesos estocásticos con efectos de tratamiento que varían en el tiempo integrados en un DAG. En nuestros complejos modelos de simulación, hicimos suposiciones sobre la estructura causal subyacente al dolor lumbar crónico inespecífico y brindamos recomendaciones para análisis que pueden traducirse en una serie real realizada de ensayos N de 1. Como contribución principal, evaluamos y comparamos diferentes modelos para estimar el efecto del tratamiento en presencia de arrastre, dependencias complejas del efecto del tratamiento sobre las covariables y valores faltantes. Estos resultados pueden proporcionar pautas sobre qué métodos deben usarse en aplicaciones prácticas, y proporcionamos el paquete R cinof1 (disponible en https://github.com/HIAlab/cinof1) con una implementación de todos los métodos investigados.

Uno de nuestros principales hallazgos es que los modelos estadísticos simples pueden proporcionar estimaciones de tratamiento imparciales en diferentes escenarios. Además, mostramos que si el arrastre está presente y el diseño del estudio no lo ha evitado (por ejemplo, al incluir fases de lavado), aún es posible obtener estimaciones insesgadas del efecto del tratamiento cuando el arrastre se modela en el análisis. . Esto añade una perspectiva novedosa e interesante, en contraste con estudios anteriores que se han centrado en gran medida en la eliminación del arrastre a través del diseño del estudio y han recomendado no realizar ajustes por arrastre en el modelado estadístico [21]. Para esta situación, proporcionamos un método simple llamado COAPM para incorporar el arrastre en modelos de regresión lineal. COAPM produce estimaciones insesgadas incluso si hay un fuerte arrastre, pero requiere datos completos. Finalmente, nuestros resultados mostraron que la estimación G y tanto la red bayesiana con ajuste de tiempo como la red bayesiana no ajustada pueden proporcionar estimaciones de tratamiento insesgadas y eficientes, pero adolecen de limitaciones en algunos escenarios.

Los métodos simples, como las comparaciones de medias muestrales y los modelos lineales, son fáciles de aplicar y evaluar. También son resistentes a los valores faltantes y aplicables a cualquier tamaño de muestra, y ofrecen buenos resultados en los conjuntos de datos sin una fuerte transferencia y sin dependencias de la actividad del tratamiento. Esto está en línea con los resultados de estudios previos de que las pruebas t arrojan resultados sólidos y válidos [15, 21]. Por otro lado, las comparaciones de medias muestrales no tienen en cuenta el arrastre ni las dependencias temporales, y no arrojaron buenos resultados en presencia de factores de confusión. Los modelos lineales obtuvieron mejores resultados, pero no tienen en cuenta el arrastre.

Para modelar el arrastre, introducimos COAPM para lavado y lavado. Produce estimaciones insesgadas para la diferencia de los efectos del tratamiento en todos los conjuntos de datos, excepto en algunos escenarios en los que faltan datos. En este caso, sobreestima los efectos del tratamiento, pero aún tiene menos sesgo que todos los demás métodos. Todos los demás métodos investigados no pueden producir estimaciones imparciales del efecto del tratamiento cuando hay transferencia. Como el COAPM estuvo cerca de la simulación de datos, arrojó los mejores resultados en los diferentes escenarios.

La estimación G funcionó de manera muy similar a los modelos lineales no ajustados por arrastre, lo que produjo estimaciones insesgadas del efecto del tratamiento en muchos escenarios cuando no hay arrastre, y es robusta ante los valores faltantes. Sin embargo, la forma en que se especifica la estructura de correlación GEE resultó ser muy importante, y AR1 produce estimaciones en gran medida sesgadas cuando hay transferencia, ya que los períodos de entrada y salida se simulan a través de una caída exponencial y no como un proceso AR1. Fue interesante observar esto, ya que se podría plantear la hipótesis de que incluso una correlación de trabajo AR1 mal especificada puede hacer que el estimador GEE sea más eficiente estadísticamente. Pero esto no se observó en los resultados, por lo que parece que la especificación errónea jugó un papel más importante y el pequeño tamaño de la muestra también podría haber contribuido.

Finalmente, investigamos dos implementaciones tanto de la Red Bayesiana con ajuste de tiempo como de la Red Bayesiana no ajustada que muestran resultados sólidos con respecto a las variaciones en el tamaño de la muestra y los valores faltantes cuando no hay transferencia, similar a la Estimación G. Curiosamente, la red bayesiana con ajuste de tiempo no superó a la red bayesiana no ajustada. En la Red Bayesiana con ajuste de tiempo, incluimos rezagos de 1 en la red. Sin embargo, la caída exponencial utilizada en la simulación tiene en cuenta múltiples estados previos del tratamiento, que no se reflejan en el modelo. Nuestra hipótesis es que esta especificación errónea de la dependencia del tiempo condujo al pobre desempeño de este modelo. Para ajustar redes bayesianas, en un primer paso se debe construir un gráfico. Esto puede calcularse basándose en los datos, pero no se recomienda (24, Capítulo 6.5). Se prefiere asumir un DAG preespecificado para la interpretabilidad, similar a todos los demás métodos investigados. Además, el DAG sirve para garantizar la generalización, ya que no se construye sobre los datos de la muestra sino a priori. Cabe señalar que obtuvimos estimaciones de parámetros de redes bayesianas para comparar los resultados con los otros métodos de este estudio; sin embargo, la distribución posterior completa de los parámetros se estima en redes bayesianas, lo que permite realizar otros análisis e interpretaciones si se desea.

Una limitación de nuestro estudio de simulación es que solo incluimos dependencias lineales y efectos fijos. En los estudios de seguimiento, se podrían incorporar dependencias no lineales y modelos de efectos aleatorios para proporcionar modelos de datos aún más realistas. La aplicación de dolor lumbar inespecífico que consideramos proporcionó una prueba compleja N de 1 y requirió una generación compleja del DAG y una simulación. Para este estudio, generamos una variable de resultado medida en una escala ordinal. Sin embargo, en el análisis modelamos la variable como un resultado gaussiano truncado. Si bien esto proporciona cierta especificación errónea de todos los modelos que investigamos, elegimos esta evaluación para imitar una situación que ocurre muy a menudo en los análisis prácticos. En los estudios de seguimiento se pueden investigar otras distribuciones de resultados y otros modelos estadísticos para el análisis. Además, el diseño del estudio, el número de ciclos, la duración de los períodos de tratamiento y los períodos iniciales pueden afectar el rendimiento del modelo, pero no fueron investigados en nuestro estudio.

También examinamos el impacto de los valores faltantes. En aplicaciones prácticas, se recomienda incluir alguna forma de imputación, por ejemplo, imputación múltiple. Esto sería especialmente importante para la aplicación de métodos dependientes del tiempo y cuando los datos no faltan por completo al azar.

En los análisis de seguimiento, sería interesante comparar estos métodos en una serie real de ensayos N-de-1 sobre el dolor lumbar crónico inespecífico. Además, métodos adicionales como el emparejamiento por puntuación de propensión y la ponderación de probabilidad inversa podrían ser interesantes para analizar ensayos N de 1 agregados, especialmente cuando faltan datos y sesgo de selección.

Planeamos desarrollar aún más el paquete R con todos los métodos implementados para manejar comprobaciones de plausibilidad e incluir pruebas automatizadas adicionales, y proporcionar un proceso computacionalmente más eficiente para estimar \(\tau _j\) y \(\gamma _j\) en el COAPM. en comparación con la búsqueda de cuadrícula implementada actualmente. Finalmente, creemos que incorporar un ajuste por arrastre en la estimación G o redes bayesianas e investigar el uso de modelos de promedio móvil autorregresivos que incluyen covariables exógenas (ARIMAX), por ejemplo, el modelo ARCO n-de-1 de [19], Además de los métodos para controlar el sesgo de selección, puede proporcionar herramientas aún más potentes y sólidas para estimar los efectos causales del tratamiento en series de ensayos N de 1.

Los conjuntos de datos generados y analizados durante el estudio actual están disponibles en el repositorio HIAlab/sinot en github.com/HIAlab/sinot. El código R y el código Python utilizados para el análisis de este estudio están disponibles en GitHub:

\(\bullet\) Paquete R para el análisis estadístico: github.com/HIAlab/cinof1

\(\bullet\) Paquete Python para la simulación de datos: github.com/HIAlab/sinot

Nikles J, Mitchell G. La guía esencial para los ensayos N de 1 en salud. Dordrecht: Springer; 2015.

Reservar Google Académico

Davidson KW, Silverstein M, Cheung K, Paluch RA, Epstein LH. Diseños experimentales para optimizar tratamientos para individuos: ensayos personalizados N de 1. JAMA Pediatría. 2021;175(4):404–9. https://doi.org/10.1001/jamapediatrics.2020.5801.

Artículo PubMed PubMed Central Google Scholar

Stunnenberg BC, Raaphorst J, Groenewoud HM, Statland JM, Griggs RC, Woertman W, et al. Efecto de la mexiletina sobre la rigidez muscular en pacientes con miotonía no distrófica evaluado mediante ensayos agregados N de 1. JAMA. 2018;320(22):2344. https://doi.org/10.1001/jama.2018.18020.

Artículo CAS PubMed PubMed Central Google Scholar

Punja S, Schmid CH, Hartling L, Urichuk L, Nikles CJ, Vohra S. ¿Metaanalizar o no metaanalizar? Un metanálisis combinado de datos de ensayos N de 1 con datos de ECA sobre anfetaminas y metilfenidato para el TDAH pediátrico. J Clin Epidemiol. 2016;76:76–81. https://doi.org/10.1016/j.jclinepi.2016.03.021.

Artículo PubMed Google Scholar

Blackston J, Chapple A, McGree J, McDonald S, Nikles J. Comparación de ensayos N-de-1 agregados con ensayos controlados aleatorios paralelos y cruzados mediante estudios de simulación. Cuidado de la salud. 2019;7(4):137. https://doi.org/10.3390/healthcare7040137.

Artículo PubMed PubMed Central Google Scholar

Díaz FJ. Utilizar ensayos cruzados de población para mejorar el proceso de decisión con respecto a la individualización del tratamiento en ensayos N de 1. Estadísticas médicas. 2021;40(20):4345–61. https://doi.org/10.1002/sim.9030.

Artículo PubMed Google Scholar

Senn S. Consideraciones sobre el tamaño de la muestra para ensayos n de 1. Métodos estadísticos Med Res. 2019;28(2):372–83. https://doi.org/10.1177/0962280217726801.

Artículo PubMed Google Scholar

Yang J, Steingrimsson JA, Schmid CH. Cálculos del tamaño de la muestra para ensayos n de 1. 2021. arXiv. https://doi.org/10.48550/ARXIV.2110.08970.

Green AL, Shad A, Watson R, Nandi D, Yianni J, Aziz TZ. Ensayos n-de-1 para evaluar la eficacia de la estimulación cerebral profunda en el dolor neuropático. Tecnología de neuromodulación Neural Interf. 2004;7(2):76–81. https://doi.org/10.1111/j.1094-7159.2004.04010.x.

Artículo de Google Scholar

Sierra-Arango F, Castaño DM, Forero JD, Pérez-Riveros ED, Duarte GA, Botero ML, et al. Un ensayo N de 1 aleatorizado controlado con placebo: el efecto del inhibidor de la bomba de protones en el tratamiento de la enfermedad por reflujo gastroesofágico. Can J Gastroenterol Hepatol. 2019;2019:1–9. https://doi.org/10.1155/2019/3926051.

Artículo de Google Scholar

Schmid CH, Duan N, Panel de orientación N-de-1 del Centro de métodos DEcIDE. Diseño estadístico y consideraciones analíticas para ensayos N de 1. En: Kravitz RL, Duan N y el panel de orientación N-of-1 del Centro de métodos DEcIDE, editor. Diseño e implementación de ensayos N de 1: guía del usuario. Rockville: Agencia para la Investigación y la Calidad de la Atención Médica; 2014. pág. 33–53. https://efectivohealthcare.ahrq.gov/products/n-1-trials/research-2014-1/.

Odineal DD, Marois MT, Ward D, Schmid CH, Cabrera R, Sim I, et al. Efecto de la participación en el ensayo N-de-1 asistido por dispositivos móviles sobre la prescripción de analgésicos para el dolor crónico: ensayo controlado aleatorio. J Gen Intern Med. 2019;35(1):102–11. https://doi.org/10.1007/s11606-019-05303-0.

Artículo PubMed PubMed Central Google Scholar

Vrinten C, Lipka AF, van Zwet EW, Schimmel KJM, Cornel MC, Kuijpers MR, et al. Efedrina como terapia complementaria para pacientes con miastenia gravis: protocolo para una serie de ensayos n de 1 aleatorizados y controlados con placebo. Abierto BMJ. 2015;5(7):e007863. https://doi.org/10.1136/bmjopen-2015-007863.

Artículo PubMed PubMed Central Google Scholar

Herrett E, Williamson E, Brack K, Beaumont D, Perkins A, Thayne A, et al. Tratamiento con estatinas y síntomas musculares: serie de ensayos n de 1, aleatorizados y controlados con placebo. BMJ. 2021;n135. https://doi.org/10.1136/bmj.n135.

Chen X, Chen P. Comparación de cuatro métodos para el análisis de ensayos N de 1. Más uno. 2014;9(2):e87752. https://doi.org/10.1371/journal.pone.0087752.

Artículo CAS PubMed PubMed Central Google Scholar

Samuel JP, Tyson JE, Green C, Bell CS, Pedroza C, Molony D, et al. Tratamiento de la hipertensión en niños con ensayos n-de-1. Pediatría. 2019;143(4):e20181818. https://doi.org/10.1542/peds.2018-1818.

Artículo PubMed Google Scholar

Zhou T, Dickson JL, Chase JG. Modelado autorregresivo de deriva y error aleatorio para caracterizar un sensor de monitorización continua de glucosa intravascular. J Diabetes Sci Technol. 2017;12(1):90–104. https://doi.org/10.1177/1932296817719089.

Artículo PubMed PubMed Central Google Scholar

Daza E. Análisis causal de datos de series temporales de seguimiento automático utilizando un marco contrafactual para ensayos N de 1. Métodos Inf Med. 2018;57(S 01):e10–e21. https://doi.org/10.3414/me16-02-0044.

Daza EJ, Schneider L. Aleatorización de modelos gemelos (MoTR): un método de Monte Carlo para estimar el efecto promedio del tratamiento dentro de un individuo utilizando sensores portátiles. 2022. arXiv. https://doi.org/10.48550/ARXIV.2208.00739.

Zucker DR, Ruthazer R, Schmid CH. Los ensayos individuales (N de 1) se pueden combinar para brindar estimaciones comparativas del efecto del tratamiento en la población: consideraciones metodológicas. J Clin Epidemiol. 2010;63(12):1312–23. https://doi.org/10.1016/j.jclinepi.2010.04.020.

Artículo PubMed PubMed Central Google Scholar

Araujo A, Julious S, Senn S. Comprensión de la variación en conjuntos de ensayos N de 1. MÁS UNO. 2016;11(12):e0167167. https://doi.org/10.1371/journal.pone.0167167.

Artículo CAS PubMed PubMed Central Google Scholar

Gamble C, Krishan A, Stocken D, Lewis S, Juszczak E, Doré C, et al. Directrices para el contenido de los planes de análisis estadístico en ensayos clínicos. JAMA. 2017;318(23):2337. https://doi.org/10.1001/jama.2017.18556.

Artículo PubMed Google Scholar

Pearl J, Glymour M, Jewell NP. Inferencia causal en estadística: introducción. Sussex Occidental: Wiley; 2016.

Google Académico

Hernán MA, Robins JM. Inferencia causal. Monografías de Chapman & Hall/CRC sobre estadística y probab aplicada. Londres: Taylor y Francis; 2019.

Percha B, Baskerville EB, Johnson M, Dudley JT, Zimmerman N. Diseño de estudios sólidos N de 1 para medicina de precisión: estudio de simulación y recomendaciones de diseño. J Med Internet Res. 2019;21(4):e12641. https://doi.org/10.2196/12641.

Artículo PubMed PubMed Central Google Scholar

Burdorf A, Sorock G. Evidencia positiva y negativa de factores de riesgo para trastornos de la espalda. Scand J Salud del entorno laboral. 1997;23(4):243–56. https://doi.org/10.5271/sjweh.217.

Artículo CAS PubMed Google Scholar

Scutari M, Auconi P, Caldarelli G, Franchi L. Análisis de redes bayesianas de datos de maloclusión. Representante de esquí. 2017;7(1). https://doi.org/10.1038/s41598-017-15293-w.

Naimi AI, Cole SR, Kennedy EH. Introducción a los métodos G. Int J Epidemiol. 2016;dyw323. https://doi.org/10.1093/ije/dyw323.

Rubin DB. Estimación de los efectos causales de los tratamientos en estudios aleatorios y no aleatorios. J Educa Psicol. 1974;66(5):688–701. https://doi.org/10.1037/h0037350.

Artículo de Google Scholar

Holanda PW. Estadística e Inferencia Causal. Asociación de Estadísticas de J Am. 1986;81(396):945–60. https://doi.org/10.1080/01621459.1986.10478354.

Artículo de Google Scholar

Splawa-Neyman J, Dabrowska DM, Speed ​​TP. Sobre la aplicación de la teoría de la probabilidad a experimentos agrícolas. Ensayo sobre principios. Sección 9. Ciencias estadísticas. 1990;5(4). https://doi.org/10.1214/ss/1177012031.

Højsgaard S, Halekoh U, Yan J. El paquete R para ecuaciones de estimación generalizadas. Software de estadísticas J. 2005;15(2):1–11. https://doi.org/10.18637/jss.v015.i02.

Descargar referencias

Los autores desean agradecer al Dr. Tilman Engel por sus comentarios críticos sobre el dolor lumbar crónico inespecífico por la generación del gráfico acíclico dirigido. También nos gustaría agradecer a los revisores de nuestro manuscrito por sus esfuerzos y comentarios constructivos, que ayudaron a mejorar el manuscrito.

Financiamiento de Acceso Abierto habilitado y organizado por Projekt DEAL. Financiado por la Deutsche Forschungsgemeinschaft (DFG, Fundación Alemana de Investigación) – Projektnummer 491466077.

Centro de Salud Digital, Instituto Hasso Plattner de Ingeniería Digital, Potsdam, Alemania

Thomas Gärtner, Juliana Schneider, Bert Arnrich y Stefan Konigorski

Universidad de Potsdam, Facultad de Ingeniería Digital, Potsdam, Alemania

Thomas Gärtner, Juliana Schneider, Bert Arnrich y Stefan Konigorski

Instituto Hasso Plattner para la Salud Digital en Mount Sinai, Escuela de Medicina Icahn en Mount Sinai, Nueva York, EE. UU.

Stefan Konigorski

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

Conceptualización, TG y SK; metodología, TG y SK; análisis formal y generación de datos, TG; redacción del borrador original, TG; redacción-revisión y edición, SK, JS y TG; supervisión, SK y BA Todos los autores revisaron el manuscrito.

Correspondencia a Thomas Gärtner o Stefan Konigorski.

No aplica.

No aplica.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/. La exención de dedicación de dominio público de Creative Commons (http://creativecommons.org/publicdomain/zero/1.0/) se aplica a los datos disponibles en este artículo, a menos que se indique lo contrario en una línea de crédito a los datos.

Reimpresiones y permisos

Gärtner, T., Schneider, J., Arnrich, B. et al. Comparación de redes bayesianas, estimación G y modelos lineales para estimar los efectos causales del tratamiento en ensayos agregados N de 1 con efectos de arrastre. Método BMC Med Res 23, 191 (2023). https://doi.org/10.1186/s12874-023-02012-5

Descargar cita

Recibido: 13 de julio de 2022

Aceptado: 07 de agosto de 2023

Publicado: 21 de agosto de 2023

DOI: https://doi.org/10.1186/s12874-023-02012-5

Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt