El cálculo del tamaño de la muestra, o su justificación, es uno de los primeros pasos en el diseño de un estudio clínico. El tamaño de la muestra es el número de pacientes u otras unidades investigadas que se incluirán en un estudio y se requerirá para responder a la hipótesis de investigación en el estudio. El propósito principal de este cálculo es determinar el número suficiente de unidades necesarias para detectar los parámetros clínicos desconocidos o los efectos del tratamiento o la asociación después de la recopilación de datos.
Si el tamaño de la muestra es demasiado pequeño, es posible que el investigador no pueda responder la pregunta del estudio. Por otro lado, la cantidad de pacientes en muchos estudios es limitada debido a aspectos prácticos como el costo, las molestias para el paciente, las decisiones de no proceder con una investigación o un tiempo de estudio prolongado.
Los investigadores deben calcular el tamaño de muestra óptimo antes de la recopilación de datos para evitar los errores debido a que el tamaño de la muestra es demasiado pequeño y también desperdicia dinero y tiempo, debido al tamaño de la muestra demasiado grande. Además, los cálculos del tamaño de muestra para proyectos de investigación son una parte esencial de un protocolo de estudio para la presentación a comités de ética o para algunas revistas de revisión por pares.
Es muy importante determinar el tamaño de la muestra según el diseño del estudio y los objetivos del estudio. Cometer errores en el cálculo del tamaño de la muestra puede llevar a resultados incorrectos o insignificantes. En esta entrada del blog explicamos brevemente los principios básicos de los cálculos de tamaño de muestra en estudios médicos.
Supuestos para el cálculo del tamaño de la muestra.
Existen algunas suposiciones para calcular el tamaño de la muestra, incluida la variabilidad, los errores de tipo I y tipo II y el menor efecto de interés.
a) Variabilidad del resultado
La variabilidad en la variable de resultado es la varianza poblacional de un resultado dado que se estima por la desviación estándar. Los investigadores pueden usar una estimación obtenida de un estudio piloto o la variación informada de estudios anteriores.
b) Los errores tipo I y tipo II.
El error de tipo I es el rechazo de una hipótesis nula verdadera y el error de tipo II es el hecho de no rechazar una hipótesis nula falsa. En otro sentido, un error de tipo I se corresponde con el nivel de confianza en el cálculo del tamaño de la muestra, que es el grado de incertidumbre o probabilidad de que un valor de muestra se encuentre fuera de los límites establecidos y el error de tipo II corresponda a la potencia, lo que significa la capacidad de una prueba estadística para rechazar la hipótesis nula falsa. Se puede usar el análisis de potencia para calcular el tamaño de muestra mínimo para que el investigador pueda detectar un efecto de un tamaño determinado.
c) Tamaño del efecto
El tamaño del efecto es la diferencia mínima entre los grupos estudiados que el investigador desea detectar o la diferencia entre la estimación y el parámetro desconocido que el investigador desea estimar. Por lo tanto, se puede hacer una declaración de que no importa en qué medida la estimación de la muestra difiera del valor real de la población en una cierta cantidad. Esta cantidad se llama tamaño de efecto mínimo.
d) Cálculo del tamaño muestral en estudios transversales.
En estudios transversales, el objetivo es estimar la prevalencia de parámetros desconocidos de la población utilizando una muestra aleatoria. Por lo tanto, se necesita un tamaño de muestra adecuado para calcular la prevalencia de la población con una buena precisión.
Para calcular este tamaño de muestra adecuado, existe una fórmula simple, sin embargo, se necesita cierta información práctica para seleccionar valores y los supuestos requeridos en la fórmula; sin embargo, en algunas situaciones la decisión de seleccionar los valores apropiados para estos supuestos no es trivial.
La siguiente fórmula simple se usaría para calcular el tamaño de muestra adecuado en el estudio de prevalencia:
Donde n es el tamaño de la muestra, Z es la estadística correspondiente al nivel de confianza, P es la prevalencia esperada (que se puede obtener de los mismos estudios o un estudio piloto realizado por los investigadores), y d es la precisión (correspondiente al tamaño del efecto).
El nivel de confianza que generalmente se busca es del 95%, la mayoría de los investigadores presentan sus resultados con un intervalo de confianza (IC) del 95%. Sin embargo, algunos investigadores quieren estar más seguros de poder elegir un intervalo de confianza del 99%.
El investigador necesita conocer la P supuesta para poder utilizarla en la fórmula. Esto se puede estimar a partir de estudios anteriores publicados en el dominio del estudio o realizar un estudio piloto con una muestra pequeña para estimar el valor de P asumido. Este supuesto P es un tema muy importante porque la precisión (d) debe seleccionarse de acuerdo con la cantidad de P.
No hay suficientes pautas para elegir el d apropiado. Algunos autores recomendaron seleccionar una precisión del 5% si la prevalencia de la enfermedad va a estar entre el 10% y el 90%, sin embargo, cuando la prevalencia supuesta es demasiado pequeña (va a estar por debajo del 10%), la precisión del 5% Parece ser inapropiado. Por ejemplo, si la prevalencia supuesta es del 1%, la precisión del 5% es obviamente bruta y puede causar un tamaño de muestra inadecuado. Una opción conservadora sería un cuarto o un quinto de prevalencia como la cantidad de precisión en el caso de una pequeña P.
En la Tabla presentamos el cálculo del tamaño de la muestra para tres P diferentes y tres precisiones diferentes. Para P = 0.05, la precisión apropiada es 0.01 que resultó en 1825 muestras. Para P = 0.2, la mejor precisión sería 0.04 y cuando P aumenta a 0.6, la precisión podría aumentar hasta 0.1 (o más), lo que da como resultado 92 muestras. Los investigadores deben notar la precisión apropiada de acuerdo con la supuesta P. La precisión incorrecta da como resultado un tamaño de muestra incorrecto (demasiado pequeño o demasiado grande)
Tabla. Tamaño de muestra para estimar la prevalencia con diferente precisión y 95% de confianza.
Cálculo del tamaño muestral en estudios de casos y controles.
El caso-control es un tipo de estudio observacional epidemiológico. A menudo se usa para identificar los factores de riesgo que pueden asociarse a una enfermedad comparando los factores de riesgo en sujetos que tienen esa enfermedad (los casos) con sujetos que no tienen la enfermedad (los controles).
El cálculo del tamaño de la muestra para los estudios de casos y controles no coincidentes (el número de casos y controles) necesita estos supuestos; el número asumido de casos y controles que experimentaron los factores de riesgo de estudios similares o de un estudio piloto (también se puede usar la razón de probabilidades asumida), el nivel de confianza (casi el 95%) y la potencia propuesta del estudio (sería del 80%).
Hay software o guías que proporcionan a los investigadores la fórmula o el tamaño de la muestra calculados en tablas de acuerdo con diferentes supuestos. Pero es importante recordar que, ante la presencia de un factor de confusión significativo, los investigadores requieren un tamaño de muestra más grande. Dado que las variables de confusión deben ser controladas en cualquier análisis, se debe hacer un modelo estadístico más complejo, por lo que se requiere una muestra más grande para alcanzar significación.
Tamaño de la muestra en ensayos clínicos.
En un ensayo clínico, si el tamaño de la muestra es demasiado pequeño, un estudio bien realizado puede no responder a su hipótesis de investigación o puede no detectar efectos y asociaciones importantes. La información mínima necesaria para calcular el tamaño de la muestra para un ensayo controlado aleatorio incluye el poder, el nivel de significación, la tasa de eventos subyacentes en la población y el tamaño del efecto del tratamiento buscado. Además de esto, el tamaño de muestra calculado debe ajustarse para otros factores, incluidas las tasas de cumplimiento esperadas y, con menos frecuencia, un índice de asignación desigual.
Hay algunas recomendaciones para diferentes fases de ensayos clínicos basadas en el tamaño de su muestra; en la fase I del ensayo que involucra la seguridad de los medicamentos en voluntarios humanos. Los ensayos iniciales pueden requerir un total de alrededor de 20 a 80 pacientes. En los ensayos de fase II que investigan los efectos del tratamiento, rara vez se requieren más de 100-200 pacientes.
Conclusión
El tamaño óptimo de la muestra es un componente esencial de cualquier investigación. No es infrecuente que los estudios tengan poca potencia y no detecten los efectos del tratamiento debido al tamaño inadecuado de la muestra. Asimismo, el cálculo del tamaño adecuado de la muestra es una parte importante de cualquier estudio clínico y un estadístico profesional es la mejor persona para pedir ayuda al momento de planificar un proyecto de investigación. Sin embargo, los investigadores deben proporcionar la información necesaria para que el tamaño de la muestra se pueda determinar de acuerdo con los supuestos correctos. Existen muchos libros estadísticos que proporcionan los métodos para calcular el tamaño de la muestra en estudios médicos y también varios programas de software disponibles para ayudar con los cálculos del tamaño de la muestra ya sea descargables o en línea. Si bien estos programas son fáciles de usar, los investigadores deben consultar a un estadístico experimentado en las etapas de diseño de sus proyectos para evitar errores metodológicos.
Solicite ayuda directamente con el asesor metodológico al teléfono