Aprende a calcular el tamaño de la muestra de una encuesta paso a paso: comprende el nivel de confianza, el margen de error y el tamaño de la población, con la fórmula y ejemplos resueltos.
«¿A cuántas personas necesito encuestar?» es una de las preguntas de investigación más comunes, y una de las más malinterpretadas. El tamaño de muestra correcto no es un porcentaje fijo de tu audiencia; depende de cuán preciso y cuán seguro necesites que sean tus resultados. Esta guía recorre los conceptos subyacentes, la fórmula propiamente dicha y ejemplos resueltos para que puedas calcular un tamaño de muestra defendible para cualquier encuesta.
Por qué importa el tamaño de la muestra
Encuestas a una muestra porque encuestar a todos suele ser poco práctico. Pero una muestra solo aproxima la verdad, y el tamaño de ese error de aproximación depende de a cuántas personas preguntes. Con muy pocas respuestas tus resultados son demasiado ruidosos para actuar sobre ellos; con demasiadas, malgastas tiempo y dinero en una precisión que no necesitas. Calcular deliberadamente el tamaño de la muestra te da exactamente la confianza que exige tu decisión: ni más, ni menos.
Fundamentalmente, lo que importa estadísticamente es el número absoluto de respuestas, no la fracción de tu población. Encuestar a 384 personas ofrece aproximadamente la misma precisión ya sea que tu población sea de 20.000 o de 20 millones. Este hecho contraintuitivo es la razón por la que las encuestas nacionales de unos pocos miles de personas pueden describir países enteros, y por la que una regla como «encuestar al 10 % de mis usuarios» carece de sentido estadístico: exigiría muestras absurdamente grandes para poblaciones grandes y peligrosamente pequeñas para poblaciones diminutas.
Conviene separar dos ideas que los principiantes suelen confundir. El tamaño de la muestra controla cuán precisa es tu estimación: la dispersión aleatoria alrededor del valor real. No controla el sesgo, que es una desviación sistemática debida a un marco defectuoso o a una falta de respuesta selectiva. Una muestra de 50.000 extraída de un marco sesgado es solo una medición muy precisa de lo incorrecto. Calcular correctamente el tamaño de la muestra es necesario, pero solo te compra precisión; la representatividad proviene de un buen muestreo y de tasas de respuesta altas. Ten presente esa distinción mientras trabajas la fórmula de abajo.
Los tres factores: confianza, margen, población
El nivel de confianza es cuán seguro quieres estar de que el valor real de la población caiga dentro del rango que indicas. Las opciones comunes son 90 %, 95 % y 99 %. Un nivel de confianza del 95 % significa que si repitieras la encuesta muchas veces, alrededor del 95 % de los intervalos de confianza resultantes contendrían el valor real. Cada nivel de confianza se corresponde con una puntuación z: 1,645 para 90 %, 1,96 para 95 % y 2,576 para 99 %.
El margen de error (también llamado intervalo de confianza) es la precisión de tu estimación, expresada como más o menos un porcentaje. Si el 60 % de los encuestados eligen una opción con un margen de error del 5 %, el valor real de la población está probablemente entre el 55 % y el 65 %. Los márgenes más pequeños requieren muestras más grandes.
El tamaño de la población es el número total de personas del grupo que estás estudiando. Solo afecta al cálculo de forma significativa en poblaciones pequeñas y finitas; en poblaciones grandes su influencia es insignificante, razón por la cual muchas calculadoras lo ignoran una vez que la población supera unas 20.000 personas.
Un cuarto factor, oculto, es la proporción de la población (p): la división esperada de las respuestas. Cuando no la conoces, usa 0,5 (una división 50/50), porque produce la muestra requerida más grande y, por tanto, la estimación más conservadora y segura.
La fórmula del tamaño de muestra
Para una población grande o desconocida, el tamaño de muestra requerido es:
n = (z² × p × (1 - p)) / e²
donde z es la puntuación z de tu nivel de confianza, p es la proporción esperada y e es el margen de error en decimal. Para una población finita de tamaño N, aplica la corrección para población finita:
n_adjusted = n / (1 + ((n - 1) / N))
La corrección siempre reduce la muestra requerida, y la reducción es grande solo cuando la población es pequeña en relación con n.
Ejemplos resueltos
Ejemplo 1: población grande. Quieres un 95 % de confianza y un 5 % de margen de error, con una división desconocida, así que p = 0,5. Entonces z = 1,96, de modo que n = (1,96² × 0,5 × 0,5) / 0,05² = (3,8416 × 0,25) / 0,0025 = 0,9604 / 0,0025 = 384,16. Necesitas unas 385 respuestas completadas. Esta es la famosa cifra «384» que hay detrás de muchas encuestas nacionales.
Ejemplo 2: mayor precisión. Mantén el 95 % de confianza pero exige un 3 % de margen de error. Ahora n = (3,8416 × 0,25) / 0,03² = 0,9604 / 0,0009 = 1067,1, así que necesitas unas 1.068 respuestas. Reducir el margen a la mitad cuadruplica aproximadamente la muestra: la precisión es cara.
Ejemplo 3: población finita. Supón que solo tienes 2.000 clientes y quieres la precisión del ejemplo 1 (n = 385 antes de la corrección). Aplica la corrección: n_adjusted = 385 / (1 + (384 / 2000)) = 385 / 1,192 = 323. Necesitas unas 323 respuestas de tus 2.000 clientes. Esto es habitual en una encuesta NPS enfocada enviada a una base de clientes existente.
Ajustar según la tasa de respuesta
Las cifras anteriores son respuestas completadas, no invitaciones. Si esperas una tasa de respuesta del 20 %, divide el objetivo entre 0,20 para hallar a cuántas personas invitar. Para 385 respuestas completadas a una tasa del 20 %, debes invitar a 385 / 0,20 = 1.925 personas. Las tasas de respuesta realistas varían mucho: las encuestas por correo electrónico a clientes comprometidos pueden alcanzar el 20-40 %, mientras que el contacto en frío suele quedar por debajo del 5 %, así que confirma siempre tu tasa histórica antes de comprometerte con el tamaño de una lista. Enviar recordatorios y mantener la encuesta corta son las formas más fiables de elevar la finalización.
Errores comunes que evitar
Primero, no confundas el tamaño de la muestra con el número de respuestas necesario para los subgrupos: si planeas analizar segmentos por separado, cada segmento necesita su propia muestra adecuada, lo que puede multiplicar tu total. Segundo, no supongas que una muestra mayor corrige el sesgo; el tamaño de la muestra aborda solo el error de muestreo aleatorio, no el sesgo sistemático de un marco defectuoso o de la falta de respuesta. Tercero, evita las reglas empíricas de «porcentaje de la población» como «encuestar al 10 %»; sobremuestrean las poblaciones grandes e infra-muestrean las pequeñas. Por último, recuerda que una muestra enorme puede producir diferencias estadísticamente significativas demasiado pequeñas para importar en la práctica; juzga siempre los tamaños del efecto, no solo la significación.
Cuando investigas un segmento de mercado definido -por ejemplo, una encuesta de investigación de mercado dirigida a startups SaaS- decide tus divisiones en subgrupos antes de salir al campo para poder dimensionar cada una correctamente. Un hábito útil de planificación es anotar, antes del lanzamiento, cada comparación que pretendes hacer en el informe final: «gratuito frente a de pago», «nuevos frente a antiguos», «región A frente a región B». Cada una de esas comparaciones implica dos subgrupos que necesitan cada uno una muestra adecuada. Si descubres en la planificación que un segmento pequeño pero importante solo dará 40 respuestas, puedes sobremuestrearlo deliberadamente en lugar de acabar sin poder decir nada sobre él.
También conviene presupuestar la limpieza de datos. No toda respuesta enviada es utilizable: algunos encuestados responden en línea recta a lo largo de una cuadrícula, otros fallan los controles de atención, otros abandonan a medio camino. Si esperas descartar, digamos, el 10 % de las respuestas completadas por baja calidad, infla tu objetivo en esa cantidad para que tu muestra limpia siga cumpliendo la precisión que calculaste. Combinar el ajuste de la tasa de respuesta con un margen de limpieza te da una lista de invitaciones realista en lugar de una optimista que te deja corto cuando llegan los datos.
Preguntas frecuentes
¿Cuántas respuestas de encuesta necesito para ser estadísticamente válido? Para la mayoría de los estudios con un 95 % de confianza y un 5 % de margen de error, unas 385 respuestas completadas bastan cuando la población es grande. Márgenes más estrechos o el análisis de subgrupos requieren más.
¿De verdad no importa el tamaño de la población? Para poblaciones grandes apenas importa: 385 respuestas ofrecen aproximadamente la misma precisión ya sea que la población sea de 50.000 o de 5 millones. El tamaño de la población solo cambia el resultado de forma significativa en grupos pequeños y finitos, donde la corrección para población finita reduce la muestra requerida.
¿Qué nivel de confianza y margen de error debo usar? Un nivel de confianza del 95 % con un margen de error del 5 % es el valor por defecto estándar para encuestas de negocio. Usa un 99 % de confianza o un 3 % de margen solo cuando una decisión de alto riesgo justifique la muestra mucho mayor.
¿Por qué usar p = 0,5 cuando no conozco la división? Porque p × (1 - p) se maximiza en p = 0,5, y usarlo produce el tamaño de muestra más grande y seguro. Si esperas genuinamente una división desequilibrada, un valor como 0,2 o 0,8 reduce la muestra requerida.
Olvídate de las cuentas en la hoja de cálculo. Crea tu encuesta en SurveyMaker y sigue en tiempo real las respuestas completadas frente a tu objetivo.
Empieza gratis o usa una plantilla de investigación de mercado lista para usar.