Parte de nuestro: biblioteca de métodos de investigación.
Cuando recoges cualquier tipo de datos, especialmente datos cuantitativos, ya sean de observación, a través de encuestas o a partir de datos secundarios, tienes que decidir qué datos recoger y de quién.
Esto se llama la muestra.
Hay una variedad de formas de seleccionar su muestra, y asegurarse de que le da resultados que serán fiables y creíbles.
La diferencia entre la población y la muestra
Lo ideal sería que la investigación recogiera información de cada uno de los miembros de la población que está estudiando. Sin embargo, la mayoría de las veces eso llevaría demasiado tiempo, por lo que hay que seleccionar una muestra adecuada: un subconjunto de la población.
Principios de la elección de una muestra
La idea que subyace a la selección de una muestra es poder generalizar sus hallazgos a toda la población, lo que significa que su muestra debe ser:
- Representativo de la población. En otras palabras, debe contener proporciones de subgrupos similares a las de la población total y no excluir a ningún grupo en particular, ya sea por el método de muestreo o por el diseño, o por quien decida responder.
- Lo suficientemente grande como para darte suficiente información para evitar errores. No es necesario que sea una proporción específica de su población, pero sí que sea al menos de un cierto tamaño para que sepa que sus respuestas probablemente sean ampliamente correctas.
Si su muestra no es representativa, puede introducir un sesgo en el estudio. Si no es lo suficientemente grande, el estudio será impreciso.
Sin embargo, si se obtiene una relación correcta entre la muestra y la población, se pueden sacar conclusiones sólidas sobre la naturaleza de la población.
Tamaño de la muestra: ¿cuánto mide un trozo de cuerda?
¿Qué tamaño debe tener la muestra? Depende de cuán precisa quieras la respuesta. Las muestras más grandes generalmente dan respuestas más precisas.
El tamaño de la muestra que desea depende de lo que está midiendo y del tamaño del error que está dispuesto a aceptar. Por ejemplo:
Para estimar una proporción en una población:
Tamaño de la muestra =[ (z-score)² × p(1-p) ] ÷ (margen de error)²
- El margen de error es lo que está dispuesto a aceptar (normalmente entre el 1% y el 10%);
- La puntuación z, también llamada valor z, se encuentra en las tablas estadísticas y depende del intervalo de confianza elegido (90%, 95% y 99% se utilizan comúnmente, así que elige el que quieras);
- p es la estimación de lo que es probable que sea la proporción. A menudo se puede estimar p a partir de una investigación previa, pero si no se puede hacer eso, entonces se utiliza 0,5.
Para estimar la media de la población:
Margen de error = t × (s ÷ raíz cuadrada del tamaño de la muestra).
- El margen de error es lo que estás dispuesto a aceptar (normalmente entre el 1% y el 10%);
- Mientras el tamaño de la muestra sea mayor que unos 30, t es equivalente a la puntuación z, y está disponible en las tablas estadísticas como antes;
- s es la desviación estándar, que suele adivinarse, basada en la experiencia previa o en otras investigaciones.
Si no tienes mucha confianza en este tipo de cosas, entonces la mejor manera de lidiar con ello es encontrar un estadístico amigable y pedir ayuda. La mayoría de ellos estarán encantados de ayudarle a dar sentido a su especialidad.
Es mejor estar imprecisamente en lo correcto que precisamente en lo incorrecto.
Cómo interactúan la parcialidad y la precisión:
SesgoAltoBajo PrecisiónAlto Precisamente equivocado Precisamente correctoBajo Precisamente equivocado
Fuente: Management Research (4ª edición), Easterby-Smith, Thorpe y Jackson
Imprecisamente correcto significa que sabes ampliamente cuál es la respuesta correcta. Precisamente equivocado significa que crees que sabes la respuesta, pero no es así. En otras palabras, si sólo puedes preocuparte por una, preocúpate por el sesgo.
El muestreo de probabilidad es donde se conoce la probabilidad de que cada persona o cosa forme parte de la muestra. El muestreo no probabilístico es donde no se conoce.
Muestreo de probabilidad
Los métodos de muestreo probabilístico permiten al investigador ser preciso sobre la relación entre la muestra y la población.
Esto significa que usted puede estar absolutamente seguro de que su muestra es representativa o no, y también puede poner un número sobre la certeza de sus hallazgos (este número se llama la significación, y se discute más a fondo en nuestra página sobre Intervalos de Significación y Confianza).
En un muestreo aleatorio simple, cada miembro de la población tiene las mismas posibilidades de ser elegido. El inconveniente es que la muestra puede no ser genuinamente representativa. Puede que no se incluyan sub-secciones pequeñas pero importantes de la población.
Por ello, los investigadores han desarrollado un método alternativo denominado muestreo aleatorio estratificado. Este método divide la población en grupos homogéneos más pequeños, llamados estratos, y luego toma una muestra aleatoria de cada estrato.
El muestreo aleatorio estratificado proporcional toma la misma proporción de cada estrato, pero de nuevo sufre la desventaja de que los grupos raros estarán mal representados. Por consiguiente, el muestreo estratificado no proporcional toma una muestra más grande de los estratos más pequeños, para asegurar que haya una muestra suficientemente grande de cada estrato.
El muestreo aleatorio sistemático se basa en tener una lista de la población, que idealmente debería estar ordenada aleatoriamente. El investigador toma entonces cada enésimo nombre de la lista.
¡Atención!
Existen muchos métodos diferentes para seleccionar «muestras aleatorias». Si usted es el investigador principal de un proyecto y da instrucciones a otros para que «tomen una muestra aleatoria», o si se le pide que tome una «muestra aleatoria», ¡asegúrese de que todos están utilizando el mismo método!
El muestreo por conglomerados está concebido para abordar los problemas de una población geográfica amplia. Es probable que el muestreo aleatorio de una población numerosa dé lugar a elevados costos de acceso. Esto puede superarse dividiendo la población en grupos, seleccionando sólo dos o tres grupos y tomando el muestreo dentro de ellos. Por ejemplo, si se desea conocer el uso del transporte en las zonas urbanas del Reino Unido, se podría seleccionar al azar sólo dos o tres ciudades, y luego muestrear completamente dentro de éstas.
Por supuesto, es posible combinar todo esto en varias etapas, lo que a menudo se hace para estudios en gran escala.
Muestreo no probabilístico
Utilizando métodos de muestreo no probabilísticos, no es posible decir cuál es la probabilidad de que se muestre a un determinado miembro de la población. Aunque esto no hace que la muestra sea «mala», los investigadores que utilizan esas muestras no pueden tener tanta confianza en la extracción de conclusiones sobre toda la población.
El muestreo por conveniencia selecciona una muestra en base a la facilidad de acceso. Estas muestras son extremadamente fáciles de organizar, pero no hay manera de garantizar que sean representativas.
El muestreo por cuotas divide la población en categorías, y luego selecciona dentro de las categorías hasta que se obtiene una muestra del tamaño elegido dentro de esa categoría. Algunos estudios de mercado son de este tipo, por lo que los investigadores suelen preguntarle su edad: están comprobando si les ayudará a cumplir sus cuotas para determinados grupos de edad.
El muestreo intencional es cuando el investigador sólo se acerca a las personas que cumplen ciertos criterios, y luego comprueba si cumplen otros criterios. Una vez más, los investigadores de mercado que salen con portapapeles suelen utilizar este enfoque: por ejemplo, si buscan examinar los hábitos de compra de los hombres de entre 20 y 40 años, sólo se acercarán a los hombres, y luego les preguntarán su edad.
El muestreo de bola de nieve es cuando el investigador comienza con una persona que cumple sus criterios, y luego utiliza esa persona para identificar a otros. Esto funciona bien cuando la muestra tiene criterios muy específicos: por ejemplo, si se quiere hablar con trabajadores con un determinado conjunto de responsabilidades, se puede acercar a una persona con ese conjunto y pedirle que le presente a otros.
ADVERTENCIA!
Los métodos de muestreo no probabilísticos se han desarrollado en general para abordar problemas muy específicos. Por ejemplo, el muestreo de bola de nieve se ocupa de poblaciones difíciles de encontrar, y el muestreo por conveniencia permite la rapidez y la facilidad.
Sin embargo, aunque algunos métodos de muestreo no probabilísticos, en particular el muestreo por cupos y el muestreo intencional, aseguran que la muestra se extrae de todas las categorías de la población, las muestras tomadas mediante estos métodos pueden no ser representativas.
Unas palabras de conclusión
Casi todas las investigaciones son un compromiso entre lo ideal y lo posible.
Lo ideal sería estudiar a toda la población; en la práctica, no tienes tiempo ni capacidad. Pero el cuidado en la selección de la muestra, tanto en el tamaño como en el método, asegurará que su investigación no caiga en las trampas de la introducción de sesgos o la falta de precisión. Esto, a su vez, le dará esa credibilidad vital.
Continúe:
Métodos de investigación cuantitativos y cualitativos
Encuestas y diseño de encuestas
Ver también:
Escribir una propuesta de investigación | Diseñar la investigación
Análisis de datos cualitativos | Análisis estadístico simple