Desarrollando y probando hipótesis |

Ver también: Intervalos de significación y confianzaLas

pruebas de hipótesis estadísticas a veces se conocen como análisis de datos confirmatorios. Es una forma de sacar conclusiones a partir de los datos. En el proceso, se desarrolla una hipótesis o teoría sobre lo que se podría ver en la investigación. Luego se prueba esa hipótesis contra los datos que se recogen.

La prueba de hipótesis se utiliza generalmente cuando se quiere comparar dos grupos, o comparar un grupo contra una posición idealizada.

Antes de comenzar: Desarrollo de una hipótesis de investigación

Antes de que puedas hacer cualquier tipo de investigación en campos de las ciencias sociales como la gestión, necesitas una pregunta o hipótesis de investigación. La investigación generalmente está diseñada para responder a una pregunta de investigación o considerar una hipótesis de investigación. Estas dos están estrechamente vinculadas, y generalmente se utiliza una u otra, en lugar de ambas.

Una pregunta de investigación es la pregunta que su investigación se propone responder. Por ejemplo:

  • ¿A los hombres y a las mujeres les gusta el helado por igual?
  • ¿A los hombres y a las mujeres les gustan los mismos sabores de helado?
  • ¿Cuáles son los principales problemas del mercado de los helados?
  • ¿Cómo puede segmentarse y dirigirse el mercado de los helados?

Las hipótesis de investigación son afirmaciones de lo que usted cree que encontrará en su investigación.

Estos son luego probados estadísticamente durante la investigación para ver si su creencia es correcta. Los ejemplos incluyen:

  • A los hombres y mujeres les gusta el helado en diferente medida.
  • A los hombres y las mujeres les gustan los diferentes sabores del helado.
  • Los hombres son más propensos que las mujeres a que les guste el helado de menta.
  • Las mujeres tienen más probabilidades que los hombres de que les guste el helado de chocolate.
  • Tanto hombres como mujeres prefieren el helado de fresa al de vainilla.

Relaciones vs. Diferencias

Las hipótesis de investigación pueden expresarse en términos de diferencias entre grupos o relaciones entre variables. Sin embargo, son dos caras de la misma moneda: casi cualquier hipótesis puede ser planteada de cualquier manera.

Por ejemplo:

Hay una relación entre el género y el gusto por el helado O

A los hombres les gusta más el helado que a las mujeres.

Comprobación de las hipótesis de investigación

El propósito de las pruebas de hipótesis estadísticas es utilizar una muestra para hacer inferencias sobre una población.

Probar las hipótesis de investigación requiere una serie de pasos:

Paso 1. Definir su hipótesis de investigación

El primer paso en cualquier prueba de hipótesis es identificar su hipótesis, que luego pasará a probar. La forma en que defina su hipótesis puede afectar al tipo de pruebas estadísticas que realice, por lo que es importante ser claro al respecto. En particular, considere si va a formular una hipótesis simplemente de que hay una relación o especular sobre la dirección de la relación.

Utilizando los ejemplos anteriores:

  • Existe una relación entre el género y el hecho de que gustar de un helado es una hipótesis no direccional. Simplemente has especificado que hay una relación, no si a los hombres o a las mujeres les gusta más el helado.
  • Sin embargo, es más probable que a los hombres les guste el helado que a las mujeres es direccional: ha especificado qué género es más probable que le guste el helado.

Generalmente, es mejor no especificar la dirección a menos que se esté moderadamente seguro de ello.

Paso 2. Definir la hipótesis nula

La hipótesis nula es básicamente una declaración de lo que se espera refutar: lo opuesto a su «suposición» sobre la relación. Por ejemplo, en las hipótesis anteriores, la hipótesis nula sería:

  • A los hombres y a las mujeres les gusta el helado por igual, o
  • No hay relación entre el género y el helado.

Esto también define su «hipótesis alternativa» que es su «hipótesis de prueba» (a los hombres les gusta más el helado que

a

las mujeres

).

Tu hipótesis nula es generalmente que no hay diferencia, porque esta es la posición más simple.

El propósito de la prueba de hipótesis es refutar la hipótesis nula. Si no puedes refutar la hipótesis nula, tienes que asumir que es correcta.

Paso 3. Desarrolle una medida de resumen que describa su variable de interés para cada grupo que desee comparar

Nuestra página sobre Análisis Estadístico Simple describe varias medidas de resumen, incluyendo dos de las más comunes, la media y la mediana.

El siguiente paso en su prueba de hipótesis es desarrollar una medida resumida para cada uno de sus grupos. Por ejemplo, para probar las diferencias de género en el gusto por el helado, podría preguntar a la gente cuánto le gustaba el helado en una escala del 1 al 5. Alternativamente, podrían tener datos sobre el número de veces que se consumen helados cada semana en los meses de verano.

Luego hay que producir una medida resumida para cada grupo, generalmente la media y la desviación estándar. Estas pueden ser similares para cada grupo, o bastante diferentes.

Paso 4. Elegir una distribución de referencia y calcular una estadística de prueba

Para decidir si existe una verdadera diferencia entre los dos grupos, hay que utilizar una distribución de referencia con la que medir los valores de los dos grupos.

La fuente más común de distribuciones de referencia es una distribución estándar como la distribución normal o la distribución t-. Estas dos son iguales, salvo que la desviación estándar de la distribución t se estima a partir de la muestra y se conoce la de la distribución normal. Hay más información al respecto en nuestra página sobre Distribuciones Estadísticas.

Luego se comparan los datos de resumen de los dos grupos utilizándolos para calcular una estadística de prueba. Hay una fórmula estándar para cada estadística de prueba y distribución de referencia. La distribución de prueba y de referencia depende de sus datos y del propósito de su prueba (véase más abajo).

¿Qué prueba?

La prueba que se utilice para comparar los grupos dependerá del número de grupos que se tengan, del tipo de datos que se hayan recogido y de la fiabilidad de los mismos. En general, se usarán pruebas diferentes para comparar dos grupos que para comparar tres o más.

Nuestra página Encuestas y Diseño de Encuestas explica que hay dos tipos de escala de respuesta, continua y categórica. La edad, por ejemplo, es una escala continua, aunque también se puede agrupar en categorías. También puede ser útil leer nuestra página sobre Tipos de datos.

El género es una escala de categorías.

  • Para una escala continua, puedes usar los valores medios de los dos grupos que estás comparando.
  • Para una escala de categorías, necesitas usar los valores medios.

PropósitoEscala de datosPromedioPruebaEstadística de pruebaDistribución de referenciaCompara dos gruposContinuoSignificat-testttCategoría Mediana Prueba U de Mann-Whitney Estadística UTodas las combinaciones de rangosCompara tres o más gruposContinuoSignificaAnálisis de Varianza (ANOVA)F-ratioFCategoríaMedianaPrueba de Kruskal-WallisEstadística WTodas las combinaciones de rangos

Fuente: Easterby-Smith, Thorpe y Jackson, Management Research 4ª Edición

Prueba de uno o dos pasos

La otra cosa que tienes que decidir es si usas lo que se conoce como una prueba de «una cola» o «dos colas».

Esto le permite comparar las diferencias entre los grupos en una o ambas direcciones.

En la práctica, esto se reduce a si su hipótesis de investigación se expresa como «es probable que x sea más que y», o «es probable que x sea diferente de y».

Si estás seguro de la dirección de la distancia (es decir, estás seguro de que las únicas opciones son que «x es probable que sea más que y» o que «x e y son lo mismo»), entonces tu prueba será de una sola cola. Si no, será de dos colas.

En caso de duda, es mejor utilizar una prueba de dos colas.

Sólo debes usar una prueba de una cola cuando estés seguro de la dirección de la diferencia, y no importa si te equivocas.

El gráfico del paso 5 muestra una prueba de dos colas.

¡Advertencia!

Si no está muy seguro de la calidad de los datos recogidos, por ejemplo porque la introducción de datos se hizo de forma rápida y barata, o porque los datos no han sido comprobados, entonces puede preferir utilizar la mediana aunque los datos sean continuos para evitar cualquier problema con los valores atípicos. Esto hace que las pruebas sean más robustas y los resultados más fiables.

Nuestra página de correlaciones sugiere que también puede querer trazar un gráfico de dispersión antes de realizar cualquier otro análisis. Esto también le ayudará a identificar cualquier valor atípico o problemas potenciales con los datos.

Cálculo de la estadística de la prueba

Para cada tipo de prueba, hay una fórmula estándar para la estadística de la prueba. Por ejemplo, para la prueba t, es:

(M1-M2)/SE(diff)

M1 es la media del primer grupo

M2 es la media del segundo grupo

SE(diff) es el error estándar de la diferencia, que se calcula a partir de la desviación estándar y el tamaño de la muestra de cada grupo.

La fórmula para calcular el error estándar de la diferencia entre medias es:

$$sqrt{(sd^2/n_a)+(sd^2/n_b)}$$

Donde

  • sd2 = el cuadrado de la desviación estándar de la población fuente (es decir, la varianza);
  • na = el tamaño de la muestra A; y
  • nb = el tamaño de la muestra B.

Paso 5. Identificar las regiones de aceptación y rechazo

La parte final de la prueba es ver si la estadística de la prueba es significativa, es decir, si va a aceptar o rechazar su hipótesis nula. Necesitas considerar primero qué nivel de significación se requiere. Esto te dice la probabilidad de que hayas alcanzado tu resultado por casualidad.

La significación (o el valor p) se requiere normalmente que sea del 5% o el 1%, lo que significa que usted está 95% o 99% seguro de que su resultado no fue alcanzado por casualidad.

NOTA: el nivel de significación se expresa a veces como p p

En el gráfico que figura a continuación se muestra una distribución de referencia (ésta podría ser la normal o la distribución t) con las regiones de aceptación y rechazo marcadas. También muestra los valores críticos. µ es la media. Para más información sobre esto, puede que quieras leer nuestra página sobre Distribuciones Estadísticas.

Distribución de referencia que muestra las regiones de aceptación y rechazo, los valores críticos y la media.

Los valores críticos se identifican a partir de las tablas estadísticas publicadas para su distribución de referencia, que están disponibles para diferentes niveles de significación.

Si la estadística de su prueba se encuentra dentro de cualquiera de las dos regiones de rechazo (es decir, es mayor que el valor crítico más alto o menor que el más bajo), rechazará la hipótesis nula. Por lo tanto, puede aceptar su hipótesis alternativa.

Paso 6. Sacar conclusiones e inferencias

El paso final es sacar conclusiones.

Si la estadística de su prueba se encuentra dentro de la región de rechazo, y usted ha rechazado la hipótesis nula, puede por lo tanto concluir que hay una diferencia de género en el gusto por el helado, utilizando el ejemplo anterior.

Tipos de error

Hay cuatro posibles resultados de las pruebas estadísticas (véase el cuadro):

  • Los grupos son diferentes, y concluyes que son diferentes (resultado correcto)
  • Los grupos son diferentes, pero se concluye que no lo son (error de tipo II)
  • Los grupos son los mismos, pero se concluye que son diferentes (error de tipo I)
  • Los grupos son los mismos, y se concluye que son los mismos (resultado correcto).

Posición realConclusión de los datosLos grupos son los mismosGrupos son diferentesLos datos no muestran ninguna diferencia entre los gruposSe dibujará la conclusión correctaError de tipo IILos datos muestran una diferencia entre los gruposError de tipo ISe dibujará la conclusión correcta

Fuente: Easterby-Smith, Thorpe y Jackson, Management Research 4ª Edición

Los errores de tipo I se consideran generalmente más importantes que los de tipo II, porque tienen el potencial de cambiar el status quo.

Por ejemplo, si se llega a la conclusión errónea de que un nuevo tratamiento médico es eficaz, es probable que los médicos pasen a proporcionar ese tratamiento. Los pacientes pueden recibir el tratamiento en lugar de una alternativa que podría tener menos efectos secundarios, y las empresas farmacéuticas pueden dejar de buscar un tratamiento alternativo.

Un consejoHay paquetes de

software estadístico disponibles que llevarán a cabo todas estas pruebas por usted. Sin embargo, si nunca ha estudiado las estadísticas y no tiene mucha confianza en lo que está haciendo, probablemente sea mejor que lo discuta con un estadístico o que consulte un libro de texto detallado sobre estadística.

Un análisis estadístico mal ejecutado puede invalidar una muy buena investigación. Es mucho mejor encontrar a alguien que te ayude. Sin embargo, esta página te ayudará a entender a tu amigable estadístico!

Continúa:
Intervalos de importancia y confianza
Análisis estadístico: Tipos de datos

Ver también:
Comprender las correlaciones
Comprensión de las distribuciones estadísticas
Promedios (Media, Mediana y Modo)

Rate this post

Deja un comentario