Formular hipótesis ( H0 y HA)
Obtener error estándar y estadístico de prueba empírico correspondiente (ej: Z o t)
Establecer la probabilidad de error α (usualmente 0.05) y obtener valor crítico (teórico) de la prueba correspondiente
Cálculo de intervalo de confianza / contraste valores empírico/crítico
Interpretación
prueba t
cálculo de valor crítico de prueba para contraste de hipótesis
hipótesis direccionales (por ejemplo, mayor o menor qué)
gran parte de las hipótesis de investigación se relacionan con diferencias entre grupos, ej:
hombres obtienen mayor salario que las mujeres
los chilenos son más prejuiciosos que los migrantes
ahora se apoyan los cambios más graduales que antes (comparación en el tiempo)
"la sociología comparada no es una rama especial de la sociología, sino que es la sociología misma en tanto deja de ser puramente descriptiva y aspira a dar razón de los hechos"
en análisis cuantitativo, buena parte de las hipótesis comparativas remiten a comparaciones entre promedios o medias
en análisis cuantitativo, buena parte de las hipótesis comparativas remiten a comparaciones entre promedios o medias
la clase anterior realizamos una prueba Z para diferencia de medias solo a modo de simplificación, quedando pendiente el aplicar la prueba correspondiente: t
casen_350%>% # se especifica la base de datos dplyr::group_by(sexo=sjlabelled::as_label(sexo)) %>% # se agrupan por la variable categórica y se usan sus etiquetas con as_label dplyr::summarise(Obs.=n(),Promedio=mean(salario, na.rm=TRUE),SD=sd(salario, na.rm=TRUE)) %>% # se agregan las operaciones a presentar en la tabla kable(, format = "markdown") # se genera la tabla
sexo | Obs. | Promedio | SD |
---|---|---|---|
1. Hombre | 205 | 654585.4 | 468692.5 |
2. Mujer | 138 | 604420.3 | 444666.0 |
Diferencia salarial = 654.585-604.420=50.165
¯x1−¯x2±tα/2∗SE¯x1−¯x250165±1.96∗5056150165±99099.56CI[−49287.48;149617.63]
Asumiendo que el valor crítico Z para un error α de 0.5 (o 95% de confianza) es de 1.96
Para diferencia de medias necesitamos un valor crítico más preciso que el que nos da Z, que se denomina el valor t .
la distribución t es similar a Z
se basa en la distribución normal, pero con ajuste para muestras pequeñas y para cuando no conocemos la desviación estándar de la población
por lo tanto, la forma de la distribución varía según el tamaño muestral, asociado al concepto de grados de libertad
Recordemos el cáĺculo de valores críticos en Z para construir un intervalo de confianza al 95% (clase Inferencia 3):
Límite inferior: 2.5% (0.025)
qnorm(0.025) # límite inferior
[1] -1.959964
Límite superior: 2.5% + 95% = 97.5% (0.975)
qnorm(0.975) # límite superior
[1] 1.959964
Y aproximando, ± 1.96
¯x1−¯x2±[Z]α/2∗SE¯x1−¯x250165±1.96∗5056150165±99099.56CI[−49287.48;149617.63]
la obtención del valor crítico para un determinado nivel de confianza es similar a Z, pero ajustado al tamaño muestral
el tamaño muestral se asocia al concepto de grados de libertad
la pregunta a responder es: ¿cuál es el valor crítico de t para una probabilidad de error α y grados de libertad N−2?
Para esto, tradicionalmente se recurre a la "tabla de valores t"
A medida que aumenta la muestra (asociada a DF-grados de libertad), t se aproxima a Z
Como se ve en la tabla, en una muestra de 1000 el valor crítico para 0.025 t=1.96
para un nivel de error α=0.05
y una hipótesis de diferencia de dos colas: α/2=[0.025−0.975]
grados de libertad N-2= 343-2 = 341
qt(p=.05/2, df=341)
[1] -1.966945
qt(p=.05/2, df=341, lower.tail=FALSE)
[1] 1.966945
Como vemos, es un poco mayor a Z pero parecido, ya que la muestra es de buen tamaño
¯x1−¯x2±tα/2∗SE¯x1−¯x250165±1.967∗5056150165±99453.49CI[−49288.49 ;149618.5]
La prueba t de diferencia de medias considera el tamaño muestral (expresado en grados de libertad) para el cálculo del valor crítico
t se aproxima a Z a medida que aumenta el tamaño muestral
en muestras más pequeñas, t aumenta el nivel de exigencia al establecer valores críticos más altos que Z para poder rechazar la hipótesis nula
además de la construcción de intervalos, otra forma más tradicional de test de hipótesis para diferencia de medias es la prueba t
la prueba t consiste en el contraste de un valor crítico de t con un valor empírico (o estadísitico) t calculado con datos de nuestra muestra:
además de la construcción de intervalos, otra forma más tradicional de test de hipótesis para diferencia de medias es la prueba t
la prueba t consiste en el contraste de un valor crítico de t con un valor empírico (o estadísitico) t calculado con datos de nuestra muestra:
El denominador es el error estándar de la diferencia de promedios (que vimos la clase pasada)
El valor t calculado se compara con el valor crítico (teórico) de t asociado a una probabilidad de error α, ej: 0.05
La prueba t es la comparación o contraste entre ambos valores. Si el t empírico es igual o superior al crítico se rechaza H0
Para una diferencia de salarios de 50.165 y un error estándar de 50.561:
Este valor t (empírico) se contrasta con el valor t crítico correspondiente a un 5% de probabilidad de error
Contrastando ahora el valor calculado con el valor crítico:
tcrtitico=−1.96<tcalculado=0.992<tcritico=1.96
Por lo tanto, nuestro valor estimado queda fuera de la zona de rechazo de la hipótesis nula: la diferencia de medias no es estadísiticamente distinta de 0.
En consecuencia, con un nivel de confianza de 95% no podemos afirmar que existen diferencias salariales entre hombres y mujeres
El gráfico muestra nuestro valor estimado de t fuera de la zona de rechazo (zona gris en la curva). Por lo tanto, no podemos rechazar H0, las diferencias no son distintas de cero
La prueba t consiste en un contraste entre el estadístico t (calculado a partir de nuestra muestra) y el valor crítico t para un nivel de error definido (usualmente 5%)
Si el valor del estadísitico t no sobrepasa el valor crítico t, entonces no se logra rechazar la hipótesis nula, y no se puede afirmar que existen diferencias de medias en la población
La prueba t consiste en un contraste entre el estadístico t (calculado a partir de nuestra muestra) y el valor crítico t para un nivel de error definido (usualmente 5%)
Si el valor del estadísitico t no sobrepasa el valor crítico t, entonces no se logra rechazar la hipótesis nula, y no se puede afirmar que existen diferencias de medias en la población
Si el estadísitico t es superior al valor crítico, se rechaza la hipótesis nula
La prueba t consiste en un contraste entre el estadístico t (calculado a partir de nuestra muestra) y el valor crítico t para un nivel de error definido (usualmente 5%)
Si el valor del estadísitico t no sobrepasa el valor crítico t, entonces no se logra rechazar la hipótesis nula, y no se puede afirmar que existen diferencias de medias en la población
Si el estadísitico t es superior al valor crítico, se rechaza la hipótesis nula
La prueba t es la forma más tradicional de contrastar hipótesis de diferencia de medias, y se puede complementar con intervalos de confianza
el cálculo de t (estimado) nos da un valor que puede ser transformado a un valor de área bajo la curva (tal como en Z)
cual es la probabilidad de error (valor p) de un t específico?
hay que recordar que tanto Z como t tienen promedio 0 y son simétricas, y por lo tanto el 0 divide el área de la curva en 0.5
0.5 es la mayor probabilidad de error (=azar total), y a medida que se aleja del 0.5 disminuye la probabilidad de error
(qt(t,df, lower.tail = FALSE))*2
Donde:
qt: función que entrega la probabilidad para un valor t
df: grados de libertar (degrees of freedom)
lower.tail=FALSE: considera las probabilidades acumuladas hacia la cola superior de la curva
*2: al ser una prueba de diferencias, considera zona de rechazo en ambas direcciones de la curva, por lo que las probabilidades se multiplican por 2
En nuestro ejemplo:
(pt(0.99215, 341, lower.tail = FALSE))*2
[1] 0.3218278
La probabilidad de error del t estimado es de 0.322.
Esto quiere decir es que en la estimación de esta diferencia de medias, nos estamos equivocando aproximadamente un tercio de las veces (lejos del nivel convencional de rechazo de H0 de 0.05)
La obtención del valor p podría también entregar información para rechazar H0 con un mayor nivel de confianza al establecido
Si bien el p<0.05 es aceptado, en el caso que el p sea menor a 0.01 o 0.001, se reporta por convención el valor p menor
Usualmente en los trabajos de investigación esto se representa con asteriscos: ∗p<0.05, ∗∗p<0.01, y ∗∗∗p<0.01
Entonces, se logra rechazar la hipótesis nula cuando:
el intervalo de confianza no contiene el 0
t.test(salario ~ sexo, data = casen_350, var.equal=TRUE)
Two Sample t-testdata: salario by sexot = 0.99215, df = 341, p-value = 0.3218alternative hypothesis: true difference in means between group 1 and group 2 is not equal to 095 percent confidence interval: -49287.48 149617.63sample estimates:mean in group 1 mean in group 2 654585.4 604420.3
rempsyc
pacman::p_load(rempsyc,broom)model <- t.test(salario ~ sexo, data = casen_350, var.equal=TRUE)stats.table <- tidy(model, conf.int = TRUE)nice_table(stats.table, broom = "t.test")
"Se realizó una prueba t para muestras independientes para comparar los salarios entre hombres y mujeres. Los resultados indicaron una diferencia no significativa en los salarios entre hombres (M = 654585, SD = 468692) y mujeres (M = 604420, SD = 444666); t(341)=0.9921, p=0.321. El intervalo de confianza del 95% para la diferencia de medias fue [−49288.49;149618.5].
[diferencia no significativa=no se logra rechazar H0]
report
model <- t.test(salario ~ sexo, data = casen_350, var.equal=TRUE)report(model)
La prueba t de dos muestras que evalúa la diferencia de salario según sexo (media en el grupo 1 = 654585, media en el grupo 2 = 604420) sugiere que el efecto es positivo, estadísticamente no significativo y muy pequeño (diferencia = 50165, IC del 95% [-49,287.48, 150,000], t(341) = 0.99, p = 0.322).
[traducido y con mínima edición]
Pregunta | Hipotesis | Prueba |
---|---|---|
A. ¿Existe el promedio en la población? |
Ha:¯X1≠0 H0:¯X1=0 | Dos colas (no direccional) |
B. ¿Existen diferencias de promedios en la población? | Ha:¯X1−¯X2≠0 H0:¯X1−¯X2=0 | Dos colas (no direccional) |
C. ¿Es un promedio (1) superior (o inferior) al otro (2)? | Ha:¯X1−¯X2>0 H0:¯X1−¯X2≤0 | Una cola (direccional) |
-
Si bien en teoría las hipótesis direccionales se pueden plantear en ambas direcciones, en general (y por simpleza) se expresan en términos de "mayor que", quedando la zona de rechazo de H0 a la derecha
Ha:¯X1>¯X2H0:¯X1≤¯X2
2.Obtener error estándar y estadístico de prueba (lo mismo que para al caso anterior)
t=(¯x1−¯x2)√s1²√n1+s2²√n2=5016550561=0.9921
3.Probabilidad de error y valor crítico
3.Probabilidad de error y valor crítico
para un nivel de error α=0.05 (de una cola)
grados de libertad N-2= 343-2 = 341
qt(p=.05, df=341, lower.tail = FALSE)
[1] 1.649334
[lower.tail=FALSE se refiere que el calculo refiere a la cola superior]
4.Contraste
H0:¯Xhombres≤¯Xmujeres
"Se realizó una prueba t para muestras independientes para examinar si el salario promedio de los hombres (M = 654585, SD = 468692) es mayor que el de las mujeres (M = 604420, SD = 444666), siendo la diferencia entre ambos de 50.165. Los resultados no fueron estadísticamente significativos, t(341)=0.9921, p=0.161. Por lo tanto, con un 95% de confianza no se puede rechazar la hipótesis nula, lo que no permite sustentar la hipótesis inicial (alternativa) que el salario de los hombres es mayor que el de las mujeres."
Nota: en el práctico cambiar el N de la muestra y establecer distintos niveles de confianza
casen_1500%>% # se especifica la base de datos dplyr::group_by(sexo=sjlabelled::as_label(sexo)) %>% # se agrupan por la variable categórica y se usan sus etiquetas con as_label dplyr::summarise(Obs.=n(),Promedio=mean(salario, na.rm=TRUE),SD=sd(salario, na.rm=TRUE)) %>% # se agregan las operaciones a presentar en la tabla kable(, format = "markdown") # se genera la tabla
sexo | Obs. | Promedio | SD |
---|---|---|---|
1. Hombre | 782 | 746620.7 | 828509.6 |
2. Mujer | 662 | 605775.6 | 478087.6 |
model_dir2 <- t.test( salario ~ sexo, data = casen_1500, alternative="greater", var.equal=TRUE, conf.level = 0.95)stats.table4 <- tidy(model_dir2)nice_table(stats.table4, broom = "t.test")
t para diferencia de medias y ajuste por tamaño muestral / grados de libertad
prueba t por contraste entre valor del estadístico calculado (o t empírico) y el valor crítico para un nivel de confianza
valores p y reporte para valores convencionales menores a 0.05, 0.01o 0.001
hipótesis direccionales y no direccionales
Keyboard shortcuts
↑, ←, Pg Up, k | Go to previous slide |
↓, →, Pg Dn, Space, j | Go to next slide |
Home | Go to first slide |
End | Go to last slide |
Number + Return | Go to specific slide |
b / m / f | Toggle blackout / mirrored / fullscreen mode |
c | Clone slideshow |
p | Toggle presenter mode |
t | Restart the presentation timer |
?, h | Toggle this help |
Esc | Back to slideshow |