NOTA: Para descargar los datos, dar click en el boton. Aparece una pantalla con los datos, luego dar click derecho y poner guardar como (save as). Guardar el txt donde van a trabajar

R.1

Veamos un ejemplo de prueba de hipótesis para una población (Crawley p.64). Estos son datos de Michelson (1978), de medidas tomadas para estimar la velocidad de la luz. Que ahora sabemos es cercano (299,990 km p seg).

veluz<-read.table("light.txt",header=T)
attach(veluz)
names(veluz)

hist(speed)

summary(speed)

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
    650     850     940     909     980    1070

A todos los valores se les ha restado 299 000 para facilitar su visualización ¿que pueden ver aquí? ¿tenemos valores atípicos?

boxplot(speed)

qqnorm(speed)
qqline(speed,lty=2)

La muestra no se distribuye de acuerdo a lo esperado normalmente (cosa que una prueba de t para una población asume), pero además ¿Creen que la población de referencia se distribuya de manera normal?

No puede porque tiene el problema de que la vel de la luz no puede tomar valores negativos

Nuestra hipótesis es que los datos de Michelson difieren de el valor prevaleciente en esa época como la vel de la luz 299,990 km/seg. Como a todos los valores les quitaron 299 000 entonces ¿cual va a ser la referencia?

Ahora, si cumpliéramos con el supuesto de que la pob. de referencia se distribuye normalmente, cómo resolvemos este problema?…ustedes ya lo saben hacer.

Primero. ¿Este problema tiene una o dos colas que le pisen? Entonces ¿que harían?

Bueno, pero como no cumplimos con el primero de los supuestos, necesitamos otra alternativa. Que se les ocurre?

Por supuesto que también podemos usar una técnica de remuestreo con remplazo! Este es el punto 1. de la tarea de hoy. Hagan la prueba con bootstrap

Existe otra alternativa es una prueba llamada de rangos signados de Wilcoxon.

C.1

R.2

library(stats)

wilcox.test(speed,mu=990)


    Wilcoxon signed rank test with continuity correction

data:  speed
V = 22.5, p-value = 0.00213
alternative hypothesis: true location is not equal to 990

La probabilidad de obtener la media de nuestra muestra (estadístico) en una población de las medias de muchas muestras con media 990 (parámetro) es del 0.2%. Como aceptamos una probabilidad de equivocarnos al rechazar una H0 cuando esta es cierta del 5% entonces, la rechazamos!

Script Prueba de hipótesis de una poblacion

R.1

C.1

R.2