Vamos a ver una serie de datos para ver si existe una relación lineal entre ellos.
data<-read.table("twosample.txt",header=T)
attach(data)
data
plot(x,y)

Se acuerdan que necesitamos primero para calcular el coeficiente de correlación de pearson? Las varianzas individuales
¿y que más? La covarianza y estamos hechos
var(x,y)
[1] 414.9603Ahora calculamos r
Ahora hagamoslo en automático
cor(x,y)
[1] 0.9387684Y ahora hagamos la prueba de hipótesis
Calculamos EE de r
Calculo t de la muestra
te<-cor(x,y)/EEr
te
[1] 18.67914Calculo t de tablas
qt(0.975,47)
[1] 2.011741Calculo la p
2*(1-pt(18.67914,47))
[1] 0Ahora hagamoslo de manera automática
pearson<-cor.test(x,y)
pearson
    Pearson's product-moment correlation
data:  x and y
t = 18.679, df = 47, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.8934139 0.9651786
sample estimates:
      cor 
0.9387684 ¿Que nos falta?. Pues no sabemos si cumplimos con los supuestos. Veamos el de normalidad
par(mfrow=c(1,2))
qqnorm(x, main="Q-Q plot x"); qqline(x, col = 2, lty = 2)
qqnorm(y, main="Q-Q plot y"); qqline(y, col = 2, lty = 2)

¿Que opciones tengo?.
Hacer una prueba de sesgo y kurtosis para ver si estas desviaciones son significativas
Si son significativas, puedo intentar transformaciones o puedo utilizar muchas de las otras pruebas de correlación que son robustas a la violación de este supuesto. Vean Q y k p.76 y Crawley p.97-102.