%%%%%%% TEST DI ADATTAMENTO Med<-read.table(file="test_medicina.txt") Med2<-Med[,2] Med2 hist(Med2,breaks=40) qqnorm(Med2) % eseguiamo il test di Kolmogorov-Smirnov: m <- mean(Med2) sd <- sd(Med2) ks.test(Med2,"pnorm",m,sd) % eliminiamo le "ties": Med2.aux <- Med2+0.00000001*sd*rnorm(length(Med2),0,1) ks.test(Med2.aux,"pnorm",m,sd) % a livello 0.05 il test non avrebbe rifiutato l'ipotesi % nulla, cioè l'ipotesi che i dati siano gaussiani di % media m e deviazione sd. ----------------------------------- % Altro esempio: verifichiamo il teorema limite centrale. % La somma di N v.a. esponenziali è gaussiana? N <- 10 n.camp <- 1000 s <- matrix(nrow=n.camp) z <- matrix(nrow=n.camp) for(k in 1:n.camp) { s[k] <- sum(rexp(N, rate = 1)) z[k] <- (s[k]-N)/sqrt(N) } hist(z,20) ks.test(z,"pnorm",0,1) % provare al variare di N e n.camp. % Con N=10, n.camp=1000, rifiuta la gaussianità, % ma con n.camp=100 no (KS è molto severo se il campione è % molto numeroso). % Si noti che il risultato ottenuto per Med è particolarmente buono, vista l'elevata numerosità del campione. ------------------------------- % Test chi quadro di adattamento plot((0:1000)/30,dchisq((0:1000)/30,10)) n.class <- 2 points <- 10*(0:n.class)/n.class-5 hist <- hist(z, br = points, freq = FALSE) hist plot(hist) f <- hist$counts ecdf <- pnorm(points[2:(n.class+1)],0,1) ecdf.shift <- pnorm(points[1:n.class],0,1) p <- (ecdf-ecdf.shift)/sum((ecdf-ecdf.shift)) plot(p) chisq.test(f, p=p, rescale.p = TRUE) ----------------------------------- % Torniamo alla regressione ed i suoi test % (adattamento ad un modello) IB <- read.table(file="indicatori_benessere.txt",header=TRUE) SA<-IB$SA.SC TD<-IB$TD SA.TD <- lm(SA ~ TD) SA.TD plot(TD,SA) x <- ((min(TD)*10):(max(TD)*10))/10 y <- SA.TD$coefficient[1]+SA.TD$coefficient[2]*x lines(x,y) % plot alternativo con linne di confidenza al 95%: plot(TD,SA) abline(SA.TD$coefficient) res<-SA.TD$residuals delta <- sd(res)*qnorm(1-0.05/2) abline(SA.TD$coefficient+c(delta,0), lty=2) abline(SA.TD$coefficient+c(-delta,0), lty=2) % giudichiamo la bontà della regressione: summary(SA.TD) % Si osservi la riga di TD. Viene eseguito un test circa la rilevanza del fattore TD. L'ipotesi nulla è che il campione provenga dal modello senza tale fattore. Si trova p molto piccolo: si rifiuta l'ipotesi, quindi si afferma che l'assenza di quel fattore non spiega i dati. % Si osservi l'ultima riga. Viene eseguito un test circa la rilevanza del modello nel suo complesso. L'ipotesi nulla è che il campione provenga dal modello senza alcun fattore. Si trova p molto piccolo: si rifiuta l'ipotesi, quindi si afferma che l'assenza di quel fattore non spiega i dati.