Taller sobre Diseño de experimentos completamente aleatorizados
Comments
Content
Taller No. 1 Martes 2 de Septiembre de 2014
Dise˜no de Experimento UnalMed
Cinco m´aquinas fueron dise˜nadas para producir cierto tipo de tubos cuyos di´ametros deben ser aproximadamente 14.0 c.m. En un estudio piloto, se seleccionaron aleatoriamente cinco tubos del total de
los tubos producidos por cada m´aquina y se midieron sus di´ametros ¿Hay alguna diferencia entre los
di´ametros de los tubos producidos por las diferentes m´aquinas?. Usar α = 0.05 en todas las pruebas.
Los datos recolectados son los siguientes:
M´aquinas
1
2
3
4
5
1. Identifique la variable respuesta, la variable que define el factor y los tratamientos. Realice un
an´alisis de varianza para determinar si existe diferencia significativa entre las m´aquinas, escriba
las respectivas hip´otesis e interprete sus t´erminos. Escriba la expresi´on para el valor P de la prueba.
Soluci´on: La variable respuesta es: Di´ametros de los tubos.
yij : Di´ametro del j-´esimo tubo producido para la i´esima m´aquina, i = 1, 2, . . . , 5 y j =
1, 2, . . . , 5.
Factor: Tipo de m´aquina
Niveles del Factor: M´aquinas 1,2,3,4 y 5.
An´alisis de varianza para analizar la significancia del factor.
(
H0 : µ1 = µ2 = µ3 = µ4 = µ5
Ha : µi 6= µj , p.a i 6= j
α = 0.05.
F =
M Strat
M SE
∼ Fa−1,N −a = F4,20 .
Se rechaza H0 si FCal > F0.05;4,20 = 2.87.
FCal = 5.77, V alorp = P [F4,20 > FCal ] = P [F4,20 > 5.77] = 0.002957
Fuente de Var
Trat.
Error
Total
Tabla Anova
Sum Sq Df Mean Sq
0.3416
4
0.0854
0.2960 20
0.0148
0.6376 24
1
F value
5.77
Pr(>F)
0.0030
2. Estime e interprete (signo) los efectos de cada uno de los tratamientos.
Soluci´on:
Medias
1
2
3
4
5
µ
ˆ = y ··
µ
ˆi = y i· 14.08 13.92 14.06 13.80 13.82 13.94
τˆi = y i· − y ·· 0.14 -0.02 0.12 -0.14 -0.12
Si2 0.007 0.007 0.013 0.025 0.022
Estos estimadores de los efectos nos dan informaci´on muestral, sin todav´ıa indicar si son significativos, acerca de qu´e m´aquinas producen di´ametros en los tubos de acero por debajo del promedio
global (M´aquinas 2, 4 y 5) y aquellas que producen di´ametros mayores a la media global, M´aquinas
1 y 3.
Es posible por la magnitud de los efectos estimados y debido a que la prueba F dio significativa,
que las m´aquinas 1, 3, 4 y 5, sean las responsables del rechazo de Ho.
3. Verifique el supuesto de homogeneidad de varianza entre los tratamientos. Use la prueba de Levene
modificada. Haga en forma expl´ıcita la prueba de Bartlett, realice cada uno de los c´alculos.
Soluci´on:
Prueba de Bartlett
(
H0 : σ12 = σ22 = σ32 = σ42 = σ52 = σ 2
Ha : σi2 6= σ 2 , p.a i
α = 0.05.
χ20 = 2.3026
q
c
donde:
q = (N −
a)Log10 Sp2
−
a
X
(ni − 1)Log10 Si2
i=1
= 20Log10 Sp2 − 4
5
X
Log10 Si2
i=1
= −36.59 + 37.82 = 1.23
y
" a
#
X 1
1
1
c=1+
−
3(a − 1) i=1 ni − 1 N − a
" 5
#
1 X1
1
13
=1+
−
=
= 1.083
12 i=1 4 20
12
2
con,
Sp2 =
P5
− 1)Si2
4
=
N −a
i=1 (ni
P5
2
i=1 Si
20
= 0.0148
y Si2 -es la varianza muestral del i-´esimo tratamiento.
Luego,
1.23
q
= 2.615
χ20 = 2.3026 = 2.3026
c
1.083
y
χ20.05;a−1 = χ20.05;4 = 9.48
luego, como χ20 < χα;a−1 = χtabla , entonces no rechazamos H= 0, ie. la varianza de los tratamientos se puede considerar iguales a un nivel de significancia del 5%.
Usando R:
Prueba de Bartlett
Bartlett test of homogeneity of variances
data: y by algodon
Bartlett’s K-squared = 2.5689, df = 4, p-value = 0.6323
Prueba de Levene:Modeificada
Levene’s Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 4 0.5667 0.6897
20
4. Verifique el supuesto de normalidad de los errores. Plantee las hip´otesis y concluya.
Soluci´on:
(
H0 : Los εij se distribuyen normal
Ha : Los εij No-se distribuyen normal
α = 0.05
Prueba de Shapiro-Wilks
Shapiro-Wilk normality test
data: residuales
W = 0.9818, p-value = 0.9186
Conclusi´on. No hay evidencia para rechazar a un nivel de significancia del 5%. Por tanto los
errores tienen distribuci´on normal.
3
0.2
0.1
0.0
−0.2
−0.1
0.0
−0.1
−0.2
Cuantiles muestrales
0.1
0.2
Gráfico cuantil−cuantil (qq−plot) Gráfico de cajas (Box−Plot)
−2
−1
0
1
2
Cuantiles teóricos
Residuales
5. ¿Se podr´a afirmar que la m´aquina 5 ofrece en promedio los mismos resultados de las otras m´aquinas?
Plantee un contraste y realice la respectiva prueba de hip´otesis.
Soluci´on:
Tα/2;N −a = T0.025;20 = 2.086.
Luego, como |T0 | = 2.9 > 2.086 = Ttabla , entonces se rechaza H0 , ie. a un nivel del
5%, la m´aquina 5 produce en promedio tubos de acero con di´ametros distintos del promedio de los
di´ametros producidos por las otras cuatro m´aquinas.
6. Plantee un conjunto de 4-contrastes ortogonales. Realice la prueba de significancia para cada uno
de ellos y verifique la igualdad: SST rat. = SSC1 + SSC2 + SSC3 + SSC4 .
Soluci´on: Se plantea el siguiente conjunto de contrastes ortogonales:
En R:
> contraste
1
4 vs 5
0
1+3 vs 4+5
1
1 vs 3
1
4(2) vs 1+3+4+5 -1
2 3 4 5
0 0 1 -1
0 1 -1 -1
0 -1 0 0
4 -1 -1 -1
La estimaci´on de cada contraste es:
General Linear Hypotheses
Multiple Comparisons of Means: User-defined Contrasts
Linear Hypotheses:
Estimate
4 vs 5 == 0
-0.02
1+3 vs 4+5 == 0
0.52
1 vs 3 == 0
0.02
4(2) vs 1+3+4+5 == 0
-0.08
5
La PH de cada contraste es:
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: User-defined Contrasts
Fit: aov(formula = y ˜ algodon)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
4 vs 5 == 0
-0.02000
0.07694 -0.260 0.998067
1+3 vs 4+5 == 0
0.52000
0.10881
4.779 0.000463 ***
1 vs 3 == 0
0.02000
0.07694
0.260 0.998073
4(2) vs 1+3+4+5 == 0 -0.08000
0.24331 -0.329 0.995216
--Signif. codes: 0 ?***? 0.001 ?**? 0.01 ?*? 0.05 ?.? 0.1 ? ? 1
(Adjusted p values reported -- single-step method)
Las sumas de cuadrado de cada contraste es:
P
2
n [ ai=1 ci y i· ]
Pa 2 ,
SSC =
i=1 ci
luego:
n
hP
5
i=1 ci y i·
SSC1 =
i2
P5
2
i=1 ci
n
hP
5
i=1 ci y i·
SSC2 =
2
i=1 ci
n
5
i=1 ci y i·
SSC3 =
2
i=1 ci
hP
SSC4 =
5
i=1 ci y i·
P5
2
i=1 ci
=
5(0.52)2
= 0.338
4
=
5(0.02)2
= 0.001
2
=
5(0.08)2
= 0.0016
20
i2
P5
n
5(0.02)2
= 0.001
2
i2
P5
hP
=
i2
de donde,
SST rat. = SSC1 + SSC2 + SSC3 + SSC4 = 0.3416,
como puede verse de la tabla a nova.
6
7. Suponiendo que la m´aquina 1 es la m´aquina est´andar, control, determine si conjuntamente los
resultados de las otras m´aquinas difieren del est´andar, use el m´etodo de comparaciones de Dunnet.
Soluci´on:
Comparaciones con un control (5), M´etodo de Dunnet
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: User-defined Contrasts
Fit: aov(formula = y ˜ algodon)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
1 vs 5 == 0 0.26000
0.07694
3.379
0.0104 *
2 vs 5 == 0 0.10000
0.07694
1.300
0.5145
3 vs 5 == 0 0.24000
0.07694
3.119
0.0184 *
4 vs 5 == 0 -0.02000
0.07694 -0.260
0.9967
--Signif. codes: 0 ?***? 0.001 ?**? 0.01 ?*? 0.05 ?.? 0.1 ? ? 1
(Adjusted p values reported -- single-step method)
Las m´aquinas que difieren del control (5) son las m´aquinas 1 y 3, a un nivel de significancia del
5%, es decir que los di´ametros promedios de los tubos de acero de estas m´aquinas son diferentes a
los de la m´aquina 5, (est´andar o control).
8. Compare los tratamientos y recomiende el mejor, para ello tenga en cuenta las comparaciones
de Tukey y Duncan, adem´as del an´alisis descriptivo usando los boxplots. Con este dise˜no puede
concluirse ¿cu´al de las m´aquinas da mejores di´ametros que cumplan con las especificaciones?
Soluci´on:
Comparaciones mediante el M´etodo de Tukey
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = y ˜ algodon)
$algodon
diff
2-1 -0.16
3-1 -0.02
4-1 -0.28
5-1 -0.26
3-2 0.14
4-2 -0.12
5-2 -0.10
4-3 -0.26
5-3 -0.24
5-4 0.02
$comparison
NULL
$groups
trt means M
1
1 14.08 a
2
3 14.06 a
3
2 13.92 ab
4
5 13.82 b
5
4 13.80 b
14.0
13.9
13.8
13.7
13.6
Díametros de los tubos (Y)
14.1
14.2
Box−Plot para Diámetros (Y) por máquinas
1
2
3
Máquinas
9
4
5
14.0
13.9
13.8
13.6
13.7
Díametros de los tubos (Y)
14.1
14.2
Gráfico de Medias e IC
n=5
n=5
n=5
n=5
n=5
1
2
3
4
5
Máquinas
9. Si se deseara hacer un dise˜no posterior, usando las estimaciones de este dise˜no, determine el
n´umero de r´eplicas que se deber´ıan hacer si se desea observar una LSD de 0.3 cm. Adem´as, cu´antas
r´eplicas ser´ıan necesarias si se desea una potencia de 0.90, con una diferencia entre cualquier par
de medias de tratamientos de a lo sumo 0.3 cm.
Soluci´on:
α = 0.05
n0 = 5 , σ
ˆ 2 = M SE = 0.0148 , DT = 1 , a = 5 , N − a = a(n0 − 1)
luego,
Se necesitar´an aproximadamente 2 r´eplicas en cada m´aquina para observar una LSD del orden
de 0, 3 cm y con un nivel de confianza del 95%. ( Nota: la LSD actual, ie. con n=5, es de:
LSD = 0.1605).
Ahora, para una potencia de 0.90, con una diferencia entre cualquier par de medias de tratamientos
de a lo sumo 0.3 cm, se tiene lo siguiente:
Φ2 = n ∗ f 2 , es decir,
10
r
f=
s
D2
2aσ 2
=
(0.3)2
= 0.7798,
2(5)0.0148
es decir,
Φ2 = n ∗ f 2 = 0.608n,
Balanced one-way analysis of variance power calculation
k
n
f
sig.level
power
=
=
=
=
=
5
6.102684
0.7798
0.05
0.9
NOTE: n is number in each group
Es decir, el n´umero de observaciones requerido en cada grupo es de 7, para que se rechace H0 al
detectar diferencias muy peque˜nas entre pares de medias, ie. diferencias del orden de D = 0.3 cm
y alcanzar una potencia del 90%.
Nota: Con n = 2 y D = 0.3, la potencia que se tiene es de alrededor del 30%.
10. Suponga que las cinco m´aquinas fueron seleccionadas aleatoriamente de una poblaci´on de varias
m´aquinas disponibles en la empresa. Replantee el modelo junto con sus supuestos y realice la
prueba de hip´otesis respectiva para probar la significancia del tipo m´aquina.
Soluci´on:
Modelo de efectos aleatorios
yij = µ + τi + εij
con i = 1, 2, . . . , 5 y j = 1, 2, . . . 5 y donde τi y εij -son variables aleatorias.
Supuetos:
• τi ∼ N (0, στ2 )
• εij ∼ N (0, σ 2 )
• τi , εij son independientes, de donde, que V ar(yij ) = στ2 + σ 2 .
La prueba de hip´otesis de inter´es es:
(
H0 : στ2 = 0
Ha : στ2 > 0
La estad´ıstica de prueba, esta dada por:
F =
Se rechaza H0
SST rat /(a − 1) M ST rat
=
∼ Fa−1,N −a ∼ F4,20
SSE /(N − a)
M SE
si FCal > Fα;4,20 .
11
Fuente de Var
Trat.
Error
Total
Tabla Anova
Sum Sq Df Mean Sq
0.34
4
0.09
0.30 20
0.01
0.64 24
: στ2 = 0, ie. que existe una variabilidad entre los
tratamientos, ie. entre las m´aquinas a un nivel de significancia de 0.05.
Las estimaci´on de las componentes de varianza son:
σ
ˆτ2 =
0.085 − 0.015
M ST rat − M SE
=
= 0.014
n
5
y
σ
ˆ 2 = M SE = 0.0148.
La varianza de cualquier observaci´on de la muestra es:
Vd
ar(yij ) = σ
ˆτ2 + σ
ˆ 2 = 0.014 + 0.0148 = 0.0288,
de donde se observa que aproximadamente el 48% de la variabilidad se
atribuye a diferencias entre las m´aquinas.
Codigo en R:
y<-c(14,14.1,14.2,14,14.1,13.9,13.8,13.9,14,14,14.1,14.2,14.1,14,13.9,
13.6,13.8,14,13.9,13.7,13.8,13.6,13.9,13.8,14)
factor<-c(rep(1,5),rep(2,5),rep(3,5),rep(4,5),rep(5,5))
algodon<-as.factor(factor)
anova.y <- aov(y˜algodon)
summary(anova.y)
#1-pf(5.77,4,20)
# Media Globla y Efectos de tratamientos
grp.means <- tapply(y,algodon,mean)
(global.media <- mean(y))
tapply(y,algodon,function(x) mean(x)-global.media)
tapply(y,algodon,function(x) var(x))
tapply(y,algodon,function(x) sd(x))
# Gr´
afico de Medias
stripchart(y˜algodon,vert=T,method="overplot",pch=1,col="red",ylab="")
stripchart(as.numeric(grp.means)˜as.numeric(names(grp.means)),
pch="*",cex=1.5,vert=T,add=T)
title(main="Resistencia a la Tensi´
on ", ylab="Resistencia a la tensi´
on
Observada(lb/pul2)",
xlab="Porcentajes de Algod´
on")
legend("bottomright", "Medias de Grupos o Tratos.",pch="*",bty="n")
12
#Validaci´
on de Supuestos
par(mfrow=c(1,2),cex=.8)
plot(fitted(anova.y),residuals(anova.y))
qqnorm(residuals(anova.y))
qqline(residuals(anova.y))
################################################################
#prueba de independencia
#require(car)
plot(residuals(anova.y), pch=16, ylab="Residuales", xlab="Orden",
main="Gr´
afico de Residuales vs Orden")
abline(h=0)
#############################################################
#pruebas de homogeneidad de varianza
#prueba de Bartlett para homegeneidad de varianza (normalidad bien)
bartlett.test(y˜algodon)
#prueba de Levene para homegeneidad de varianza (sospecha de normalidad)
levene.test(anova.y)
###########################################
install.packages("car")
require(car)
#library(car)
leveneTest(y˜algodon)
bartlett.test(y˜algodon)
#bptest(y˜algodon)
#bptest(anova.y)
#pruebas de normalidad
######################################################################
residuales <- residuals(anova.y)
#valores_ajustados<-(fitted(anova.y))
par(mfrow=c(1,2))
qqnorm(residuales, xlab="Cuantiles te´
oricos", ylab="Cuantiles
muestrales",
main="Gr´
afico cuantil-cuantil (qq-plot)")
qqline(residuales)
boxplot(residuales, xlab="Residuales", main="Gr´
afico de cajas
(Box-Plot)")
###### pruebas an´
aliticas
#install.packages("nortest")
######
#require(nortest)
shapiro.test(residuales)
#####################################################################
#Boxplot de Residuales
boxplot(residuals(anova.y)˜algodon)
abline(h=mean(residuals(anova.y)),col="red")
title(main="Gr´
afica de Residuos Por Tratameintos",
ylab="Residuos", xlab="Porcentajes de Algod´
on")
13
############################################
library(agricolae)
require(agricolae)
mds<-LSD.test(anova.y, "algodon")
mds
tukey<-TukeyHSD(anova.y, "algodon")
tukey
plot(TukeyHSD(anova.y, "algodon"))
duncann<-duncan.test(anova.y, "algodon")
duncann
##################################
# Para realizar el grafico de medias instalamos la librer´
ıa gplots
#install.packages("gplots")
# Llamado de la librer´
ıa gplots
#require(gplots)
# An´
alisis descriptivo y gr´
afico
par(mfrow=c(1,2))
boxplot(y˜algodon,main="Box-Plot para Di´
ametros (Y) por
m´
aquinas",xlab="M´
aquinas",ylab="D´
ıametros de los tubos (Y)")
# Gr´
afico de medias
plotmeans(y˜algodon,p=0.95,main="Gr´
afico de Medias e
IC",xlab="M´
aquinas",ylab="D´
ıametros de los tubos (Y)")
##################################################
#library(mvtnorm)
#library(multcomp)
#library(survival)
#library(splines)
#library(TH.data)
##################################################
contraste <- rbind("4 vs 5"=c(0,0,0,1,-1),"1+3 vs 4+5"
=c(1,0,1,-1,-1), "1 vs 3"=c(1,0,-1,0,0),"4(2) vs 1+3+4+5"=c(-1,4,-1,-1,-1))
filas<-c("4 vs 5","1+3 vs 4+5","1 vs 3","4(2) vs 1+3+4+5" )
columnas<-c("1","2","3","4","5")
dimnames(contraste)<-list(filas,columnas)
contraste
model<- aov(y˜algodon)
compara<-glht(model, linfct = mcp(algodon = contraste))
compara
summary(compara)
######################################
## library(pwr)
######################################
pwr.anova.test(f=0.7798, k=5, power=0.9, sig.level=0.05)
pwr.anova.test(f=0.7798, k=5, power=0.3, sig.level=0.05)