DECA

Published on December 2016 | Categories: Documents | Downloads: 67 | Comments: 0 | Views: 292
of 14
Download PDF   Embed   Report

Taller sobre Diseño de experimentos completamente aleatorizados

Comments

Content

Taller No. 1 Martes 2 de Septiembre de 2014
Dise˜no de Experimento UnalMed
Cinco m´aquinas fueron dise˜nadas para producir cierto tipo de tubos cuyos di´ametros deben ser aproximadamente 14.0 c.m. En un estudio piloto, se seleccionaron aleatoriamente cinco tubos del total de
los tubos producidos por cada m´aquina y se midieron sus di´ametros ¿Hay alguna diferencia entre los
di´ametros de los tubos producidos por las diferentes m´aquinas?. Usar α = 0.05 en todas las pruebas.
Los datos recolectados son los siguientes:
M´aquinas
1
2
3
4
5

14.0
13.9
14.1
13.6
13.8

Di´ametros
14.1 14.2 14.0
13.8 13.9 14.0
14.2 14.1 14.0
13.8 14.0 13.9
13.6 13.9 13.8

14.1
14.0
13.9
13.7
14.0

1. Identifique la variable respuesta, la variable que define el factor y los tratamientos. Realice un
an´alisis de varianza para determinar si existe diferencia significativa entre las m´aquinas, escriba
las respectivas hip´otesis e interprete sus t´erminos. Escriba la expresi´on para el valor P de la prueba.
Soluci´on: La variable respuesta es: Di´ametros de los tubos.
yij : Di´ametro del j-´esimo tubo producido para la i´esima m´aquina, i = 1, 2, . . . , 5 y j =
1, 2, . . . , 5.
Factor: Tipo de m´aquina
Niveles del Factor: M´aquinas 1,2,3,4 y 5.
An´alisis de varianza para analizar la significancia del factor.
(
H0 : µ1 = µ2 = µ3 = µ4 = µ5
Ha : µi 6= µj , p.a i 6= j
α = 0.05.
F =

M Strat
M SE

∼ Fa−1,N −a = F4,20 .

Se rechaza H0 si FCal > F0.05;4,20 = 2.87.
FCal = 5.77, V alorp = P [F4,20 > FCal ] = P [F4,20 > 5.77] = 0.002957

Fuente de Var
Trat.
Error
Total

Tabla Anova
Sum Sq Df Mean Sq
0.3416
4
0.0854
0.2960 20
0.0148
0.6376 24
1

F value
5.77

Pr(>F)
0.0030

2. Estime e interprete (signo) los efectos de cada uno de los tratamientos.
Soluci´on:

Medias
1
2
3
4
5
µ
ˆ = y ··
µ
ˆi = y i· 14.08 13.92 14.06 13.80 13.82 13.94
τˆi = y i· − y ·· 0.14 -0.02 0.12 -0.14 -0.12
Si2 0.007 0.007 0.013 0.025 0.022
Estos estimadores de los efectos nos dan informaci´on muestral, sin todav´ıa indicar si son significativos, acerca de qu´e m´aquinas producen di´ametros en los tubos de acero por debajo del promedio
global (M´aquinas 2, 4 y 5) y aquellas que producen di´ametros mayores a la media global, M´aquinas
1 y 3.
Es posible por la magnitud de los efectos estimados y debido a que la prueba F dio significativa,
que las m´aquinas 1, 3, 4 y 5, sean las responsables del rechazo de Ho.
3. Verifique el supuesto de homogeneidad de varianza entre los tratamientos. Use la prueba de Levene
modificada. Haga en forma expl´ıcita la prueba de Bartlett, realice cada uno de los c´alculos.
Soluci´on:

Prueba de Bartlett
(
H0 : σ12 = σ22 = σ32 = σ42 = σ52 = σ 2
Ha : σi2 6= σ 2 , p.a i

α = 0.05.
χ20 = 2.3026

q
c

donde:

q = (N −

a)Log10 Sp2



a
X

(ni − 1)Log10 Si2

i=1

= 20Log10 Sp2 − 4

5
X

Log10 Si2

i=1

= −36.59 + 37.82 = 1.23
y

" a
#
X 1
1
1
c=1+

3(a − 1) i=1 ni − 1 N − a
" 5
#
1 X1
1
13
=1+

=
= 1.083
12 i=1 4 20
12

2

con,
Sp2 =

P5

− 1)Si2
4
=
N −a

i=1 (ni

P5

2
i=1 Si

20

= 0.0148

y Si2 -es la varianza muestral del i-´esimo tratamiento.
Luego,

1.23
q
= 2.615
χ20 = 2.3026 = 2.3026
c
1.083
y

χ20.05;a−1 = χ20.05;4 = 9.48
luego, como χ20 < χα;a−1 = χtabla , entonces no rechazamos H= 0, ie. la varianza de los tratamientos se puede considerar iguales a un nivel de significancia del 5%.
Usando R:

Prueba de Bartlett
Bartlett test of homogeneity of variances
data: y by algodon
Bartlett’s K-squared = 2.5689, df = 4, p-value = 0.6323

Prueba de Levene:Modeificada
Levene’s Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 4 0.5667 0.6897
20
4. Verifique el supuesto de normalidad de los errores. Plantee las hip´otesis y concluya.
Soluci´on:

(
H0 : Los εij se distribuyen normal
Ha : Los εij No-se distribuyen normal

α = 0.05
Prueba de Shapiro-Wilks
Shapiro-Wilk normality test
data: residuales
W = 0.9818, p-value = 0.9186
Conclusi´on. No hay evidencia para rechazar a un nivel de significancia del 5%. Por tanto los
errores tienen distribuci´on normal.

3

0.2
0.1
0.0
−0.2

−0.1

0.0
−0.1
−0.2

Cuantiles muestrales

0.1

0.2

Gráfico cuantil−cuantil (qq−plot) Gráfico de cajas (Box−Plot)

−2

−1

0

1

2

Cuantiles teóricos

Residuales

5. ¿Se podr´a afirmar que la m´aquina 5 ofrece en promedio los mismos resultados de las otras m´aquinas?
Plantee un contraste y realice la respectiva prueba de hip´otesis.
Soluci´on:

(
H0 : µ5 =
Ha : µ5 6=

µ1 +µ2 +µ3 +µ4
4
µ1 +µ2 +µ3 +µ4
4

(
H0 : 4µ5 − µ1 − µ2 − µ3 − µ4 = 0
⇐⇒
Ha : 4µ5 − µ1 − µ2 − µ3 − µ4 6= 0

α = 0.05
Pa

i=1 ci y i·
T0 = p
∼ tN −a .
P
M SE ai=1 c2i /ni

4

(
H0 : C = 0
⇐⇒
Ha : C 6= 0

P5

i=1 ci y i·
T0 = q
P
M SE 5i=1 c2i /ni

=

(−1(14.08) − 1(13.92) − 1(14.06) − 1(13.80) + 4(13.82))
q
0.01
5 (1 + 1 + 1 + 1 + 16)

=

−0.58
= −2.9
0.2

Tα/2;N −a = T0.025;20 = 2.086.
Luego, como |T0 | = 2.9 > 2.086 = Ttabla , entonces se rechaza H0 , ie. a un nivel del
5%, la m´aquina 5 produce en promedio tubos de acero con di´ametros distintos del promedio de los
di´ametros producidos por las otras cuatro m´aquinas.
6. Plantee un conjunto de 4-contrastes ortogonales. Realice la prueba de significancia para cada uno
de ellos y verifique la igualdad: SST rat. = SSC1 + SSC2 + SSC3 + SSC4 .
Soluci´on: Se plantea el siguiente conjunto de contrastes ortogonales:

C1
C2
C3
C4

= µ4 − µ5
= µ1 + µ3 − µ4 − µ5
= µ1 − µ3
= 4µ2 − µ1 − µ3 − µ4 − µ5

En R:
> contraste
1
4 vs 5
0
1+3 vs 4+5
1
1 vs 3
1
4(2) vs 1+3+4+5 -1

2 3 4 5
0 0 1 -1
0 1 -1 -1
0 -1 0 0
4 -1 -1 -1

La estimaci´on de cada contraste es:
General Linear Hypotheses
Multiple Comparisons of Means: User-defined Contrasts

Linear Hypotheses:
Estimate
4 vs 5 == 0
-0.02
1+3 vs 4+5 == 0
0.52
1 vs 3 == 0
0.02
4(2) vs 1+3+4+5 == 0
-0.08
5

La PH de cada contraste es:
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: User-defined Contrasts

Fit: aov(formula = y ˜ algodon)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
4 vs 5 == 0
-0.02000
0.07694 -0.260 0.998067
1+3 vs 4+5 == 0
0.52000
0.10881
4.779 0.000463 ***
1 vs 3 == 0
0.02000
0.07694
0.260 0.998073
4(2) vs 1+3+4+5 == 0 -0.08000
0.24331 -0.329 0.995216
--Signif. codes: 0 ?***? 0.001 ?**? 0.01 ?*? 0.05 ?.? 0.1 ? ? 1
(Adjusted p values reported -- single-step method)
Las sumas de cuadrado de cada contraste es:

P
2
n [ ai=1 ci y i· ]
Pa 2 ,
SSC =
i=1 ci
luego:
n

hP

5
i=1 ci y i·

SSC1 =

i2

P5

2
i=1 ci

n

hP

5
i=1 ci y i·

SSC2 =

2
i=1 ci

n

5
i=1 ci y i·

SSC3 =

2
i=1 ci

hP

SSC4 =

5
i=1 ci y i·

P5

2
i=1 ci

=

5(0.52)2
= 0.338
4

=

5(0.02)2
= 0.001
2

=

5(0.08)2
= 0.0016
20

i2

P5
n

5(0.02)2
= 0.001
2

i2

P5
hP

=

i2

de donde,

SST rat. = SSC1 + SSC2 + SSC3 + SSC4 = 0.3416,
como puede verse de la tabla a nova.

6

7. Suponiendo que la m´aquina 1 es la m´aquina est´andar, control, determine si conjuntamente los
resultados de las otras m´aquinas difieren del est´andar, use el m´etodo de comparaciones de Dunnet.
Soluci´on:

Comparaciones con un control (5), M´etodo de Dunnet
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: User-defined Contrasts

Fit: aov(formula = y ˜ algodon)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
1 vs 5 == 0 0.26000
0.07694
3.379
0.0104 *
2 vs 5 == 0 0.10000
0.07694
1.300
0.5145
3 vs 5 == 0 0.24000
0.07694
3.119
0.0184 *
4 vs 5 == 0 -0.02000
0.07694 -0.260
0.9967
--Signif. codes: 0 ?***? 0.001 ?**? 0.01 ?*? 0.05 ?.? 0.1 ? ? 1
(Adjusted p values reported -- single-step method)
Las m´aquinas que difieren del control (5) son las m´aquinas 1 y 3, a un nivel de significancia del
5%, es decir que los di´ametros promedios de los tubos de acero de estas m´aquinas son diferentes a
los de la m´aquina 5, (est´andar o control).
8. Compare los tratamientos y recomiende el mejor, para ello tenga en cuenta las comparaciones
de Tukey y Duncan, adem´as del an´alisis descriptivo usando los boxplots. Con este dise˜no puede
concluirse ¿cu´al de las m´aquinas da mejores di´ametros que cumplan con las especificaciones?
Soluci´on:

Comparaciones mediante el M´etodo de Tukey
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = y ˜ algodon)
$algodon
diff
2-1 -0.16
3-1 -0.02
4-1 -0.28
5-1 -0.26
3-2 0.14
4-2 -0.12
5-2 -0.10
4-3 -0.26
5-3 -0.24
5-4 0.02

lwr
-0.3902379
-0.2502379
-0.5102379
-0.4902379
-0.0902379
-0.3502379
-0.3302379
-0.4902379
-0.4702379
-0.2102379

upr
0.070237895
0.210237895
-0.049762105
-0.029762105
0.370237895
0.110237895
0.130237895
-0.029762105
-0.009762105
0.250237895
7

p adj
0.2669972
0.9989043
0.0125769
0.0221607
0.3904049
0.5382897
0.6944089
0.0221607
0.0384679
0.9989043

5−4

5−3

4−3

5−2

4−2

3−2

5−1

4−1

3−1

2−1

95% family−wise confidence level

−0.4

−0.2

0.0

0.2

Differences in mean levels of algodon

Soluci´on:

Comparaciones mediante el M´etodo de Duncan
$statistics
Mean
CV MSerror
13.936 0.8729567 0.0148
$parameters
Df ntr
20
5
$Duncan
Table CriticalRange
2 2.949998
0.1604972
3 3.096506
0.1684682
4 3.189616
0.1735339
5 3.254648
0.1770720
$means
y
1 14.08
2 13.92
3 14.06
4 13.80
5 13.82

std
0.0836660
0.0836660
0.1140175
0.1581139
0.1483240

r
5
5
5
5
5

Min
14.0
13.8
13.9
13.6
13.6

Max
14.2
14.0
14.2
14.0
14.0
8

0.4

$comparison
NULL
$groups
trt means M
1
1 14.08 a
2
3 14.06 a
3
2 13.92 ab
4
5 13.82 b
5
4 13.80 b

14.0
13.9
13.8
13.7
13.6

Díametros de los tubos (Y)

14.1

14.2

Box−Plot para Diámetros (Y) por máquinas

1

2

3
Máquinas

9

4

5

14.0
13.9
13.8
13.6

13.7

Díametros de los tubos (Y)

14.1

14.2

Gráfico de Medias e IC

n=5

n=5

n=5

n=5

n=5

1

2

3

4

5

Máquinas

9. Si se deseara hacer un dise˜no posterior, usando las estimaciones de este dise˜no, determine el
n´umero de r´eplicas que se deber´ıan hacer si se desea observar una LSD de 0.3 cm. Adem´as, cu´antas
r´eplicas ser´ıan necesarias si se desea una potencia de 0.90, con una diferencia entre cualquier par
de medias de tratamientos de a lo sumo 0.3 cm.
Soluci´on:

α = 0.05
n0 = 5 , σ
ˆ 2 = M SE = 0.0148 , DT = 1 , a = 5 , N − a = a(n0 − 1)
luego,

[tα/2;a(n0 −1) ]2
[t0.025;20 ]2
(2.086)2
n=
2M
SE
=
2(0.0148)
=
2(0.0148) = 1.43 =≈ 2
DT2
(0.3)2
(0.3)2
donde, t0.025;20

= 2.086.

Se necesitar´an aproximadamente 2 r´eplicas en cada m´aquina para observar una LSD del orden
de 0, 3 cm y con un nivel de confianza del 95%. ( Nota: la LSD actual, ie. con n=5, es de:
LSD = 0.1605).
Ahora, para una potencia de 0.90, con una diferencia entre cualquier par de medias de tratamientos
de a lo sumo 0.3 cm, se tiene lo siguiente:

Φ2 = n ∗ f 2 , es decir,
10

r
f=

s

D2
2aσ 2

=

(0.3)2
= 0.7798,
2(5)0.0148

es decir,

Φ2 = n ∗ f 2 = 0.608n,
Balanced one-way analysis of variance power calculation
k
n
f
sig.level
power

=
=
=
=
=

5
6.102684
0.7798
0.05
0.9

NOTE: n is number in each group
Es decir, el n´umero de observaciones requerido en cada grupo es de 7, para que se rechace H0 al
detectar diferencias muy peque˜nas entre pares de medias, ie. diferencias del orden de D = 0.3 cm
y alcanzar una potencia del 90%.
Nota: Con n = 2 y D = 0.3, la potencia que se tiene es de alrededor del 30%.
10. Suponga que las cinco m´aquinas fueron seleccionadas aleatoriamente de una poblaci´on de varias
m´aquinas disponibles en la empresa. Replantee el modelo junto con sus supuestos y realice la
prueba de hip´otesis respectiva para probar la significancia del tipo m´aquina.
Soluci´on:

Modelo de efectos aleatorios
yij = µ + τi + εij
con i = 1, 2, . . . , 5 y j = 1, 2, . . . 5 y donde τi y εij -son variables aleatorias.

Supuetos:
• τi ∼ N (0, στ2 )
• εij ∼ N (0, σ 2 )
• τi , εij son independientes, de donde, que V ar(yij ) = στ2 + σ 2 .
La prueba de hip´otesis de inter´es es:

(
H0 : στ2 = 0
Ha : στ2 > 0
La estad´ıstica de prueba, esta dada por:

F =
Se rechaza H0

SST rat /(a − 1) M ST rat
=
∼ Fa−1,N −a ∼ F4,20
SSE /(N − a)
M SE

si FCal > Fα;4,20 .
11

Fuente de Var
Trat.
Error
Total

Tabla Anova
Sum Sq Df Mean Sq
0.34
4
0.09
0.30 20
0.01
0.64 24

F value
5.77

Pr(>F)
0.0030

de donde, Como

FCal. = 5.77 > 2.87 = F0.05;4,20 = Fα;a−1,N −a
entonces, Se rechaza H0

: στ2 = 0, ie. que existe una variabilidad entre los

tratamientos, ie. entre las m´aquinas a un nivel de significancia de 0.05.
Las estimaci´on de las componentes de varianza son:

σ
ˆτ2 =

0.085 − 0.015
M ST rat − M SE
=
= 0.014
n
5

y

σ
ˆ 2 = M SE = 0.0148.
La varianza de cualquier observaci´on de la muestra es:

Vd
ar(yij ) = σ
ˆτ2 + σ
ˆ 2 = 0.014 + 0.0148 = 0.0288,
de donde se observa que aproximadamente el 48% de la variabilidad se
atribuye a diferencias entre las m´aquinas.
Codigo en R:
y<-c(14,14.1,14.2,14,14.1,13.9,13.8,13.9,14,14,14.1,14.2,14.1,14,13.9,
13.6,13.8,14,13.9,13.7,13.8,13.6,13.9,13.8,14)
factor<-c(rep(1,5),rep(2,5),rep(3,5),rep(4,5),rep(5,5))
algodon<-as.factor(factor)
anova.y <- aov(y˜algodon)
summary(anova.y)
#1-pf(5.77,4,20)
# Media Globla y Efectos de tratamientos
grp.means <- tapply(y,algodon,mean)
(global.media <- mean(y))
tapply(y,algodon,function(x) mean(x)-global.media)
tapply(y,algodon,function(x) var(x))
tapply(y,algodon,function(x) sd(x))
# Gr´
afico de Medias
stripchart(y˜algodon,vert=T,method="overplot",pch=1,col="red",ylab="")
stripchart(as.numeric(grp.means)˜as.numeric(names(grp.means)),
pch="*",cex=1.5,vert=T,add=T)
title(main="Resistencia a la Tensi´
on ", ylab="Resistencia a la tensi´
on
Observada(lb/pul2)",
xlab="Porcentajes de Algod´
on")
legend("bottomright", "Medias de Grupos o Tratos.",pch="*",bty="n")
12

#Validaci´
on de Supuestos
par(mfrow=c(1,2),cex=.8)
plot(fitted(anova.y),residuals(anova.y))
qqnorm(residuals(anova.y))
qqline(residuals(anova.y))
################################################################
#prueba de independencia
#require(car)
plot(residuals(anova.y), pch=16, ylab="Residuales", xlab="Orden",
main="Gr´
afico de Residuales vs Orden")
abline(h=0)
#############################################################
#pruebas de homogeneidad de varianza
#prueba de Bartlett para homegeneidad de varianza (normalidad bien)
bartlett.test(y˜algodon)
#prueba de Levene para homegeneidad de varianza (sospecha de normalidad)
levene.test(anova.y)
###########################################
install.packages("car")
require(car)
#library(car)
leveneTest(y˜algodon)
bartlett.test(y˜algodon)
#bptest(y˜algodon)
#bptest(anova.y)
#pruebas de normalidad
######################################################################
residuales <- residuals(anova.y)
#valores_ajustados<-(fitted(anova.y))
par(mfrow=c(1,2))
qqnorm(residuales, xlab="Cuantiles te´
oricos", ylab="Cuantiles
muestrales",
main="Gr´
afico cuantil-cuantil (qq-plot)")
qqline(residuales)
boxplot(residuales, xlab="Residuales", main="Gr´
afico de cajas
(Box-Plot)")
###### pruebas an´
aliticas
#install.packages("nortest")
######
#require(nortest)
shapiro.test(residuales)
#####################################################################
#Boxplot de Residuales
boxplot(residuals(anova.y)˜algodon)
abline(h=mean(residuals(anova.y)),col="red")
title(main="Gr´
afica de Residuos Por Tratameintos",
ylab="Residuos", xlab="Porcentajes de Algod´
on")

13

############################################
library(agricolae)
require(agricolae)
mds<-LSD.test(anova.y, "algodon")
mds
tukey<-TukeyHSD(anova.y, "algodon")
tukey
plot(TukeyHSD(anova.y, "algodon"))
duncann<-duncan.test(anova.y, "algodon")
duncann
##################################
# Para realizar el grafico de medias instalamos la librer´
ıa gplots
#install.packages("gplots")
# Llamado de la librer´
ıa gplots
#require(gplots)
# An´
alisis descriptivo y gr´
afico
par(mfrow=c(1,2))
boxplot(y˜algodon,main="Box-Plot para Di´
ametros (Y) por

aquinas",xlab="M´
aquinas",ylab="D´
ıametros de los tubos (Y)")
# Gr´
afico de medias
plotmeans(y˜algodon,p=0.95,main="Gr´
afico de Medias e
IC",xlab="M´
aquinas",ylab="D´
ıametros de los tubos (Y)")
##################################################
#library(mvtnorm)
#library(multcomp)
#library(survival)
#library(splines)
#library(TH.data)
##################################################
contraste <- rbind("4 vs 5"=c(0,0,0,1,-1),"1+3 vs 4+5"
=c(1,0,1,-1,-1), "1 vs 3"=c(1,0,-1,0,0),"4(2) vs 1+3+4+5"=c(-1,4,-1,-1,-1))
filas<-c("4 vs 5","1+3 vs 4+5","1 vs 3","4(2) vs 1+3+4+5" )
columnas<-c("1","2","3","4","5")
dimnames(contraste)<-list(filas,columnas)
contraste
model<- aov(y˜algodon)
compara<-glht(model, linfct = mcp(algodon = contraste))
compara
summary(compara)
######################################
## library(pwr)
######################################
pwr.anova.test(f=0.7798, k=5, power=0.9, sig.level=0.05)
pwr.anova.test(f=0.7798, k=5, power=0.3, sig.level=0.05)

14

Sponsor Documents

Or use your account on DocShare.tips

Hide

Forgot your password?

Or register your new account on DocShare.tips

Hide

Lost your password? Please enter your email address. You will receive a link to create a new password.

Back to log-in

Close