cohen

Published on January 2017 | Categories: Documents | Downloads: 30 | Comments: 0 | Views: 433
of 21
Download PDF   Embed   Report

Comments

Content


MÉTODO III
UNIDAD 1 : ANALISIS e INTERPRETACION de los DATOS
1.1 Análisis e Interpretación de los datos: última etapa del proceso lógico de investigación social que busca responder
a las preguntas iniciales de un proyecto de investigación. ¿Que es analizar e interpretar datos !elación del tipo
de análisis a realizar con las otras etapas en un proceso de la investigación. "bicación y l#mites del análisis
estad#stico de los datos.
UNIDAD 2 : El ANALISIS CUANTITATIVO de los DATOS
2.1. La Descripci! de las Varia"les# $Descripci! de la Po"laci! es%&diada'
2.1.1. Co!cep%o de Es%ad(s%ica: $stad#stica descriptiva e in%erencial. $l lugar de la estad#stica en la investigación
social y su relación con las etapas lógicas del dise&o de investigación.
2.1.2. Dis%ri"&cio!es de )rec&e!cias. *or+a e! ,&e se dis%ri"&-e! los da%os
Ca%e.or(as - )rec&e!cias.
'a distribución de %recuencias es la distribución de los datos en clases o categor#as indicando el número de casos que
pertenece a cada categor#a. $ste número se llama %recuencia de clase.
I!%er/alos - l(+i%es de clases. $l intervalo de clase de%ine una clase o categor#a (e): de *1 a *+ a&os,. 'os l#mites de
clase son sus números e-tremos: e): *1 es lúmite in%erior y *+ es el l#mite superior. 'os l#mites reales ser#an *..+ y
*+.+ (l#mite real in%erior y l#mite real superior,
A+pli%&d del i!%er/alo de clase - p&!%o +edio. 'a amplitud del intervalo de clase es la di%erencia entre los l#mites
reales de cada categor#a. $l punto medio es igual al l#mite in%erior más el l#mite superior dividido *.
Re.las .e!erales para )or+ar la dis%ri"&ci! de )rec&e!cias. Dis%ri"&ci! &!i/ariada: )rec&e!cias a"sol&%as -
rela%i/as# )rec&e!cias ac&+&ladas.
"na vez obtenidos los datos que estimamos relevantes para realizar el análisis deseado es conveniente ordenarlos
según algún criterio para obtener el má-imo de in%ormación posible. $l marco teórico en el que se inscriba el análisis
cuantitativo debe ser el criterio básico a seguir para agrupar los datos y realizar una comparación signi%icativa.
/ay tres tipos de distribuciones:
1. Dis%ri"&ci! de )rec&e!cias
*. Dis%ri"&ci! porce!%&al: 0ara calcular el porcenta)e de cada categor#a se divide la %recuencia de casos para
determinada clase por 1 y se multiplica el resultado por 1...
2. Dis%ri"&ci! ac&+&lada: se %orma al indicar para cada categor#a el número de casos que quedan por deba)o
del l#mite real superior de esa categor#a. $ste tipo de distribución es útil en la comparación3 cuando se desea
comparar la %orma en que los casos se distribuyen a lo largo de una escala. 'os porcenta)es acumulados
permiten en una sola medida o%recer los casos que se encuentran por deba)o o por encima de unos niveles
determinados.
2.1.0. Represe!%acio!es .r1)icas: o"2e%i/os. 3is%o.ra+a - pol(.o!o de )rec&e!cias.
'os resultados de las investigaciones se representan grá%icamente con el %in de tener un panorama más intuitivo y
directo de los datos.
1. 3is%o.ra+as: representación de una distribución de %recuencias o porcentual. 'a %recuencia de casos en cada
categor#a se representa mediante un rectángulo que tiene su base sobre el e)e 4orizontal3 con centro en el
punto medio de la categor#a y cuya anc4ura es igual al tama&o del intervalo de dic4a categor#a. 'a altura del
rectángulo será igual a la %recuencia de cases que se incluyen en la categor#a.
*. Pol(.o!os: el pol#gono de %recuencias es una %igura que se cierra al unir los puntos medios de cada intervalo3
a una altura proporcional a la %recuencia de dic4o intervalo. 'a unión de los puntos medios constituye un
segmento rectil#neo que3 al prolongarlo por los e-tremos 4asta cortar el e)e -3 constituye un pol#gono de
1
%recuencias.
2. O2i/as: son pol#gonos de %recuencias acumuladas.
5. L(!ea de .ra)os: muestra el valor de una variable dependiente para cada valor de las di%erentes categor#as de
otra variable independiente.
*.1.5. Medidas de las dis%ri"&cio!es: medidas de tendencia central3 dispersión y asimetr#a.
MEDIDAS DE TENDENCIA CENTRAL
'a posición o tendencia central de una distribución se re%iere al lugar donde se centra una distribución particular en la
escala de valores.
1. Moda: es el valor que se presenta u ocurre con la mayor %recuencia. "na distribución puede ser unimodal3
bimodal o multimodal. 6: es %ácilmente reconocible. 7: no es necesariamente única y no se puede calcular si
todos los valores num8ricos son di%erentes.
*. Media!a: $s el punto o valor num8rico que de)a por deba)o a la mitad de las puntuaciones de una
distribución. 6: está poco in%luida por la e-istencia de valores e-tremos altos y erráticos. 7: los valores de la
distribución deben tener3 como m#nimo3 un nivel de medición ordinal para que se pueda calcular.
2. Media: es la suma de todas las puntuaciones de una distribución dividida por el número de casos. 7: se puede
decir que la media es atra#da porlos valores e-tremos altos de una distribución. 6: utiliza más in%ormación3 ya
que todas las puntuaciones entran en el cálculo3 además suele di%erir menos que la mediana entre diversas
muestras de una misma población.
VARIACI4N O DISPERSI4N DE UNA DISTRI5UCI4N
'os #ndices de variabilidad o dispersión indican si las puntuaciones son parecidas o distintas entre s#.
0ara datos de intervalo 4ay dos procedimientos según se considere
1. $l recorrido o la amplitud de la escala en la que se distribuyen las puntuaciones: el recorrido o ra!.o es la
di%erencia entre el mayor y el menor de los números. 'a desventa)a de esta medida es que sólo depende de los
valores e-tremos de una distribución y no tiene en cuenta los valores intermedios.
*. 9e describa la variación por medio de las di%erencias que se producen entre todas las puntuaciones y un #ndice
de tendencia central (media,:
Des/iaci! +edia. :edida que viene dada por la media aritm8tica de los valores absolutos de las
desviaciones observadas a un determinado valor medio.
;uanto mayor sea el valor de la desviación media3 mayor será la variación entre las di%erentes puntuaciones.
Des/iaci! %(pica - /aria!6a: al igual que la desviación media3 se basan en las di%erencias e-istentes entre la
media aritm8tica y cada puntuación.
A di%erencia de la desviación media3 en lugar de tomar el valor absoluto de tales desviaciones3 se utiliza el
cuadrado de las mismas.
Varia!6a: el valor medio del cuadrado de las desviaciones de las puntuaciones a la media aritm8tica.
Des/iaci! %(pica: es la ra#z cuadrada de la varianza
<=!:A9 7$ 'A 7I9>!I?";[email protected]
$l rasgo de una distribución es la %orma global de la misma. 'as caracter#sticas de la %orma de una distribución:
asimetr#a y apuntalamiento.
1. N7+ero de picos o p&!%as 8+odas9 que tiene una distribución: unimodal3 bimodal3 multimodal.
*. :rado de asi+e%r(a: cuando una curva es sim8trica3 la mediana coincide con la media3 y3 si es unimodal3 con la
moda. 9e dice que la asimetr#a es positiva si e-isten muc4as puntuaciones ba)as y pocas altas. 9e dice que es negativa
cuando sucede a la inversa.
2. :rado de apila+ie!%o de casos alrededor de &! p&!%o de la dis%ri"&ci!. ;urtosis: 4ace re%erencia al grado de
apuntamiento de una distribución.
'eptocúrtica: distribución de %recuencias altamente concentrada
0laticúrtica: distribución de %recuencias más uni%orme. (curva más ac4atada,
*
:esocúrtica: la distribución de %recuencias presenta las puntuaciones más normalmente distribuidas. 'a curva no está
apuntada ni ac4atada. <orma de campana y suavidad de curvas.
*.1.+. La dis%ri"&ci! !or+al: introducción. <orma y caracter#sticas generales. 7istribución normal estándar3
punta)e A. Areas ba)o la curva normal. "so de tabla y aplicaciones.
'a curva normal es útil porque un gran número de distribuciones de %recuencias presentan %ormas apro-imadamente
normales. Además3 la curva normal es muy signi%icativa teóricamente en el campo de la estad#stica in%erencial.
'as distribuciones de %recuencias pueden ser %initas o in%initas. 'as distribuciones in%initas están basadas en un
número in%inito de casos. !epresentadas grá%icamente3 son curvas cuyos e-tremos se van acercando suavemente al
e)e - pero no se cruzan con este.
'a distribución normal es una distribución in%inita.
;aracter#sticas principales:
• 9im8trica
• 1úmero in%inito de casos
• <orma acampanada
• "nimodal
• ;oinciden la media3 la moda y la mediana
• $n la composición de la %órmula intervienen la media y la desviación t#pica
$n t8rminos estad#sticos3 conviene considerar una curva normal cuyas puntuaciones se e-presen en puntuaciones
t#picas en lugar de sus unidades originales. A esto se llama curva normal tipi%icada. 'a variable - es e-presada en
t8rminos de desviación.
<órmula:
'os valores num8ricos de cualquier curva normal pueden trans%ormarse de tal modo que una sola tabla puede ser
utilizada para evaluar la proporción de casos que quedan dentro de un intervalo.
2.2. Nocio!es de Es%ad(s%ica I!)ere!cial# $Pode+os .e!erali6ar'
*.*.1. 7istribuciones muestrales: 7i%erencia entre distribución de la muestra3 distribución de la población y
distribución muestral.
$-isten tres tipos di%erentes de distribuciones de los datos:
1. Dis%ri"&ci! de la po"laci!: caracteriza la distribución de los elementos de una población
*. Dis%ri"&ci! de la +&es%ra: caracteriza la distribución de los elementos de una muestra e-tra#da de la
población
2. Dis%ri"&ci! +&es%ral: describe la conducta esperada de un gran número de muestras aleatorias e-tra#das de
una misma población. 'as unidades que se distribuyen son medidas resumen de muestras completas de
valores3 en lugar de los valores individuales de caracter#sticas de casos únicos. "na distribución muestral es
una distribución probabil#stica teórica de estadisticos pertenecientes a muestras. $s la distribución que se
obtendr#a se e-tra)8semos aleatoriamente todas las muestras posibles3 del mismo tama&o3 de una población.
9e obtiene una distribución muestral cuando se toman todas las muestras aleatorias simples (cada una de ellas
con al menos un elemento di%erente, de tama&o 1 de una misma población3 se calcula un estad#stico para cada
muestra la media, y se distribuyen los estad#sticos alrededor del parámetro que estiman.
Teore+a del l(+i%e ce!%ral - le- de los .ra!des !7+eros.
El %eore+a del l(+i%e ce!%ral establece que si se e-traen repetidas muestras aleatorias simples de tama&o 1 a partir
de una población distribuida normalmente3 de media mu y desviación t#pica o3 las medias de tales muestras se
distribuyen normalmente con media mu y desviación t#pica o sobre ra#z de 1.
$s decir3 las medias de las muestras aleatorias simples e-tra#das de una población que se distribuye normalmente
darán lugar a una distribución que tambi8n es normal.
Le- de los .ra!des !7+eros
9i el tama&o 1 de cada muestra es su%icientemente grande3 con independencia de la %orma de la distribución de la
2
población3 las medias de las muestras tenderán a distribuirse normalmente con media mu y desviación t#pica o sobre
ra#z de 1.
;uanto mayor sea 13 con más %acilidad se apro-imará a distribución muestral a la curva normal.
I+por%a!cia de la le-:
Al ser la distribución muestral (y no de la población, la que se utiliza en las pruebas de signi%icación3 cuando 1 es
su%icientemente grande ya no tenemos que preocuparnos por los supuestos re%erentes a la normalidad de la población3
pudiendo emplear las propiedades de la curva normal en nuestras pruebas de decisión estad#stica3 ya que la
distribución muestral tiende a apro-imarse a la normalidad.
Te!de!cia ce!%ral# /aria"ilidad - )or+a de &!a dis%ri"&ci! +&es%ral
7ado que una distribución muestral es una distribución univariable3 se puede caracterizar en t8rminos de su tendencia
central3 variabilidad y %orma.
'a distribución muestral se caracteriza por una variación del estad#stico de la muestra alrededor de su parámetro. $sta
variabilidad se puede medir por medio de t8cnicas tales como recorridos3 varianzas y desviaciones t#picas. $l valor
que mide tal variabilidad es el error t#pico.
Error %(pico: mide la variación aleatoria de los estad#sticos alrededor de los parámetros que tratan de estimar.
9u tama&o depende3 en parte3 del tama&o de la muestra de la que se calcula el estad#stico. Al aumentar el tama&o de la
muestra disminuye el error t#pico.
*.*.*. $stimación de parámetros. $stimación puntual y por intervalos de con%ianza.
$stimación de medias y proporciones.
/ay dos tipos básicos de estimación:
• La es%i+aci! p&!%&al: el inter8s se centra en un valor único que estime me)or un determinado parámetro
• La es%i+aci! por i!%er/alo: deseamos conocer el grado de e-actitud con un determinado grado de
probabilidad de que el parámetro se encuentre dentro de un intervalo alrededor del porcenta)e o valor
estimado. $stimación que consiste en un con)unto de valores que var#an entre dos l#mites3 en lugar de un solo
valor.
6enta)as: la amplitud del intervalo indica la bondad de la e%iciencia de la estimación3 y se puede adscribir una
probabilidad determinada a la estimación.
$l intervalo que se utiliza para estimar un parámetro se conoce con el nombre de intervalo de con%ianza3 y los
valores e-tremos del intervalo son los l#mites de con%ianza.
Es%i+aci! de proporcio!es. I!%er/alos de co!)ia!6a
$stimación por intervalo de una proporción (o %recuencia o porcenta)e,.
0ara realizar una estimación por intervalo de una proporción se necesita conocer:
• 'a tendencia central
• 'a variabilidad
• 'a %orma de la distribución muestral de las proporciones
2.0. A!1lisis de Relacio!es "i/ariadas# $C+o se relacio!a! los )e!+e!os'
2.0.1. I!s%r&+e!%os para /aria"les c&ali%a%i/as: >abulación simple y cruzada. 7istribuciones y %recuencias
marginales y condicionales.
"na tabla de contingencia es el cruce de dos o más variables. 9e llaman tambi8n tablas bivariadas o tabulación
cruzada. 9e vuelcan las %recuencias (números de casos, correspondientes a cada combinación de valores de varias
variables (espacios de propiedad,.
'as %recuencias marginales o de primer orden son las que quedan por a%uera del cuadro. 'as %recuencias
condicionales o de segundo orden son las que quedan en la intersección entre dos variables.
$l primer paso de cualquier análisis es veri%icar si la tabla BcierraC3 es decir3 si se cumplen las relaciones aritm8ticas
5
que debe satis%acer cada ci%ra. 9i no cierra3 es evidente que 4ubo algún error de tabulación.
'os porcenta)es sirven para considerar el peso relativo de cada grupo sobre el total de la población.
;uando se analizan tabulaciones bivariadas3 el inter8s debe %ocalizarse en determinar si e-iste alguna relación entre
las dos variables. 0artimos siempre de una 4ipótesis acerca de la e-istencia o no de una relación entre las dos
variables.
$l cuadro como contrastación de 4ipótesis. !elaciones asim8tricas y sim8tricas.
:odos alternativos de análisis:
• :odo asim8trico: observar el e%ecto de una variable sobre la otra
• :odo sim8trico: no se presupone que una variable actúe como causa de la otra
"na tabla no es intr#nsecamente sim8trica o asim8trica3 depende de cómo el investigador decida encarar el análisis en
%unción de sus ob)etivos.
'ógica de la construcción y lectura de cuadros. Análisis de tablas: %unción y utilización de porcenta)es y la di%erencia
porcentual BdDC.
El a!1lisis de &!a %a"la si+;%rica+e!%e
$n este caso3 se computan los porcenta)es correspondientes a todas las %recuencias condicionales y marginales sobre
la base del total de casos.
=ptamos por este tipo de análisis cuando no se interesa indagar acerca del presunto Be%ectoC de una variable sobre la
otra.
A!1lisis de &!a %a"la asi+;%rica+e!%e
9e elige considerar una variable independiente y una dependiente.
1< RE:LA DE =IE:EL
9e aplica siempre que uno de los %actores del cuadro dimensional pueda considerarse como causa de la distribución
del otro %actor.
'=9 0=!;$1>AE$9 7$?$1 ;=:0">A!9$ $1 $' 9$1>I7= 7$' <A;>=! ;A"9A' (6I, F 'A
;=:0A!A;[email protected] 7$?$ !$A'IAA!9$ $1 $' 9$1>I7= 7$ 'A 6A!IA?'$ 7$0$17I$1>$.
2< RE:LA DE =IE:EL
$s una limitación al sentido en que se computan los porcenta)es cuando se traba)a con datos muestrales.
;"A17= "1 ;=1E"1>= 7$ :A!GI1A'$9 1= $9 !$0!$9$1>A>I6= 7$ 'A 0=?'A;[email protected] '=9
0=!;$1>AE$9 7$?$1 ;=:0">A!9$ $1 'A 7I!$;;[email protected] $1 Q"$ 'A :"$9>!A 1= $9
!$0!$9$1>A>I6A.
Co!cep%o de asociaci! de /aria"les:
7ecimos que dos variables están asociadas cuando mediante el tratamiento asim8trico de una tabla observamos que
una de las variables aparece determinando o a%ectando a otra.
'a medida de asociación más %recuentemente utilizada es la di%erencia porcentual.
0or su simplicidad de cálculo y por la claridad de su signi%icado es la lmedida de asociación más popular. ;onsiste en
una sistematización de la primera reglade Aiegel: 'A DI*ERENCIA PORCENTUAL 9$ ;A';"'A $1 'A
7I!$;;[email protected] $1 Q"$ 9$ !$A'IAA 'A ;=:0A!A;[email protected]
Ve!%a2as DP:
'a di%erencia porcentual nos brinda una medida general de asociación en la tabla.
$n su práctica cotidiana3 el investigador la aplica casi instintivamente para tener una medida rápida de asociación.
Des/e!%a2as DP:
$l uso de la di%erencia porcentual como indicador resumen de la asociación en una tabla implica una gran p8rdida de
in%ormación.
$sta medida no se puede aplicar a tablas de más de *-*
Independencia estad#stica y asociación per%ecta en los cuadros.
+
;aracter#sticas de una asociación de dos variables: e-istencia3 %uerza3 dirección y naturaleza.
1. $HI9>$1;IA: $-iste una asociación entre dos variables cuando la distribución de una variable di%iere de
algún modo entre las diversas categor#as de la segunda variables. =tra %orma de decir si e-iste o no asociación
entre dos variables consiste en comparar las %recuencias observadas en la tabla con las %recuencias que cabr#a
esperar si no e-istiera asociación (%recuencias esperadas,. 9e calculan las %recuencias de cada celda a partir de
los datos totales3 de %orma que las distribuciones condicionales no o%rezcan asociación alguna. $n general3 la
%recuencia esperada para una determinada celda se calcula multiplicando el total de la %ila correspondiente a la
celda por el total de la columna que corresponde a dic4a celda3 y diviediendo el producto obtenido por el
número global de casos (1,. "na vez calculados los valores esperados en cada casilla3 se pueden comparar los
valores observados %o3 o relaes3 con los valores esperados %e. 'a comparación se realiza restando el valor
esperado de cada celda del valor observado. $ste valor se llama delta3 se calcula para cada celda. :ientras
algunos deltas sean di%erentes de cero3 se puede 4ablar de la e-istencia de algún tipo de asociación entre las
dos variables. 9i todos los valores %ueran .3 4ay independencia estad#stica.
*. <"$!AA = G!A7= 7$ 'A A9=;IA;[email protected] ;uando los valores epsilon o delta son elevados3 se puede
4ablar de un alto grado de asociación. 9i son peque&os3 se trata de una d8bil asociación. ;omo no 4ay un
valor estipulado para determinar el signi%icado de delta o $psilon3 e-isten otros #ndices estandarizados que
var#an de una %orma %i)a3 predeterminada e interpretable3 entre un valor m#nimo de asociación y un valor
má-imo.
2. 7I!$;;[email protected] 7$ 'A A9=;IA;[email protected]: solo cabe 4ablar de ella cuando las variables se 4an medido3 como
m#nimo3 al nivel ordinal. ;uando en una tabla la tendencia de variación con)unta de las dos variables a que los
valores altos de una variable se correspondan con los valores altos de la segunda variable3 se 4abla de
asociación positiva. ;uando los valores altos de una variable se corresponden con los valores ba)os de la
segunda3 y los valores altos de 8sta se corresponden con los ba)os de aquella3 4ay asociación negativa.
5. 1A>"!A'$AA 7$ 'A A9=;IA;[email protected] $s la %orma general en que se distribuyen los datos en la tabla.
;uando al pasar de una categor#a a otra de variables el número de casos tiende a incrementarse o disminuir de
una %orma relativamente 4omog8nea entre las categor#as de la otra variable se produce una relación lineal.
Coe)icie!%es de asociaci!.
:edidas de asociación estandarizadas o tipi%icadas3 que en un solo #ndice indican la e-istencia3 el grado y la dirección
de la asociación
'os valores pueden variar a lo largo de una escala desde un valor m#nimo3 que indica relación negativa (I1,3 4asta un
valor má-imo (J1, que indica asociación positiva3 pasando por .3 que indica ausencia de relación.
'a medida más sencilla que se puede crear a partir de los valores delta es la propia suma de todos los delta que se
pueden calcular al comparar las di%erentes columnas y categor#as que componen una tabla.
0ero este #ndice es muy de%iciente y depende del tama&o de los valores esperados. 'os valores deltas3 además3 se
pueden neutralizar entre s# al sumar cantidades de signo contrario.
$sta limitación se supera si se suman3 en lugar de los deltas3 sus cuadrados3 y se divide cada delta al cuadrado por el
valor esperado de cada celda3 con lo que se controlas los e%ectos resultantes al considerar di%erentes números de
casos. 'a medida resultante es el c4i cuadrado.
$ste coe%iciente es siempre positivo. $l l#mite superior del coe%iciente c4i cuadrado vale 1 (KI1,3 donde 1 es el
tama&o de la muestra y K es el número de %ilas o columnas en la tabla.

=tros coe%icientes que se basan en el c4i cuadrado tratan de superar sus limitaciones.
$lección del coe%iciente según la relación postulada por la 4ipótesis y el nivel de medición de las variables.
Interpretación de los coe%icientes
*i c&adrado
<i: de . a J1 para *-K
Inconveniente: en tablas que contengan más de dos categor#as en cada variable el valor má-imo de %i sobrepasa la
unidad.
C de Pearso!
L
1o puede ser superior a la unidad3 con independencia del tama&o de la tabla3 ya que el coe%iciente c4i cuadrado
aparece tanto en el numerador como en el denominador.
$l problema es que nunca alcanza la unidad3 aunque 4aya asociación per%ecta.
T de Tsc>r&pro?
9e trata de introducir el concepto de grados de libertad en la %órmula del coe%iciente de asociación: gl: (nI1,(mI1,
$l l#mite superior de > vale la unidad3 pero con la condición de que tenga la misma cantidad de %ilas que de columnas.
$n tablas que no sean cuadradas3 > no puede alcanzar la unidad.
V de Cra+er
$l coe%iciente 6 de ;ramer puede alcanzar la unidad3 con independencia del tama&o de la tabla3 y vale cero cuando
no e-iste asociación alguna.
Asociación completa y Q de Fule
Asociaci! co+ple%a: distribución tal que3 por lo que se re%iere a una tabla *-*3 sólo sea cero la %recuencia de una de
las celdas3 mientras que las otras celdas tienen una %recuencia di%erente de cero.
Q de Fule se basa en este tipo de asociación per%ecta. 9e calcula a partir de los productos cruzados de las celdas de
una de las diagonales ad y de las celdas de la segunda diagonal
;uando la %recuencia de una de las celdas es cero3 Q J1 o I13 según la dirección de la asociación.
9e puede usar con variables nominales y ordinales.
Medidas de asociaci! para /aria"les !o+i!ales - ordi!ales
:edidas de asociación basadas en el criterio de red&cci! proporcio!al del error.
'as medidas !0$ consisten en coe%icientes de la cantidad de error cometido al predecir la variable dependiente en
dos situaciones:
1. 'a predicción se realiza3 en primer lugar3 cuando no se conoce más que la distribución de la propia variable
dependiente.
*. $n segundo lugar3 la predicción se realiza cuando se dispone del conocimiento adicional de una variable
independiente y de la %orma en que la variable dependiente se distribuye dentro de las categor#as de dic4a
variable independiente.
'o que realizan las medidas !0$ es simplemente %ormular la proporción en que se puede reducir el error cometido en
la primera de las situaciones descriptas3 al utilizar la in%ormación que proporciona la segunda de las situaciones.
!0$: !educción del error con más in%ormación
;antidad original de error
Coe)icie!%e La+"da
?asado en el criterio de reducción proporcional del error
$s una medida asim8trica de asociación especialmente creada para analizar distribuciones bivariables en las que
ambas variables son de tipo nominal
$l primer t8rmino del numerador e-presa el número de errores cometidos mediante la predicción I y el segundo
t8rmino es el número de errores que se cometen al utilizar la predicción II.
1 es el tama&o total de la muestra.
:y es la %recuencia modal global de la variable dependiente F y my es la suma de las %recuencias modales de la
variable dependiente F dentro de cada categor#a.
Si+pli)icada:
$l numerador es el número de noIerrores cometidos ba)o la predicción II3 menos el número de errores cometidos ba)o
la predicción I 3 siendo el denominador el número de errores cometidos ba)o la predicción I.
'imitación del coe%iciente 'ambda:
Aunque o%rece in%ormación sobre la %uerza de la asociación3 no o%rece in%ormación sobre la naturaleza de la misma.
0ara naturaleza3 se deberán analizar las di%erencias porcentuales.
M
2.0.2. Nocio!es de Es%adis%ica I!)ere!cial Relacio!al: $l uso de las pruebas de signi%icación estad#stica en la
investigación social. Introducción y conceptos básicos de las pruebas. 9igni%icación estad#stica y signi%icación
teórica.
Tes% de c>i c&adrado
$s una medida de signi%icación estad#stica.
9e basa en una medida de cuánto se apartan las %recuencias condicionales observadas en la muestra de los que ser#an
las %recuencias esperables si no e-istiera ninguna relación entre las variables.
$l test de c4i cuadrado consiste en medir cuánto se desv#an las %recuencias observadas respecto de las esperadas3
debiendo entenderse que el con)unto de las %recuencias esperadas con%igura un módulo posible de noIasociación3
basado en la idea de independencia estad#stica
$l valor obtenido solo cobra sentido cuando se lo compara con el valor cr#tico correspondiente a la tabla de c4i
cuadrado.
$l valor cr#tico depende del nivel de signi%icación con el que deseamos traba)ar y del número de grados de libertad de
nuestra tabla.
1. El !i/el de si.!i)icaci!
0robabilidad de equivocarnos que estemos dispuestos a aceptar. 9i3 por e)emplo3 elegimos un nivel de
signi%icación de ..+3 ello equivale a considerar aceptable un riesgo del +D. !iesgo: 0robabilidad de que dos
variables que no están asociadas en la población aparezcan relacionadas en la muestra.
$l nivel de signi%icación depende de la %uerza de la relación entre las variables y del tama&o de la muestra
*. El !7+ero de .rados de li"er%ad para una contingencia de 4 4ileras por c columnas: glN (4I1, (cI1,
7ado un con)unto de marginales3 los grados de libertad representan el número de celdas que es su%iciente
llenar para que queden determinadas todas las %recuencias condicionales restantes.
$l c4i cuadrado emp#rico debe ser mayor al valor cr#tico para considerar a la relación estad#sticamente signi%icativa.
$C&1!do se p&ede &sar el c>i c&adrado'
• 'os datos deben consistir en mediciones independientes de casos seleccionados al azar
• $l número de casos debe ser su%icientemente grande. $sto se e-presa en una relación determinada entre el
tama&o de las %recuencias esperadas y el número de celdas de la tabla
U%ilidades del c>i c&adrado
Ve!%a2as
• $s de utilidad para determinar si una relación entre dos variables es estad#sticamente signi%icativa
• :ientras que la di%erencia porcentual sólo puede ser utilizada para variables dicotómicas y var#a de acuerdo al
orden de las categor#as3 c4i puede ser utilizado sin importar cuántas categor#as tengan las variables3 y sin
importar el orden de las mismas.
• Además3 es indi%erente a cual de las dos categor#as es la variable independiente (sim8trico,.
• $s apto para variables nominales3 por eso3 es una prueba de distribución libre.
Des/e!%a2as
• $n muestras muy grandes el c4i puede producir un valor estad#sticamente signi%icativo aunque la relación
entre las variables sea muy d8bil.
• ;4i cuadrado no puede a%irmar nada acerca de la %uerza de una relación porque su valor var#a en %unción de n
Pr&e"as de si.!i)icaci! para dos +&es%ras i!depe!die!%es: La pr&e"a c>[email protected]&adrado - los coe)icie!%es de
asociaci! deri/ados.
O
=tras pruebas de signi%icación para relaciones de dos variables dicotómicas.
7i%erencia de medias
;uando tengo una variable independiente dicotómica y una variable dependiente intervalar
9i traba)o con muestras peque&as3 uso t en vez de z
>ambi8n se puede utilizar para variable independiente y dependiente dicotómicas
'as pruebas de signi%icación3 a di%erencia de los coe%icientes3 no están estandarizadas: var#an entre . e in%inito.
'a dis%ri"&ci! % de S%&de!%.
;uando se desconoce el valor de la desviación t#pica poblacional3 4ay distintas alternativas:
• ;uando el tama&o 1 de la muestra es su%icientemente grande3 se puede sustituir la desviación t#pica de la
población por la desviación t#pica de la muestra.
• 0ara tama&os peque&os de 13 se puede utilizar una prueba estad#stica alternativa3 que tiene una distribución
muestral conocida: la distribución t de 9tudent:
;omparándola con la %órmula de z se puede decir que los numeradores son id8nticos3 pero los denominadores
di%ieren en dos aspectos: o 4a sido reemplazado por s y ra#z de 1 4a sido sustituida por ra#z de 1 P 1.
'a variabilidad de t está relacionada con el tama&o de 13 siendo mayor para los valores más peque&os de 1.
'as distribuciones t son sim8tricas3 pero son más aplastadas que la curva normal. 9u colas se acercan al e)e de
abscisas con una menor pendiente3 sobre todo para los valores peque&os de 1.
A medida que se incrementa el valor de 13 la distribución t se va apro-imando a la curva normal.
;uando 1 es mayor que 1.. se puede sustituir la distribución t de 9tudent por la curva normal.
A!1lisis de /aria!6a: I!%rod&cci!. Variaci! %o%al# i!%ra.r&pos - e!%re.r&pos. El coe)icie!%e AE2B de
Correlaci! !o li!eal.
$s una t8cnica estad#stica dise&ada para comparar varias medias observadas.
Generalmente se utiliza cuando se está sometiendo a prueba una relación entre una variable nominal u ordinal y una
variable de intervalo.
>iene una lógica similar a la di%erencia de medias3 pero a di%erencia de 8sta3 el análisis de varianza puede utilizarse
para 6I que no son dicotómicas.
!ecibe este nombre porque la prueba de comparación de las diversas medias se basa en el cálculo de la varianza entre
esas medias.
'os supuestos estad#sticos que deben cumplirse son los mismos que se requieren para una prueba de di%erencia de
medias:
• :uestras aleatorias simples
• 1ormalidad en la distribución de los datos
• 'as varianzas de la población deben ser iguales
9e generan grupos a partir de las categor#as de la 6I. 'os grupos contienen los punta)es de cada unidad de análisis.
9e calculan las medias dentro de cada grupo y la media global para el con)unto de la población de la muestra.
6A!IA;[email protected]: suma de los cuadrados de las desviaciones3 sin ser dividida por el número de casos (como en la
varianza,
DESVIACI4N INTRA :RUPO. SCD. Variaci! i!eCplicada.
9uma de los cuadrados de las desviaciones entre cada individuo y la media de su grupo.
Q
DESVIACI4N ENTRE :RUPOS. SCE. Variaci! eCplicada por el e)ec%o de la VI.
'a suma de los cuadrados de las desviaciones entre cada media de grupo y la media global
6A!IA;[email protected] >=>A'
9i 4ay muc4a variación dentro y poca entre3 la relación es d8bil.
9i 4ay muc4a variación entre y poca dentro3 la relación es más %uerte.
9e utiliza la desviación intra grupo para obtener la primera estimación de la varianza común (varianza residual,. 'a
varianza residual indica la variabilidad de los individuos dentro de un determinado grupo. $sta variabilidad no es
debida a la in%luencia de la variable independiente3 sino que es debida a la propia variabilidad de los individuos (por
eso residual,.
'a desviación entre grupos se utiliza para realizar la segunda estimación de la varianza (varianza e-plicada,.
0ara la estimación de la varianza basta con dividir por los grados de libertad apropiados las dos sumas de cuadrados
por las dos sumas de cuadrados por separado.
'os grados de libertad asociados con la suma total de cuadrados es 1 P 13 mientras que los grados de libertad
asociados con la suma total de los cuadrados es K P 13 siendo 1 P K los grados de libertad asociados con la variación
intraIgrupos.
'as dos estimaciones de varianza ser#an
/o: 'as medias de cada subpoblación son iguales.
/a: 'as medias de las subpoblaciones son di%erentes.
ETA: qu8 tan intensa es la relación entre 6I y 67.
;uánto de la variación total es e-plicada.
9i 9;$ es .3 4ay independencia estad#stica.
9i 9;$ N 9;>3 $>A es igual a 13 y 4ay asociación per%ecta.
ETA2: COE*ICIENTE DE DETERMINACI4N
$n qu8 medida la variación de la 6I determina la variación de la 67.
0ermite 4ablar de e-plicación. $s más e-igente que $>A.
El COE*ICIENTE DE INDETERMINACI4N es el complemento de $>A*
K*N 1 P $>A*
PRUE5A DE SI:NI*ICACI4N
'a varianza entra en )uego en el test de signi%icación.
'a prueba estad#stica que se utiliza para contrastar la 4ipótesis nula consiste en calcular el cociente entre la segunda
estimación de la varianza y la primera (prueba < de 91$7$;=! de comparación entre ambas estimaciones,.
;uando la 4ipótesis nula sea cierta3 tenderán a coincidir ambas estimaciones3 y el cociente se apro-imará al valor de
la unidad.
;uando las medias de las subpoblaciones di%ieran entre s#3 la segunda estimación de la varianza será mayor que la
primera3 y el cociente < será mayor que la unidad.
'a ley de 9nedecor nos o%rece los valores de la distribución muestral de <3 podemos saber para cada valor de <
obtenido3 el riesgo que corremos al rec4azar la 4ipótesis nula.
2.0.0. I!s%r&+e!%os para /aria"les c&a!%i%a%i/as:
Correlaci!: Introducción. 9upuestos del modelo de correlación. $l coe%iciente de correlación lineal r de 0earson.
Interpretación del coe%iciente. $l coe%iciente de determinación y el coe%iciente de indeterminación. ;orrelación y
causalidad.
1.
Correlaci!
Analizar el grado de correlación de dos variables: variación3 intensidad y dirección.
S&p&es%o de )or+a: tiene que ser lineal3 o tender a la linealidad. 0ara ello 4ay que realizar un diagrama de
dispersión.
9e representan los valores de las dos variables en un grá%ico.
La rec%a de +(!i+os c&adrados.
$s una de las in%initas rectas que se podr#an representar. $s la que en promedio se apro-ima me)or a todos los puntos
en el plano.
'as distancias de cada uno de los puntos se elevan al cuadrado y se suman. $l número absoluto obtenido a partir de
esta suma es el m#nimo valor en comparación con las otras rectas posibles.
9iempre se puede trazar la !:;3 pero la predicción va a estar relacionada a la distribución de los datos observados.
9i trazamos las l#neas verticales que unen a cada uno de los puntos con la l#nea de m#nimos cuadrados3 y se elevan al
cuadrado tales distancias3 la suma resultante será la menor posible de todas las sumas de cuadrados que se puedan
calcular en relación a cualquier otra recta.
'a !:; es una simpli%icación de una curva de regresión (una curva que pase por todos los puntos,3 pero es más
generalizable.
9iempre tienen que estar presentes las medias de las dos variables. $l punto de coincidencia entre las dos variables
tiene que estar s# o s# en la recta.

Coe)icie!%e de correlaci! R de Pearso!
$s el coe%iciente de correlación más ampliamente di%undido para el análisis de la asociación entre dos variables. :ide
la asociación lineal entre las variables.
$ste coe%iciente mide la cantidad de dispersión en relación a la ecuación lineal de m#nimos cuadrados.
9u recorrido oscila entre I1 (asociación per%ecta negativa, 4asta 1 (asociación per%ecta positiva,.
Al tratarse de una medida de relación lineal3 que mide el grado de a)uste a la recta de m#nimos cuadrados3 no se puede
interpretar rN. como ausencia total de relación3 ya que las variables - e y pueden estar %uertemente asociadas en
%orma curvil#nea y tener3 sin embargo3 un valor r igual a ..
0or eso3 antes de calcular r conviene representar en un sistema de coordenadas cartesiano los valores de - e y para
observar si su distribución apro-imada es lineal o curvilineal.
;uando la distribución de los puntos se apro-ima a la l#nea recta3 el valor de r se encontrará pró-imo a la unidad.
<órmula: $l coe%iciente de correlación de 0earson es el cociente entre la covariación de H e F y la ra#z cuadrada del
producto de la variación en H de la variación de F.
Re.resi!
!egresión: Introducción. !epresentación grá%ica de la nube de puntos: !elaciones lineales y curvilineales. 'a
ecuación de regresión de la muestra y su a)uste por el m8todo de m#nimos cuadrados. $valuación de la ecuación de
regresión: el coe%iciente de determinación y su interpretación. "tilización de la ecuación de regresión: $stimación o
predicción. $rrores de estimación.
!egresión: predicción de los resultados de una de las dos variables3 conocidos los resultados en la otra.
$sto está relacionado con los ob)etivos de má-ima de las ciencias: descubrir3 decribir3 e-plicar y predecir %enómenos.
$l modelo de regresión se usa para estimar y predecir valores.
9i 4ay más correlación3 será más precisa la regresión3 porque la linealidad de la relación es mayor.
0ara realizar este tipo de predicción3 4ay que tener en cuenta la %orma en que las puntuaciones de la variable
independiente in%luyen en la distribución de las puntuaciones de la variable dependiente.
11
;ómo averiguar la recta.
'a %orma más simple y clara de e-presar una relación entre variables es una ecuación matemática.
'a ecuación con t8rmino constante responde a la %orma más general de ecuación de una recta.
yN a J b-
;ualquier relación lineal entre dos variables se puede e-presar con esta %órmula
A: ordenada de origen
?: cuant#a en que var#a F cuando H var#a una unidad. 0endiente de la recta. ;uando es positivo3 pendiente positiva.
;uando es negativo3 recta decreciente.
;onocida la e-presión matemática que describe la %orma y la dirección de la l#nea o curva de las medias se pueden
realizar predicciones muy e-actas.
$n 9ociolog#a usualmente no se conoce con precisión la curva o l#nea que relaciona ambas variables.
Al no disponer de mediciones precisas para sus variables3 el sociólogo suele conceder cierta variabilidad a la
ecuación de regresión y pre%iere pensar en t8rminos de medias y varianzas de la distribución de F para cada H3 en
lugar de considerar la distribución precisa de los valores de F a partir de H.
$l modelo de regresión estudiado es asim8trico.
/ay distintas maneras de calcular los parámetros de a y b.
'a más sencilla3 incluye las medias de H e F3 las varianzas y la covarianza (variación con)unta,
Para co!siderar el +odelo se pres&po!e:
• 'inealidad de la ecuación de regresión
• 7istribución de los valores y en cada valor H se distribuyen en %orma normal
• 'as varianzas de las distribuciones de F son las mismas para cada valor de H.
:ediante la ecuación de regresión por m#nimos cuadrados3 se pueden predecir las puntuaciones en la variable
dependiente F con mayor precisión que la que se lograr#a con la utilización de la media global de F.
'a recta de regresión nos ayuda a Be-plicarC parte de la variación en la variable dependiente3 quedando sin e-plicar el
resto de la variación de F.
'a variación total de F en relación a la media será igual a la suma de la variación e-plicada J la variación no
e-plicada.
Coe)icie!%e R2 DE DETERMINACI4N
$l cuadrado del coe%iciente r de 0earson e-presa el grado en que la variación de una variables es e-plicada por la
otra3 y viceversa3 ya que el modelo es sim8trico.
>est de signi%icación
< de 9nedecor
;omo para este caso siempre 4ay una variable independiente porque es correlación lineal simple3 y no múltiple3 la
%órmula es: !elación entre el análisis de varianza y correlación lineal a partir del coe%iciente de determinación
$>A* es mayor o igual a !*
0uede ser igual cuando 4ay 1 en !*
0uede ser igual cuando es . en $>A*3 porque no 4ay ningún tipo de relación y no necesariamente lineal como en !*
$>A* P !* indica la parte de la relación que no es lineal
1*
2.D. A!1lisis de Relacio!es M&l%i/ariadas# $Por ,&; s&cede! los )e!+e!os'
*.5.1. I!s%r&+e!%os para /aria"les c&ali%a%i/as: $l análisis multivariado como apro-imación a la lógica del dise&o
e-perimental. Análisis multivariado y e-plicación en ciencias sociales. ;lasi%icación de los diversos instrumentos:
m8todos de interdependencia y dependencia.
'a lógica e-perimental controla variables. 9e %orman dos grupos: uno e-perimental y otro de control. 9e aplica un
est#mulo al grupo e-perimental y se miden nuevamente los grupos3 cote)ando sus di%erencias.
0ero en ;s 9ociales la e-perimentación pone en )uego cuestiones 8ticas3 no 4ay una capacidad de controlar la variable
independiente3 y además no es posible 4omogeneizar a los grupos.
9in embargo3 se puede tener un control estad#stico de la variable introduciendo una tercera variable de control.
:ientras más variables podamos incluir y separarlas para ver su in%luencia3 me)or vamos a poder e-plicar.
Relaci! e!%re %res o +1s /aria"les !o+i!ales & ordi!ales: El +odelo La6ars)eld. ;onte-to 4istórico de su
desarrollo. $l papel de los %actores de prueba. $squema general para la relación entre tres dicotom#as. $l papel del
orden temporal. 'os principales tipos de elaboración.
'azar%eld
0rocedimiento multivariado de control por parciales. $s un modelo pensado para variables no num8ricas3 que trata de
reproducir la lógica e-perimental.
0ermite discriminar los di%erentes papeles lógicos de cada variable3 4asta donde ello es posible estad#sticamente3
cualquiera sea la naturaleza de las variables y las relaciones.
$ntrega observaciones desagregadas y estas3 a partir de ciertas asunciones teóricas3 posibilitan las in%erencias
e-plicativas que procura el investigador.
"na relación entre dos variables se puede descomponer en relaciones parciales (tantas como la cantidad de categor#as
que tenga la variable de control,. 7e este modo3 testeo en qu8 medida la relación se altera cuando la observo en los
parciales determinados por las 6;.
'a ecuación de 'azar%eld.
$-presión ecuacional de la suma ponderada en que 'azar%eld descompone la relación originaria cuando ella es
controlada por t.
'a relación original como la suma de las relaciones parciales el producto de las relaciones marginales.
'os parciales matriciales deben ser ponderados por la proporción de n que corresponde al n total.
7e este modo3 revelo lo que estaba oculto (rel parciales y marginales, y puedo reconocer cómo se llega a la relación3
y evaluar cómo actúan los distintos elementos.
'a 4ipótesis nula ser#a la a)enidad: la 6; no in%luye en la !=.
1o deber#amos encontrar modi%icaciones en la != en cada uno de los parciales.
0ero la 6; puede tener algún peso: cuando los valores parciales cambian3 4ay una alteración en la !=.
P&ede! darse dos %ipos de ela"oracio!es: por parciales - por +ar.i!ales
• 0or parciales: la relación disminuye en los marginales y aparece con más %uerza en los parciales.
• 0or marginales: la relación disminuye en los parciales y aparece con más %uerza en los marginales
>ambi8n 4ay que tener en cuenta la posición de la variable de control.
• Antecedente: anterior en el tiempo a la 6I
• Interviniente: la variable de control se ubica en el medio de la relación
'os modos de elaboración
12
0arcial :arginal
>
antecedente 0A
$speci%icación
:A
$-plicación
>
interviniente 0I
condición3
contingencia
:I
Interpretación3
Intermediación
'as 6; permiten ver si necesito replantear mi relación3 porque puede ser que est8 actuando una tercera variable de
manera oculta3 de manera que la relación original es sólo aparente.
0rimero3 elaboro las relaciones parciales de acuerdo a las categor#as de la 6; (los totales de cada cuadro son
parciales3 se reparten en las categor#as de la 6;,.
$ntonces3 observo que pasa con esas relaciones3 para lo que utilizo los coe%icientes de asociación (siempre tengo que
usar los mismos,.
9i se mantienen iguales3 4ay a)enidad3 y no es necesaria la elaboración por marginales. 0uedo mantener mi 4ipótesis.
$ntonces puedo tomar otras 6; y ver qu8 sucede.
9i una casi desaparece y la otra sube muc4o3 se trata de una especi%icación. ;uando es muy determinista se 4abla de
condición (si está esta condición se da3 sino no,.
$n este caso tambi8n la relación desaparece en los marginales.
9i la relación ba)a en ambos parciales3 es una elaboración por marginales.
'a 6; puede ser entonces antecedente (e-plicación, o interviniente (intermediación,.
"na relación de tipo :A (e-plicación, desenmascara una aparente relación entre dos variables.
$s un caso de relación espúrea3 la != se invalida porque lo que daba por sentado al principio3 cuando 4ago actuar a la
6;3 desaparece. 'a variable de control actuaba oculta.
Erra!do!ea
Los papeles l.icos posi"les de la /aria"le de co!%rol
• 'a variable t puede resultar la verdadera variable determinante o independiente. 0uede atribuirse al e%ecto o
%enómeno estudiado aquella a partir de la cual es previsible.
• > puede participar en la relación especi%icándola o condicionándola3 pero no produciendo por si sola el e%ecto
en que consiste la variable dependiente (I1>$!6I1I$1>$,
• > es conte-tual cuando los di%erentes valores de la variable de control cambian el sentido de la relación
original
• > es intermediaria cuando se constituye en trasmisora de la relación principal
La co!%ri"&ci! de las +a.!i%&des de las relacio!es para i!%erpre%ar el papel l.ico de la /aria"le de co!%rol
'a interpretación del papel a atribuir a la variable de control en el )uego total de las tres variables constituye una tarea
conceptual que implica responsabilidad teórica.
'as magnitudes obtenidas en las medidas de las di%erentes relaciones bivariadas simples y controladas involucradas
en este tipo de análisis3 consideradas en sus comparaciones mutuas3 constituyen poderosos indicios instrumentales
para la tarea interpretativa.
'a relación originaria es realmente la relación principal si las mayores magnitudes se mantienen a nivel de los
parciales3 especialmente en relación con el producto de los marginales.
$ste tipo de análisis tiene cierto grado de inspiración en el dise&o e-perimental.
;uando en un grupo e-perimental aparecen di%erencias en relación con el correspondiente grupo testigo en lo que
15
tiene que ver con un determinado e%ecto3 luego de que el primero 4a sido sometido a un cierto est#mulo no e-puesto
al otro3 se dice que la variable que representa dic4o est#mulo no tiene nada que ver con el e%ecto indagado3 es a)ena a
8l.
'os parciales son asimilables al grupo e-perimental y al grupo testigo en la e-posición al est#mulo.
• ;uando los parciales se mantienen iguales entre si e iguales a la relación originaria3 debe concluirse que la
variable de control (t, es totalmente a)ena a la relación original.
• 0or el contrario3 cualquiera sea lo que ocurra a nivel de los marginales3 cuando al interior de las matrices
parciales resultantes del desagregado por la variable de control3 entre todas o algunas de ellas se mani%iesten
di%erentes magnitudes de relación entre las variables de la relación originaria3 deberá concluirse que la
variable de control está inter%iriendo a la relación originaria (interviniente,
• ;uando alguno o algunos de los parciales elevan su di%erenciación para con otro u otros al grado de
desaparecer3 ser trata de una Bespeci%icaciónC que realiza la variable t3 se convierte en condición.
• Aún manteni8ndose iguales las magnitudes de los parciales entre s#3 puede ocurrir que la variable de control t
est8 )ugando un papel importante en la relación entre las variables originales.
'a similitud de la magnitud de los parciales3 sin embargo3 resulta colocarse claramente por deba)o de la de la
relación originaria. 9erá necesario que el producto de los marginales sea di%erente de cero: e-actamente igual
a la di%erencia entre los equiparados parciales y la relación originaria. $n este caso3 debe in%erirse que t no está
interviniendo para alterar la relación entre - e y.
$-isten dos v#as de determinación complementarias:
• 7irecta (-y, cuya cantidad se e-presa en la suma ponderada de los parciales
• Indirecta (a trav8s de t, que se e-presa en el producto de los marginales
• 6ariable conte-tual: se mani%iesta en el desagregado de los parciales. 'a relación originaria es cero o pró-ima
y cada parcial tiene signos contrarios3 que se compensan. $sto implica inversión del e%ecto3 es decir3 cambio
del sentido de la != e-presado en una alteración de su signo
• 7esaparición de la relación original en los parciales
$sto puede deberse a que la != se deb#a a que - e y son e%ectos de t (!= espúrea,
= a que toda la != pase a trav8s de > (intermediaria,
UNIDAD 0 : El ANALISIS CUALITATIVO de los DATOS
2.1. $l traba)o con los datos3 distintas etapas: del registro a la codi%icación. Identi%icación y construcción de
categor#as3 proceso inductivoIdeductivo.
2.*. 0rocedimientos en el análisis de entrevistas3 observación3 t8cnicas grupales3 estudios biográ%icos y el análisis de
contenido cualitativo.
Los da%os c&ali%a%i/os
;onsideramos un dato como una elaboración3 de mayor o menor nivel3 realizada por el investigador o por cualquier
otro su)eto presente en el campo de estudio3 en la que se recoge in%ormación acerca de la realidad interna o e-terna a
los su)etos y que es utilizada con propósitos indagativos. $l dato soporta una in%ormación sobre la realidad3 implica
una elaboración conceptual de esa in%ormación y un modo de e-presarla que 4ace posible su conservación y
comunicación.
A!1lisis de da%os
;on)unto de manipulaciones3 trans%ormaciones3 operaciones3 re%le-iones3 comprobaciones que realizamos sobre los
datos con el %in de e-traer signi%icado relevante en relación a un problema de investigación.
Analizar datos supone e-aminar sistemáticamente un con)unto de elementos in%ormativos para delimitar partes y
descubrir las relaciones entre las mismas y las relaciones con el todo. >odo análisis persigue alcanzar un mayor
conocimiento de la realidad estudiada y3 en la medida de lo posible3 avanzar mediante su descripción y comprensión
4acia la elaboración de modelos conceptuales e-plicativos.
$l análisis de los datos cualitativos consiste en tratamientos de los datos que se llevan a cabo generalmente
preservando su naturaleza te-tual3 poniendo en práctica tareas de categorización y sin recurrir a las t8cnicas
estad#sticas.
1+
Di)ic&l%ades para el a!1lisis
$l carácter polis8mico de los datos3 su naturaleza predominantemente verbal3 su irrepetibilidad o el gran volumen de
datos que suelen recogerse en el curso de la investigación3 4acen que el análisis posea di%icultades y comple)idades3
;uando se mane)an datos cualitativos3 no se cuenta con convenciones claras que orienten el modo de llevar a cabo el
análisis3 'os modos utilizados se 4an venido caracterizando por su gran variedad y por su singularidad3 que los 4an
4ec4o dependientes del estilo y la e-periencia de cada investigador.
$l análisis de datos cualitativos representa una di%icultad para el investigador debido a que no es posible localizarlo
en una %ase precisa del proceso de investigación.
7esde posiciones positivistas podr#a apreciarse una linealidad temporal en el proceso de investigación: planteamiento
del problema3 %ormulación de una 4ipótesis3 recogida de datos3 análisis3 interpretación y redacción de in%orme.
$l carácter lineal se rompe en la investigación cualitativa3 en la que los distintos momentos del proceso indagativo se
superponen3 se entrelazan3 se reiteran a lo largo de la investigación.
$l análisis de datos se ve determinado y determina el problema de investigación3 y se realiza de manera simultánea a
otras tareas3 tales como la recogida de datos o la redacción del in%orme.
0odemos ver a la recogida de datos como una %orma primitiva de análisis3 puesto que representa algún tipo de
elaboración sobre la realidad.
'a intercone-ión de los procesos de recogida y análisis en la investigación se 4a concretado metodológicamente3
dentro de la tradición cualitativa:
• $strategias de selección secuencial (Geotz y 'e ;ompte, en las que la progresiva construcción teórica
determina la recogida de datos. $ntre las %ormas de selección secuencial se encuentran la selección de casos
negativos3 que re%utan o contradicen un concepto y la selección de casos discrepantes que permiten
modi%icarlos
• $l muestreo teórico3 decidiendo qu8 datos recoger y dónde recogerlos de cara a desarrollar la teor#a emergente
• 'a selección de implicantes3 que posibilita la comprobación de teor#as a partir de casos seleccionados en
%unción de las implicaciones de esas teor#as (;ampbell,
El proceso .e!eral de a!1lisis
1. Red&cci! de da%os
$n el transcurso de un estudio cualitativo3 el investigador recoge abundante in%ormación acerca de la realidad sobre la
que centra su traba)o. 'a reducción de datos es la simpli%icación3 el resumen3 la selección de la in%ormación para
4acerla abarcable y mane)able.
A9 Separaci! e! &!idades.
'os criterios para dividir la in%ormación en unidades pueden ser muy diversos. ;onsiderando que los datos aparecen
en %orma de te-tos3 el criterio aplicable para la segmentación podr#a encontrarse dentro de alguno de los siguientes
tipos:
• $spaciales
• >emporales
• >emáticos
• Gramaticales
• ;onversacionales
• 9ociales
:ás de un tipo de criterios podr#an combinarse a la 4ora de separar las unidades en un te-to. $l criterio temático es el
más e-tendido3 y resulta más valioso en el análisis de los datos cualitativos.
59 Ide!%i)icaci! - clasi)icaci! de &!idades
;ategorizamos y codi%icamos un con)unto de datos. $-aminamos las unidades de datos para identi%icar en ellas
determinados componentes temáticos que nos permitan clasi%icarlas en una y otra categor#a de contenido.
'a categorización 4ace posible clasi%icar conceptualmente las unidades que son cubiertas por un mismo tópico. 'as
categor#as pueden re%erirse a situaciones y conte-tos3 actividades3 relaciones entre personas3 comportamientos3
opiniones3 sentimientos3 perspectivas de un problema3 m8todos3 procesos. $s una tarea simultánea a la separación en
unidades cuando esta est8 atendiendo a criterios temáticos.
1L
'a codi%icación no es más que la operación concreta por la que se asigna a cada unidad un indicativo (código, propio
de la categor#a en la que la consideramos incluida. $s el proceso %#sico3 manipulativo mediante el cual de)amos
constancia de la categor#a realizada.
'os códigos que representan a las categor#as son marcas que a&adimos a las unidades de datos3 para indicar la
categor#a a la que pertenecen.
'as categor#as pueden estar prede%inidas por el analista3 o por el contrario3 pueden surgir a medida que se analizan los
datos.
$n la práctica3 es 4abitual que la codi%icación se 4aga recurriendo a procedimientos inductivoIdeductivos. 9e parte de
categor#as amplias de%inidas a priori3 a partir de las cuales se van introduciendo modi%icaciones y ampliaciones que
permiten la adaptación al con)unto de datos al que están siendo aplicadas. 7urante la codi%icación es posible constatar
que determinados códigos podr#an 4aber sido agrupados en uno solo3 o por el contrario que cabr#a dividir uno de ellos
esotros diversos3 que ciertas categor#as podr#an 4aber sido denominadas de otro modo3 o que se podr#an suprimir.
;aracter#sticas de categor#as (cuali,
• =b)etividad: deben resultar inteligibles para distintos codi%icadores
• 0ertinenciaR deben ser relevantes en relación a los ob)etivos del estudio y adecuadas al propio contenido
analizado.
C9 S(!%esis - a.r&pa+ie!%o
'a identi%icación y clasi%icación de elementos están estrec4amente unidos a la s#ntesis3
;uando categorizados estamos ubicando di%erentes unidades de datos ba)o un mismo tópico o concepto teórico. $n el
análisis de datos3 la s#ntesis conceptual va acompa&ada por un agrupamiento %#sico de las unidades que %orman parte
de una misma categor#a.
;uando sintetizamos en una metacategor#a la in%ormación contenida en varias categor#as que tienen algo en común3 o
cuando de%inimos metacódigos que agrupan a un con)unto de códigos.
2. Disposici! - %ra!s)or+aci! de da%os
0ara llegar a e-traer conclusiones a partir de los datos3 es preciso presentarlos o disponerlos de algún modo ordenado.
"na disposición es un con)unto organizado de in%ormación3 presentada en alguna %orma espacial ordenada3 abarcable
y operativa de cara a resolver las cuestiones de investigación.
;uando la disposición de datos conlleva además un cambio en el lengua)e utilizado para e-presarlos3 4ablamos de
una trans%ormación de los datos.
• Grá%icos o diagramas3 de%inidos como representaciones grá%icas de las relaciones entre conceptos
• :atrices: tablas de doble entrada en cuyas celdas se alo)a una breve in%ormación verbal3 de acuerdo con los
aspectos especi%icados por %ilas y columnas
• 9istema de redesR clari%icar y presentar las distinciones que delimitan a las diversas categor#as consideradas en
el análisis del material cualitativo3 las cuales a su vez pueden estar subdivididas.
0. O"%e!ci! de res&l%ados - co!cl&sio!es
$nsamblar de nuevo los elementos di%erenciados en el proceso anal#tico para costituir un todo estructurado y
signi%icativo. 'as conclusiones son los resultados3 los productos de la investigación y la interpretación que 4acemos
de los mismos.
"na de las principales 4erramientas intelectuales en el proceso de obtención de conclusiones es la comparación.
0ermite destacar las seme)anzas y di%erencias entre las unidades incluidas en una categor#a3 y 4ace posible la
%ormulación de sus propiedades %undamentales3 a partir de las cuales puede llegarse a una de%inición3 ilustración y
veri%icación de esa categor#a.
Algunas estrategias para la interpretación de los resultados y su integración con marcos más amplios ser#an:
• ;onsolidación teórica: con%rontar los resultados obtenidos con los marcos teóricos desarrollados
originalmente3 modi%icando estos para intentar que se a)usten más a los datos
• Aplicación de otras teor#as: búsqueda de marcos más generales en los que integrar los datos3 4aciendo posible
la generalización de los resultados
• "so de metá%oras y analog#as: medios útiles para establecer cone-iones entre temas aparentemente no
1M
relacionados3 o conectar los resultados a la teor#a
• 9#ntesis de los resultados con los obtenidos por otros investigadores.
"na vez alcanzadas las conclusiones3 es necesario veri%icar esas conclusiones3 es decir3 con%irmar que los resultados
corresponden a los signi%icados e interpretaciones que los participantes atribuyen a la realidad.
$l concepto de validez 4a sido usado en una variedad de %ormas en la literatura sobre metodolog#a.
6alidez interna: indicador de la apro-imación de las conclusiones de un estudio a la realidad.
6alidez e-terna: posibilidades de generalizar los resultados a otras poblaciones o conte-tos.
6eri%icar las conclusiones de un estudio signi%ica comprobar el valor de verdad de los descubrimientos realizados3
comprobar su validez.
$n los estudios cualitativos3 la estimación de la validez es menos precisa que en la investigación cuantitativa3
basándose en )uicios sobre la correspondencia entre los 4allazgos y la realidad.
Ta-lor - 5o.da!
El %ra"a2o co! los da%os. A!1lisis de los da%os e! la i!/es%i.aci! c&ali%a%i/a
Es%&dios descrip%i/os - %ericos.
Es%&dios descrip%i/os: se caracterizan por un m#nimo de interpretación y conceptualización. $stán redactados de
modo tal que permiten a los lectores e-traer sus propias conclusiones y generalizaciones a partir de los datos.
$studios clásicos de la $scuela de ;4icago.
/istorias de vida: el protagonista narra su 4istoria en sus propias palabras.
Es%&dios %ericos: se orientan 4acia el desarrollo o veri%icación de la teor#a sociológica. $l propósito de los estudios
teóricos consiste en comprender o e-plicar rasgos de la vida social que van más allá de las personas y escenarios
estudiados en particular. 'os investigadores se&alan activamente lo que es importante. "tilizan los datos descriptivos
para ilustrar sus teor#as y conceptos y para convencer a los lectores de que lo que ellos dicen es verdad.
Glaser y 9trauss distinguen dos tipos de teor#as:
• Las s&s%a!ciales: se relacionan con un área sustancial o concreta de indagación (e): escuelas3 prisiones3
delincuencia )uvenil,
• Las )or+ales: se re%ieren a áreas conceptuales de indagación3 tales como los estigmas3 las organizaciones
%ormales3 la socialización3 la desviación.
Desarrollo - /eri)icaci! de &!a %eor(a
0ara Glaser y 9trauss3 la investigación cualitativa3 lo mismo3 que los estudios cuantitativos3 puede y debe ser utilizada
con el %in de desarrollar y veri%icar o poner a prueba proposiciones sobre la naturaleza de la vida social. $l
procedimiento de la inducción anal#tica 4a sido el principal empleado con tal ob)eto. Aunque la mayor parte de los
investigadores adoptan en sus estudios elementos de ambos en%oques3 al considerar el análisis de los datos
cualitativos resulta útil di%erenciar la generación de la teor#a de la veri%icación de la teor#a3 con los respectivos
recursos de la teor#a %undamentada y la inducción anal#tica.
Teor(a )&!da+e!%ada
$s un m8todo para descubrir teor#as3 conceptos3 4ipótesis y proposiciones partiendo directamente de los datos3 y no
de supuestos a priori3 de otras investigaciones o de marcos teóricos e-istentes.
G y 9 proponen dos estrategias principales para desarrollar teor#a %undamentada:
• El +;%odo co+para%i/o co!s%a!%e3 por el cual el investigador simultáneamente codi%ica y analiza datos para
desarrollar conceptos. :ediante la comparación continua de incidentes espec#%icos de los datos3 el
investigador re%ina esos conceptos3 identi%ica sus propiedades3 e-plora sus interrelaciones y los integra en una
teor#a co4erente
• M&es%reo %erico3 en el que el investigador selecciona nuevos casos a estudiar según su potencial para ayudar
1O
a re%inar o e-pandir los conceptos y teor#as ya desarrollados.
Al generar teor#a %undamentada3 los investigadores no tratan de probar sus ideas3 sino sólo de demostrar que son
plausibles. Aducen que el criterio clave para evaluar las teor#as consiste en e-aminar si se a)ustan y %uncionan.
0or a)uste entendemos que las categor#as deben ser %ácilmente aplicables a los datos que se estudian y surgir de ellos.
$l %uncionamiento supone que deben ser signi%icativamente apropiadas y capaces de e-plicar la conducta en estudio.
La i!d&cci! a!al(%ica
$s el procedimiento para veri%icar teor#as y proposiciones basadas en datos cualitativos. 9u %inalidad consiste en
identi%icar proposiciones universales y leyes causales.
0asos:
1. 7esarrollar una de%inición apro-imada del %enómeno a e-plicar
*. <ormular una 4ipótesis para e-plicar dic4o %enómeno
2. $studiar un caso para ver si la 4ipótesis se a)usta
5. si la 4ipótesis no e-plica el caso3 re%ormularla o rede%inir el %enómeno
+. ?uscar activamente casos negativos que re%uten la 4ipótesis
L. ;uando se encuentren casos negativos3 re%ormular la 4ipótesis o rede%inir el %enómeno
M. ;ontinuar 4asta que se 4a puesto a prueba adecuadamente el %enómeno3 e-aminando una amplia gama de
casos.
Al dirigir la atención 4acia los casos negativos3 la inducción anal#tica obliga al investigador a re%inar y matizar las
teor#as y proposiciones.
$n contraste con el en%oque de la teor#a %undamentada3 la inducción anal#tica tambi8n ayuda a los investigadores a
plantear la cuestión del potencial de generalización de sus resultados. 9i los investigadores pueden demostrar que 4an
e-aminado una su%icientemente amplia gama de casos de un %enómenos3 y buscado espec#%icamente casos negativos3
están en condiciones de de%ender me)or la naturaleza general de lo que 4ayan 4allado.
Eor!"li%
'as 4istorias de vida son un rastreo detallado de la trayectoria vital de una persona. 9e elige una o varias personas
protot#picas del tema que se pretende abordar.
$l relato de vida son narraciones biográ%icas acotadas al ob)eto de estudio de un investigador. 9e centran en un
aspecto particular.
Modalidades de a!1lisis de los rela%os de /ida:
?ertau- se&ala dos %ormas básicas que pueden adoptarse en la realización del análisis:
• 'a modalidad 4ermen8utica3 que consiste en el descubrimiento de los signi%icados que transmiten las personas
que relatan sus vidas
• :odalidad etnosociológica3 que consiste en acceder a trav8s de los relatos a los re%erentes contenidos en ellos3
que dan cuenta de relaciones3 normas y procesos que estructuran la vida social.
$n relación con esto mismo3 9antamarina y :arinas a%irman que e-isten tres modalidades anal#ticas:
1. 'a perspectiva estructuralista3 realización de un recorrido lo más e-4austivo posible de la pluralidad de
situaciones e in%ormantes pertinentes para mapear el campo de estudio.
*. $l modelo 4ermen8utico3 que consiste en el análisis en pro%undidad de uno o varios te-tos3 centrándose en el
te-to mismo con el propósito de descubrir los sentidos que están ocultos en 8l.
2. 'a comprensión esc8nica. $n todo relato se actualizan tres tipos de escenas: las vividas en el pasado (conte-to
sociobiográ%ico,3 en el presente (relaciones actuales, y en la entrevista (conte-to de interacción,
Di+e!sio!es ide!%i)ica"les e! los rela%os de /ida
1Q
• !ealidad 4istórico emp#rica que constituye el tras%ondo en el que se desarrolla el relato de vida
• !ealidad ps#quica: los contenidos semánticos con que el su)eto describe su itinerario biográ%ico
• !ealidad discursiva del relato tal como se produce en la entrevista
E!)o,&es e! el a!1lisis de los rela%os de /ida
1. El e!)o,&e de la >is%oria !a%&ral: reproducir los 4ec4os ob)etivos que constituyen la vida de las personas.
'as vidas de las personas son planteadas como construcciones racionales que se e-tienden a lo largo del
tiempo3 por lo cual lo que se busca es desentra&ar las razones que las ordenan.
*. El a!1lisis co+pre!si/o de 5er%o&C: identi%icación de los indices: aspectos que son reconocidos por los
autores de los relatos ySo el investigador como 4ec4os que 4an marcado la e-periencia de vida3 con respecto a
los cuales se plantean en el análisis interrogantes relativos a su signi%icación sociológica. B0unto de vira)eC3
momentos vitales identi%icados como una encruci)ada a partir de la cual el itinerario biogTra%ico tomó un
rumbo distinto o inició una nueva etapa.
$l análisis comprensivo pone especial 8n%asis en la consideración del conte-to socio4istórico en el que se
desenvuelven las vidas de las personas. $sto implica tomar en cuenta la dimensión temporal como aspecto
clave en la interpretación de los datos. 'a conte-tualización socio4istórica de los escenarios microsociales en
los que se desenvuelven las vidas personales es uno de los ob)etivos centrales del análisis comprensivo.
0. El a!1lisis %e+1%ico
'a identi%icación de los temas presentes en las 4istorias de vida es uno de los procedimientos más usuales.
'ectura de los relatos identi%icación de núcleos temáticos3 organización de los datos según la relación que se
puede establecer entre los núcleos.
5. El a!1lisis i!%erpre%a%i/o: los relatos construidos por los su)etos son interpretados por el cient#%ico social3
quien 4ace de cada caso de estudio singular pero a la vez general3 en la medida en que se apoya en 8l para
crear nuevos desarrollos teóricos.
F. El a!1lisis de la ide!%idad de De+ar6iere - D&"ar
'a %ragmentación de lo social en múltiples e-periencias posibles y la %ragmentación de la identidad individual
tambi8n en múltiples aspectos3 no siempre englobados co4erentemente en un yo. /acen que los relatos de los
individuos deban ser interpretados. Analizar los mecanismos de producción de sentido3 comparar las palabras
di%erentes3 desnudar las oposiciones y las correlaciones más estructurantes.
>odo relato puede ser analizado en tres niveles di%erentes3 que se articulan necesariamente entre s#:
• $l nivel de las secuencias en las que se despliegan los episodios del relato
• $l nivel de los actuantes3 los persona)es que )uegan un rol en el relato
• $l nivel de los argumentos proporcionados por los entrevistados para de%ender sus puntos de vista
$l ob)etivo de este tipo de análisis es clasi%icar en un modo comprensivo las estructuras de relatos para poner
en evidencia sus seme)anzas y sus di%erencias. $l análisis estructural se propone poner en evidencia las
relaciones entre ciertas dimensiones y las tensiones entre ellas3 y as# poder evidenciar los contenidos
impl#citos3 las grandes oposiciones3 las estructuraciones %undamentales que organizan la relación de la persona
con el mundo y aclarar la organización de su estructura socioa%ectiva.
Marradi
$l análisis de contenido es una t8cnica de interpretación de te-tos que se basa en procedimientos de descomposición
y clasi%icación de estos.
$n la actualidad se suele distinguir entre el análisis de contenido clasico3 %iel a la cuanti%icación de los aspectos
mani%iestos del te-to3 y el análisis de contenido cualitativo3 desarrollado a partir de los a&os oc4enta3 que se basa en
un con)unto de t8cnicas destinadas a interpretar su sentido latente u oculto.
$l análisis de contenido se presenta a4ora a trav8s de tres tipos:
• Te+1%ico se centra en la presencia de t8rminos3 con independencia de las relaciones que sur)an entre ellos.
'as t8cnicas más utilizadas son las listas de %recuencias3 la identi%icación y clasi%icación temática3 y la
búsqueda de palabras en conte-to.
• Se+1!%ico: pretende ante todo estudiar las relaciones entre los temas tratados en un te-to3 para esto se de%ine
cierta estructura signi%icativa de relación y se consideran todas las ocurrencias que concuerdan con ella
• A!1lisis de redes: se centra en la ubicación relativa de ciertos componentes en el te-to3 asumiendo que la red
*.
l8-ica ideológicamente signi%icativa que impregna el discurso se identi%ica sobre la base de la reiteración y da
como resultado un esquema de organización semántica de este discurso en %orma de red.
$l análisis de contenido cualitativo no niega las venta)as del cuantitativo3 al que suele tomar como una etapa inicial3
sólo que busca enriquecerlo a trav8s de procedimientos interpretativos3 tratando de ir más allá de los aspectos
mani%iestos a trav8s de la consideración del contenido latente y del conte-to en el que se inscribe un determinado
te-to.
"na vez de%inido el con)unto de te-tos3. 'a cuestión es construir un esquema de codi%icación. $sto se puede 4acer a
priori3 cuando las categor#as que orientarán el análisis se de%inen de antemano3 a partir de una opción teórica3 o
siguiendo un recorrido emergente. $sta última modalidad se encuentra muc4o más di%undida3 y consiste en la
construcción de una suerte de cuestionario estandarizado e- post a partir de una e-ploración preliminar de los te-tos.
9e trata de identi%icar las respuestas impl#citas en el te-to a un cuestionario imaginario al cual no responde3 pero que
podr#a 4aber respondido. $l esquema de codi%icación incluirá todas estas preguntas imaginarias y las distintas rutas q
aparecen en los te-tos.
*1

Sponsor Documents

Or use your account on DocShare.tips

Hide

Forgot your password?

Or register your new account on DocShare.tips

Hide

Lost your password? Please enter your email address. You will receive a link to create a new password.

Back to log-in

Close