- Início
- Sobre
- Módulos
- Andragogia (28)
- Aprendizagem Organizacional (18)
- Aula Expositiva (41)
- Avaliação da Aprendizagem (96)
- Avaliação de Programas e Instituições (18)
- Avaliação do Professor (39)
- Capacitação de Professores (126)
- Coletando Informações via Internet (10)
- Construtivismo (44)
- Cérebro e Aprendizagem (164)
- Educação na Sociedade de Informação (106)
- Ensino a Distância (146)
- Ensino e Aprendizagem (139)
- Ensino não Diretivo (22)
- Metodologia da Pesquisa (202)
- Métodos Grupais (64)
- Métodos de Ensino (52)
- Pesquisando Bibliografia via Internet (73)
- Planejamento Acadêmico (61)
- Qualidade no Ensino Superior (32)
- Tecnologia Instrucional (136)
- Universidade no Brasil (109)
- Sugestões/Críticas e etc.
em Metodologia da Pesquisa
PABLO CASAU
7. PRUEBAS DE CONFIRMACION
Al intentar confirmar nuestra hipótesis, podremos optar por un diseño experimental bivariado o por uno múltiple, según nuestras necesidades o posibilidades. Comencemos con el primero.
a) Diseños experimentales bivariados
Dentro de los diseños experimentales bivariados hay varios tipos, pero el objetivo es aquí siempre probar la relación X-Y como causal. Los iremos describiendo en orden de complejidad creciente basándonos en la versión Selltiz – Jahoda – Deutsch – Cook (13). Cuando sospechamos que realmente hay pocas variables extrañas utilizaremos un diseño más simple, pero cuando no es así nos vemos obligados a tomar más recaudos mediante un diseño más complejo. Los diseños que veremos son seis y no son los únicos posibles, pero bastarán para que el paciente lector se forme una idea sobre cómo están hechos y cómo pueden aplicarse.
En el esquema siguiente se resumen los distintos tipos de diseños experimentales bivariados, desde el más sencillo al más complejo. Todos los grupos fueron tomados al azar, y se supone además que están ejerciendo influencia variables adicionales o extrañas al experimento: de otro modo no tendría sentido usar estos diseños, cuyo propósito es precisamente controlarlas.
Diseños experimentales bivariados (Versión ligeramente modificada por el autor de Selltiz-Jahoda-Deutsch-Cook)
|
Tipo de diseño (19)
|
Grupos
|
Y antes
|
X
|
Y después
|
Cambio (d)
|
Interacción (I)
|
Ejemplos
|
|
1. Solo despues
|
Experimental
Control
|
----
----
|
X
----
|
Y2
Y’2
|
d = Y2-Y’2
|
----
|
X = Proyección de un film de guerra
Y = Opinión sobre la guerra
|
|
2. Antes y despues con un grupo
|
Experimental
|
Y1
|
X
|
Y2
|
d = Y2-Y1
|
----
|
X = Frustración
Y = Constructividad lúdica
|
|
3. Antes y despues con grupos intercambiables
|
Experimental
Control
|
----
Y’1
|
X
----
|
Y2
----
|
d = Y2-Y’1
|
----
|
X = Campaña publicitaria
Y =Efectividad de la campaña
|
|
4. Antes y despues con un grupo de control
|
Experimental
Control
|
Y1
Y’1
|
X
----
|
Y2
Y’2
|
d = Y2-Y1
d’ = Y’2-Y’1
|
----
|
X = Proyección de un film de guerra
Y = Opinión sobre la guerra
|
|
5. Antes y despues con dos grupos de control
|
Experimental
Control I
Control II
|
Y1
Y’1
(Y’’1)
|
X
----
X
|
Y2
Y’2
Y’’2
|
d = Y2-Y1
d’ = Y’2-Y’1
d’’ = Y’’2-Y’’1
|
I = d – (d’+d’’)
|
X = Curso de entrenamiento en relaciones humanas
Y = Opinión sobre las relaciones humanas
|
|
6. Antes y despues con tres grupos de control
|
Experimental
Control I
Control II
Control III
|
Y1
Y’1
(Y’’1)
(Y’’’1)
|
X
----
X
----
|
Y2
Y’2
Y’’2
Y’’’2
|
d = Y2-Y1
d’ = Y’2-Y’1
d’’ = Y’’2-Y’’1
d’’’ = Y’’’2-Y’’’1
|
I = d – (d’+d’’-d’’’)
|
-----
|
En este esquema observamos las expresiones “Y antes”, “X” e “Y después”. Si retomamos el ejemplo de la relación ruido-estrés, “Y antes” significa la medición del estrés antes de aplicar el ruido (o premedida de Y), “X” significa aplicación del estímulo sonoro, e “Y después” indica la medición del estrés después de haber aplicado dicho estímulo (posmedida de Y). Esta última medición debe realizarse para constatar si hubo o no alguna diferencia.
En función de lo dicho encontraremos dos tipos de diseño bivariado: a) de sólo después, donde no tomamos la premedida, sino solamente aplicamos el ruido y luego medimos el estrés; y b) de antes y después, donde tomamos tanto la premedida como la posmedida. Se trata de diseños más complejos y, como se ve en el esquema, admiten cinco variantes.
1) Diseño de sólo después.- Es un diseño sencillo donde trabajamos con un grupo experimental y otro de control, sin haber tomado a ninguno la premedida. Lo que hacemos es someter a estímulos sonoros (X) al grupo experimental, y luego averiguamos las posmedidas de estrés en ambos grupos (Y2 e Y’2). Si hay diferencia significativa entre ambas medidas de estrés, cabe pensar entonces que X es la causa de Y. En otras palabras, la diferencia “d” (ver columna de ‘cambio’) debe ser distinta a cero. En principio, cuanto más diferente de cero sea “d”, tanto más probable es la influencia de X como factor causal. Si “d” da cero o valores muy próximos a cero no hubo cambio, o sea el nivel de estrés en ambos grupos es igual, de donde pensamos que el factor ruido no tuvo influencia causal. Supongamos un ejemplo numérico:
|
Grupo
|
Y antes
|
X
|
Y después
|
Cambio
|
|
Experimental
Control
|
----
----
|
X
----
|
20
15
|
d = 20-15 = 5
|
En este experimento imaginario el nivel de estrés de quienes sufrieron ruidos es 20 (por ejemplo 20 ml de adrenalina en sangre), y el nivel de los que no sufrieron los ruidos es 15. Aparece una diferencia significativa, que es 5, y por lo tanto concluímos que el ruido ejerce influencia causal.
Cuando aplicamos este diseño, estamos suponiendo que los niveles de estrés antes del ruido (premedidas) son aproximadamente iguales en ambos grupos y que tienen en este caso el mismo valor 15, pues ambos grupos fueron extraídos de la misma muestra, se suponen homogéneos entre sí y los sujetos fueron elegidos al azar. De esta forma el grupo de control, al no haber sido expuesto a ruidos, seguirá manteniendo el valor 15 de estrés, pero no así el grupo experimental. Esquemáticamente, la situación sería así:
|
Grupo
|
Y antes
|
X
|
Y después
|
Cambio
|
|
Experimental
Control
|
(15)
(15)
|
X
----
|
20
15
|
d = 20-15 = 5
|
El valor 15 entre paréntesis indica que sólo suponemos dicho valor para ambos grupos antes de aplicar el ruido, pues en realidad en este tipo de diseño no hemos tomado efectivamente las premedidas. Si tenemos fuertes razones para suponer que las premedidas son iguales, no nos molestaremos en tomarlas, pero puede ocurrir que tengamos alguna duda y, al medirlas, comprobamos que en realidad son bastante distintas, como sería en el siguiente ejemplo hipotético:
|
Grupo
|
Y antes
|
X
|
Y después
|
Cambio
|
|
Experimental
Control
|
(20)
(15)
|
X
----
|
20
15
|
d = 20-15 = 5
|
Si las cosas ocurren así, entonces nos hemos equivocado al suponer que el ruido causa el estrés, ya que en el grupo experimental el nivel de estrés antes y después del ruido es igual. Por lo tanto, cuando tenemos suficientes razones para sospechar que las premedidas son distintas, debemos tomarnos la molestia de medirlas, y entonces ya no estaremos utilizando el diseño de sólo después, sino cualquiera de los diseños de antes y después.
En esta clase de diseños sí habrá de interesarnos tomar las premedidas y, cuando lo hacemos, pueden suceder dos cosas: a) que las premedidas sean iguales, situación que es la más deseable porque de entrada pone en el mismo nivel a todos los grupos respecto de la variable Y (estrés). Fueron grupos bien elegidos y proseguimos el experimento con ellos sin cambiarlos; b) que las premedidas sean distintas entre sí, en cuyo caso volveremos a seleccionar otros grupos que sean homogéneos respecto de sus premedidas, a efectos de nivelarlos. Otra posibilidad sería continuar con los grupos originales desiguales, pero en esta situación habremos de tener en cuenta sus diferencias al momento de la evaluación de los resultados finales.
Antes de examinar los diseños de antes y después, demos un ejemplo de diseño de sólo después (Selltiz). El problema que generó la investigación fue saber hasta qué punto la proyección de un film de guerra (X) influía sobre la opinión de las personas sobre los temas bélicos (Y). Antes de la proyección del film al grupo experimental, se partió de la base de que las personas de ambos grupos (experimental y de control) tenían más o menos las mismas opiniones sobre la guerra, con lo cual no era necesario tomar las premedidas de Y. Acto seguido se proyectaron varios films de guerra sólo al grupo experimental, y después se hicieron encuestas sobre opiniones de temas bélicos a ambos grupos: si había diferencia significativa entre estas opiniones, entonces se comprobaba la influencia causal de la proyección del film, y si no, no.
2) Diseño de antes y después con un grupo.- Es el diseño más sencillo en cuanto utilizamos un solo grupo: el experimental. En él, medimos el estrés antes del estímulo sonoro (Y1), aplicamos este estímulo (X), y voolvemos a medir el estrés después (Y2). Si hay diferencia significativa entre Y2 e Y1, entonces el ruido es factor causal del estrés.
Selltiz da un ejemplo para el tipo de diseño 2. Se puede averiguar qué influencia tiene la frustración (X) sobre la constructividad en el juego en los niños, para lo cual se ubican infantes con juguetes en una habitación donde el investigador puede observarlos a ellos pero no estos a él. Los niños comenzarán a jugar, y se evalúa luego de cierto tiempo el grado de constructividad que despliegan. Luego se los somete a estímulos frustrantes (ocultarles los juguetes, mostrales juguetes más nuevos pero que no pueden tocar, etc.) y se mide después nuevamente el grado de constructividad cuando sigan jugando para saber si hubo o no alguna variación significativa. Este experimento resulta también útil para evaluar el grado de sadismo del investigador.
La simplicidad de este diseño radica en que el investigador que lo utiliza supone que las distintas variables extrañas que pueden actuar sobre el estrés están razonablemente controladas o anuladas por la simple aleatorización, y no es necesario entonces el empleo de grupos de control. Sin embargo, si sospechamos que esas variables sí están ejerciendo su influencia, entonces deberemos usar diseños más complejos, que enseguida veremos. Entre estas variables extrañas hay dos que son particularmente importantes: la influencia de la premedida y la interacción. Si creemos que la variable que interviene es solamente la premedida, optaremos por realizar un experimento según el diseño de antes y después con grupos intercambiables.
3) Diseño de antes y después con grupos intercambiables.- Se trata de un diseo especial para el control de la influencia de la premedida de Y. el sólo hecho de tomar una premedida del estrés puede hacer aumentar el estrés de la persona (por ejemplo por sentirse investigada). Por lo tanto habrá aquí dos factores concurrentes que producen estrés: la premedida y el ruido. Si queremos eliminar la influencia de la premedida recurrimos a un expediente muy simple: sencillamente no la tomamos. En el esquema general de los diseños experimentales bivariados se aprecia, efectivamente, que el grupo experimental no es premedido: solamente es expuesto a X y luego posmedido.
Sin embargo, necesitamos conocer el valor de la premedida del grupo experimental, y entonces recurrimos a un procedimiento también sencillo: le tomamos la premedida a otro grupo (grupo de control), el cual, por haber sido tomado de la misma muestra que el grupo experimental, existe suficiente seguridad estadística de que ambos grupos tendrán aproximadamente las mismas premedidas, o sea, el mismo nivel previo de estrés. Por lo tanto el valor de la premedida del grupo de control (Y’1) podremos considerarlo como si fuese el valor de la premedida del grupo experimental, con lo cual sólo nos resta comparar si ésta última y la posmedida son o no iguales: si la diferencia se aproxima a cero, entonces el ruido no influye como causa, y en caso contrario, sí. La única utilidad que entonces tiene aquí el grupo de control es la de proveernos de un datos premedido.
Notemos también que en este tipo de diseño la diferencia ‘d’ se obtiene comparando una premedida con una posmedida, en contraste con el diseño de sólo después donde comparábamos dos posmedidas.
Supongamos que queremos hacer una campaña publicitaria para vender relojes que funcionen con energía solar. Si queremos saber si fue o no efectiva podemos hacer una encuesta antes de la campaña preguntándoles a las personas sus preferencias en materia de relojes de distinto tipo, y luego otra encuesta después de la campaña para ver si las preferencias cambiaron o no como consecuencia de la misma.
Pero, el sólo hecho de hacer una encuesta antes puede estar ya influenciando (influencia de la premedida) en el sentido que las personas podrán poner mayor interés en la campaña posterior, con lo cual ésta ya no será la campaña original (o bien la opinión previa puede influír en la opinión posterior por cierta tendencia de las personas a responder siempre lo mismo). Para evitar esa influencia, la encuesta previa la hacemos con personas de la misma población pero que vivan fuera del alcance de la campaña publicitaria, con lo cual la encuesta posterior (posmedida) reflejará en el grupo experimental solamente la efectividad de la campaña, sin la influencia de la encuesta previa. Este experimento es entonces un ejemplo de aplicación del diseño de antes y después con grupos intercambiables.
4) Diseño de antes y después con un grupo de control.- Es muy similar al esquema de sólo después, con la única diferencia que aquí hemos tomado las premedidas para asegurarnos de la igualdad de condiciones de ambos grupos. Para que con este nuevo diseño podamos probar que X es causa de Y, deberán verificarse simultáneamente dos condiciones: que d sea distinto de cero, y que d’ sea igual o muy próximo a cero. Ejemplo:
|
Grupo
|
Y antes
|
X
|
Y después
|
Cambio
|
|
Experimental
Control
|
15
15
|
X
----
|
20
15
|
d = 20-15 = 5
d’ = 15-15 = 0
|
Este diseño nos sirve especialmente, entonces, para averiguar cómo son las premedidas entre sí de ambos grupos, pero no permite controlar si hay o no influencia de la interacción, influencia de la premedida, u otras influencias. Por lo tanto, lo aplicaremos cuando tenemos fuertes razones para pensar que todas estas variables extrañas no están ejerciendo influencia significativa.
5) Diseño de antes y después con dos grupos de control.- El propósito central de este tipo de diseño es el de controlar la influencia de la interacción, y entonces lo aplicamos cuando sospechamos su existencia. El diseño puede medir también la influencia de la premedida; efectivamente, notemos que aquí la situación de los grupos de control II y I es igual a la situación de los dos grupos del diseño 3, el cual servía precisamente para el control de esta variable extraña.
Aclaremos el concepto de interacción. Supongamos que el hambre (X) produce agresividad (Y), como pueden sugerirlo los saqueos a los supermercados en épocas de crisis. Si pudiésemos disponer de un ‘agresivómetro’, supongamos que el hambre produce una agresividad de 3. Por otro lado, otras observaciones nos pueden sugerir que también la fatiga produce agresividad: si la película es muy larga el público se puede enojar. Supongamos que aquí la fatiga produce agresividad 1. El sentido común puede sugerirnos que, si los factores hambre y fatiga actúan conjuntamente, el sujeto responderá con una agresividad 4 (3 por hambre y 1 por fatiga). Esquemáticamente:
|
X
|
Y
|
|
Hambre
Fatiga
Hambre + fatiga
|
Agresividad 3
Agresividad 1
Agresividad 4
|
Sin embargo, puede ocurrir que estos efectos no sean aditivos. Si un individuo está hambriento y encima fatigado, probablemente no le quede mucha energía para ser agresivo, y entonces en estos casos podemos obtener un valor 0.5 para su agresividad. Qué ha ocurrido? Las variables hambre y fatiga han interactuado, o sea produjeron un efecto inesperado, no aditivo: la agresividad resultante fue mucho menor a la esperada, aunque en otros casos los efectos pueden ser mayores que la simple suma, vale decir que al interactuar, las variables potencien sus efectos como en el caso del consumo simultáneo de alcohol y drogas. El primero produce daño cerebral 7 (una cifra cualquiera) y las segundas daño cerebral 9; pero, si ambos factores actúan juntos, el daño cerebral no será 16 sino 30.
Definiremos entonces interacción como toda situación en la cual dos o más variables, por el solo hecho de actuar conjuntamente sobre un efecto, producen una influencia no aditiva sobre éste, sea reduciéndolo, sea potenciándolo. Se trata entonces de efectos combinados que van más allá de los simples efectos aditivos. Otros autores dan definiciones similares. Una de ellas, por caso, afirma que entre dos variables ocurre interacción cuando el efecto que ejerce una de ellas en la variable dependiente ‘cambia’ conforme los valores que adquiere la otra, es decir, cuando la acción de una de las variables depende de cómo actúa una segunda (20).
La consideración de la interacción puede tener gran importancia práctica. Piénsese, por ejemplo, en la posibilidad de que dos tratamientos combinados (psicoterapia y farmacoterapia) puedan producir efectos curativos que van más allá de la simple suma de los efectos curativos de cada tratamiento.
Blalock (16) cita un ejemplo para comparar los efectos aditivos (que este autor y otros varios llaman ‘efectos principales’) con los efectos de interacción. Las variables educación, sexo y raza determinan aditivamente el ingreso mensual: 2000 dólares por tener título secundario, más 2000 dólares por ser varón, más 2000 dólares por ser blanco.
Sin embargo esta aditividad puede distorsionarse, o sea pueden aparecer efectos de interacción, como por ejemplo cuando la diferencia de ingresos entre blancos y negros es pequeña para un bajo nivel educacional, pero mayor en los altos niveles de educación. Así, si un blanco posee solamente título primario, su sueldo por ser blanco se acercará más al sueldo de un negro con primaria y ganará en tal concepto sólo 500 dólares más (y no 2000). Están aquí interactuando las variables educación y raza produciendo un efecto no aditivo sobre el ingreso mensual.
Traslademos ahora el concepto de interacción al diseño 5. En este caso lo que queremos averiguar es si hay o no interacción entre la premedida (Y1) y la variable experimental (X), es decir, si producen o no un efecto no aditivo sobre la posmedida (Y2). Por lo tanto, la sospecha estará recayendo solamente en el grupo experimental, único grupo donde ambos factores actúan conjuntamente.
Para saber si existe o no interacción, primero averiguaremos los efectos que producen independientemente Y1 y X, o sea, cuando actúan solos, lo que podemos saber mediante los grupos de control I y II respectivamente. Vemos así que el diseño 5 hace posible la separación de la influencia de la variable experimental de la influencia de la premedida, aún cuando haya interacción entre ellas. Aclaremos que en el grupo de control II la premedida no fue efectivamente tomada (pues sólo nos interesa la influencia de X), pero como necesitamos igualmente conocer su valor, simplemente la inferimos a partir de las premedidas de los otros dos grupos, pudiendo ser un simple promedio de ellas. En el esquema general de diseños experimentales bivariados, los paréntesis significan que se trata de una premedida inferida. Comparemos ahora los siguientes dos ejemplos: uno donde no hay interacción y otro donde sí la hay.
Cuadro A (sin interacción)
|
Grupo
|
Y antes
|
X
|
Y después
|
Cambio
|
Interacción
I = d – (d’ + d’’)
I = 25 – (0 + 25) = 0
|
|
Experimental
Control I
Control II
|
15
15
(15)
|
X
----
X
|
40
15
40
|
d = 25
d’ = 0
d’’ = 25
|
Cuadro B (con interacción)
|
Grupo
|
Y antes
|
X
|
Y después
|
Cambio
|
Interacción
I = d – (d’ + d’’)
I = 25 – (0 + 5) = 20
|
|
Experimental
Control I
Control II
|
15
15
(15)
|
X
----
X
|
40
15
20
|
d = 25
d’ = 0
d’’ = 5
|
El grupo de control I detecta si hay o no influencia de la premedida (pues allí no se aplica ruido y mucho menos interviene la interacción entre premedida y ruido). Si comprobamos que efectivamente no existe esta influencia (como en los cuadros A y B), cualquier diferencia entre las posmedidas del grupo de control II y el grupo experimental será debida a la interacción (tal como ocurre en el cuadro B). En el caso de constatarse la existencia de interacción, el experimento deberá complejizarse para poder ponderar su influencia según qué valores asuman las variables interactuantes (pues puede ocurrir que para determinados valores la interacción quede anulada, para otros potencie sus efectos y para otros los reduzca por debajo de lo aditivamente esperable).
A partir de lo dicho fácil es darse cuenta que puede haber influencia de la premedida sin que haya interacción (caso donde la premedida y X dan efectos simplemente aditivos), pero no puede haber interacción sin influencia de la premedida (pues en estos diseños precisamente la interacción se establece entre la premedida y X). En los cuadros A y B, observando los valores del grupo de control I nos damos cuenta que no hubo influencia de la premedida, lo cual no significa que ésta pueda empezar a ejercer influencia a propósito de su acción conjunta con X en el grupo experimental.
Muchas veces con sólo mirar los valores de los cuadros podemos saber intuitivamente si hubo o no interacción, pero si queremos conocer cuantitativamente su valor preciso aplicaremos la fórmula de la interacción (ubicada a la derecha de los cuadros A y B): a medida que el resultado se aproxime a cero, la interacción será cada vez menor. Cuando el valor obtenido es cero, no la hay.
Selltiz cita un ejemplo de diseño 5, donde los investigadores trataron de averiguar si los cursos de entrenamiento en relaciones humanas (X) influían o no sobre la información y opinión sobre temas de relaciones humanas en las personas que hicieron dichos cursos. Se supuso que podía haber interacción entre la premedida (encuesta previa al curso) y la variable experimental (curso), y entonces se utilizaron otros dos grupos: uno hizo directamente el curso sin encuesta previa (grupo de control II), y el otro fue sometido a esta encuesta previa sn hacer el curso (grupo de control I), con lo cual pudieron medirse esas influencias en forma independiente.
6) Diseño de antes y después con tres grupos de control.- Además de medir la influencia de la interacción y de la premedida, este diseño tiene la ventaja adicional de poder controlar la influencia de otras variables extrañas desconocidas, tanto organísmicas (cambios madurativos, etc) como situacionales (clima, etc) que eventualmente puedan también estar ejerciendo su influencia.
Este sexto diseño es igual al anterior excepto que tiene agregado un grupo de control III, que es precisamente el que nos permite averiguar si influyen o no las otras variables adicionales. En él volvemos a encontrar una premedida inferida, o sea un premedida no tomada pero cuyo valor se supone similar a las premedidas tomadas en los otros grupos. La necesidad de contar con este valor deriva del hecho que necesitamos compararlo con la posmedida correspondiente para ver si existe o no una diferencia d’’’.
El razonamiento que debemos hacer entonces es el siguiente: sobre la posmedida del grupo de control III nunca podrá ejercer su influencia ni la premedida ni la variable experimental, pues no fueron aplicadas, ni mucho menos la interacción entre ellas. Por lo tanto, cualquier diferencia que aparezca entre la premedida inferida Y’’’1 y la posmedida Y’’’2 será debida a la influencia de las otras variables adicionales, lo cual nos permite entonces detectar sus intervenciones.
En síntesis: los tipos de diseño experimental aquí examinados están destinados a probar si X es factor causal de Y mediante el control de las variables adicionales. Estas últimas son fundamentalmente la influencia de la premedida, la interacción, y otras posibles variables que pueda haber.
Cuando consideramos que las variables adicionales ya están controladas de antemano y suponemos que las premedidas son iguales o controlables, aplicamos el diseño 1. Cuando no conocemos las premedidas y creemos que son distintas, nos sacaremos la duda aplicando los diseños de antes y después 2 y 4. Cuando sospechamos que además puede ejercer influencia la premedida, aplicamos el diseño 3. Cuando pensamos que interviene la interacción, aplicamos el diseño 5 y finalmente, cuando creemos que además de la premedida y la interacción intervienen otros factores que es preciso también controlar, nos decidiremos por el diseño 6.
Cómo averiguar qué tipo de diseño fue aplicado en un experimento dado? Para saberlo podemos contar con una regla práctica: si en el experimento no se tomaron premedidas, se aplicó el diseño 1, y si efectivamente fueron tomadas, quedan los diseños 2 al 6. Si se trabajó con un solo grupo se usó el diseño 2, con tres grupos el diseño 5 y con cuatro grupos el diseño 6. Restan los diseños 3 y 4, ambos con dos grupos. Reconocemos la aplicación del diseño 3 si se tomó una sola premedida (al grupo de control), y fue usado el diseño 4 si se tomaron las premedidas en ambos grupos.
b) Diseños experimentales multivariados
Además de estos diseños experimentales bivariados existen también los diseños experimentales multivariados, también llamados múltiples o factoriales. En ellos, la variable dependiente Y sigue siendo una sola, y lo único que aumenta es el número de variables independientes o experimentales (X1, X2, X3, etc), pues lo que se busca investigar son varios posibles factores causales al mismo tiempo, con el objeto de probar cuál o cuáles de ellos influyen como causa y en qué medida lo hacen.
Tales diseños multivariados se justifican por ejemplo cuando: a) no podemos aislar y controlar en la realidad las distintas variables independientes, con lo que no nos queda otro remedio que considerarlas conjuntamente mediante un diseño múltiple; b) cuando resulta menos costoso en tiempo y dinero tratar conjuntamente todas las variables en lugar de hacer varios diseños bivariados separados (como X1-Y, X2-Y, etc). Ejemplos de diseños multivariados son los siguientes:
|
|
Ejemplo 1
|
Ejemplo 2
|
Ejemplo 3
|
|
Variables independientes o experimentales
|
X1 = Número de palabras a recordar
X2 = Nivel de ansiedad
|
X1 = Variedad vegetal
X2 = Tipo de suelo
X3 = Clima
|
X1 = Método de enseñanza
X2 = Personalidad profesor
X3 = Proximidad exámenes
|
|
Variable dependiente
|
Y = Memoria
|
Y = Velocidad de crecimiento
|
Y = Rendimiento escolar
|
Estos diseños se complicarían si suponemos que existe interacción entre las variables experimentales consideradas, pero no examinaremos aquí esa posibilidad.
Tomemos el ejemplo 3, en el cual queremos averiguar cómo influyen sobre el rendimiento escolar el método de enseñanza, la personalidad del profesor y la proximidad de los exámenes. Para examinar todas estas variables a la vez hay varias técnicas, de las cuales citaremos a modo de ejemplo la técnica del cuadrado latino.
Antes de ser utilizado en la investigación experimental, el cuadrado latino era un simple entretenimiento que en la época medieval reemplazaba a la televisión, sólo que hacía pensar. Consistía en disponer en una tabla cuadrada letras de tal forma que ninguna de ellas podía repetirse en ninguna columna –vertical- ni hilera –horizontal-. Por ejemplo, si las letras eran A, B y C, el cuadrado latino se solucionaba del siguiente modo:
|
A
|
B
|
C
|
|
C
|
A
|
B
|
|
B
|
C
|
A
|
Aquí la letra A aparece sólo una vez en cualquier columna o hilera, y lo mismo sucede con las letras B y C. Una vez resuelto, se intentarían luego pruebas más difíciles utilizando por ejemplo cuatro columnas, cuatro hileras y cuatro letras, y así sucesivamente.
Con el cuadrado latino se investigan cuatro variables (tres independientes y una dependiente), y el número de columnas o hileras guarda relación no con el número de variables sino con el número de categorías de las mismas. Si queremos estudiar la influencia de tres variables independientes (método de enseñanza, personalidad del profesor y proximidad de los exámenes) sobre la variable dependiente (rendimiento escolar), y tomar tres categorías para cada una de esas variables, organizaremos el experimento sobre la base del siguiente cuadrado:
|
|
Examen lejano
|
Examen intermedio
|
Examen próximo
|
|
Profesor A
|
M1
|
M2
|
M3
|
|
Profesor B
|
M2
|
M3
|
M1
|
|
Profesor C
|
M3
|
M1
|
M2
|
En este cuadrado quedaron formados nueve casilleros. En la práctica, esto significa que hemos tomado nueve grupos de alumnos, y así por ejemplo el primer grupo está formado por alumnos que tienen el profesor A, cuyos exámenes están lejanos, y con los cuales se utilizó el método de enseñanza M1, y así sucesivamente con los demás grupos. Observemos que los números 1, 2 y 3, las tres categorías de la variable método de enseñanza, han sido dispuestas de acuerdo al criterio del cuadrado latino: no se repite ninguna cifra ni por hilera ni por columna. Esto resulta muy importante porque ‘mezcla’ todas las variables y categorías lo suficiente como para que no haya predominio de ninguna en especial en el conjunto de los nueve grupos. Así por ejemplo, si en lugar de haber puesto en la primera hilera horizontal M1, M2 y M3 hubiésemos puesto M1, M1 y M1, en esa hilera habría un neto predominio del método de enseñanza 1 y del profesor A. En cambio, con la disposición del cuadrado latino se procura que no aparezcan estos predominios.
Obviamente el cuadrado no contempla todas las posibilidades de combinación, pues faltan por ejemplo los grupos con profesor A, cercanía de exámenes y método de enseñanza 1. Esta y otras posibilidades fueron anuladas para evitar el predominio anteriormente citado, y los nueve grupos seleccionados bastan para poder emprender la investigación con ellos sin considerar los 27 posibles, con el consiguiente ahorro de esfuerzo, tiempo y dinero.
El hecho de que no aparezcan los predominios indicados tiene un motivo fundamental. Siguiendo con el ejemplo anterior, si en la primera hilera aparecen predominando el profesor A y el método de enseñanza 1, un muy alto rendimiento escolar en esos tres grupos no sabríamos si atribuírlo al profesor o al método de enseñanza, con lo cual habríamos desvirtuado el propósito del experimento, a saber, conocer el grado de influencia causal de cada uno de los factores considerados.
Una vez que hemos seguido durante meses la evolución de los nueve grupos formados, hipotéticamente podemos haber obtenido los siguientes valores de rendimiento escolar:
|
|
Examen lejano
|
Examen intermedio
|
Examen próximo
|
|
Profesor A
|
9
|
5
|
2
|
|
Profesor B
|
6
|
1
|
8
|
|
Profesor C
|
3
|
8
|
4
|
Estos valores no son frecuencias sino índices de rendimiento escolar, que pueden resultar por ejemplo del promedio de calificaciones de los alumnos de cada grupo. Por ejemplo, 9 fue el promedio de calificaciones obtenidos por el grupo con profesor A, examen lejano y método de enseñanza 1.
Cómo analizamos esta información? El primer lugar podemos comenzar observando dónde están las calificaciones más altas (8-8-9), y vemos que coinciden justamente con los grupos donde se aplicó el método de enseñanza 1. En segundo lugar podemos observar dónde están las calificaciones más bajas (1-2-3), que aparecen en los grupos donde se usó el método de enseñanza 3. Ambas observaciones nos sugieren que el factor método de enseñanza es muy importante para el rendimiento escolar, y además que las otras dos variables tienen escasa influencia, ya que por ejemplo tanto en los grupos con bajas calificaciones como en los de altas calificaciones, existieron diversos profesores y diversos grados de proximidad temporal al examen. Además, por ejemplo, cada profesor tuvo alumnos con rendimientos muy disímiles en sus respectivos tres grupos.
Los resultados de la investigación también podrían haber sido estos otros:
|
5
|
4
|
1
|
|
6
|
5
|
6
|
|
4
|
5
|
1
|
|
7
|
6
|
5
|
|
9
|
4
|
2
|
|
5
|
6
|
6
|
|
Caso A
|
|
Caso B
|
||||
En el caso A podemos sacar dos conclusiones importantes: primero, que el rendimiento escolar aumenta notablemente con la feliz combinación del profesor C que imparte el método de enseñanza 3 lejos de los exámenes (promedio de calificaciones 9), con lo cual pueden organizarse las clases en un colegio con estos criterios; y segundo, que la proximidad de los exámenes disminuye notablemente el rendimiento escolar, pues allí las calificaciones fueron bajas (1-1-2) en comparación con las calificaciones de los otros grupos.
En el caso B el análisis de los datos nos revela que ninguno de los tres factores es más importante que el otro, ejerciendo todos ellos una influencia más o menos igual, que hasta incluso podría ser nula. En el análisis de los datos es tan importante darse cuenta qué nos dicen como qué no nos dicen, y así, el caso B no nos informa acerca del porqué de las calificaciones regulares (5-6-7), lo cual puede atribuírse a alguna variable contextual como por ejemplo la edad de los alumnos: en la adolescencia, se piensa en cualquier cosa menos en estudiar.

