Bienvenidos al sitio

El espacio está destinado a aquellos que están interesados en la metodología de la investigación social y sus aplicaciones, especialmente profesionales, estudiantes e instituciones que requieren apoyo en estas áreas. También pretende enriquecer la comunicación con alumnos, tesistas y colegas. Sean bienvenidos a establecer contacto conmigo para hacer críticas, sugerencias y compartir ideas o pensamientos.

Pablo Cáceres Serrano

Variables independientes ¿o factores?, variables dependientes ¿o criterios?

Aunque lo diga en una entrada poco trabajada y poco ilustrada, ya lo mejoraré posteriormente, pero me pica el bicho por señalarlo, aunque sea sólo de pasada. La conceptualización de variable independiente y dependiente es propia y privativa de los diseños experimentales, sólo en este contexto tiene sentido hablar así de la variable que se supone causa y la que se supone efecto.

En contextos no experimentales muchos tesistas e investigadores siguen usando la concepción anterior de manera indistinta. Está mal. Así, derechamente lo digo. Porque en contextos no experimentales no hay manera, en la mayoría de los casos, de manipular realmente la variable causa y que es la razón de llamarla “independiente”, no es afectada por otras (supuestamente) y es manipulada directamente por el investigador. Tampoco puede asegurarse que los cambios en la variable dependiente se deban directamente a las manipulaciones de la independiente, ya que en el contexto no experimental, las fuentes de contaminación son incontables y en la mayoría de los casos incontrolables.

Por lo mismo, algunos autores prefieren hablar de factores o predictores, para el caso que ocuparía la variable independiente, y de criterio para lo que vendría ser la variable dependiente. Las razones son variadas, pero se pueden citar algunas de más relevancia que otras: a) un factor o predictor puede explicar la covariación en la variable criterio, pero no necesariamente es la causa (recuérdese que el diseño experimental es el único que permitiría asegurar que una variables es “causa” de un determinado “efecto”), eso significa que estando presente un determinado predictor entonces podemos ver cambios en el criterio. Lo que no podemos saber es si ese predictor enmascara en realidad otras posibles variables que tal vez sí son causa del criterio (un ejemplo clásico: tener los dedos amarillos puede ser predictor de mayor riesgo de cáncer al pulmón, porque el consumo de cigarrillos los deja de ese color, pero la verdadera causa es el efecto de la nicotina, etc.), b) el predictor es la variable más plausible para explicar los cambios en el criterio, pero sus efectos pueden variar en presencia de otras variables predictoras o incluso de variables mediadoras (variable que está entre el predictor y el criterio y cambia el efecto de la primera sobre la segunda) y c) en muchos estudios no experimentales, no se respeta la condición de antecedencia de la variable “predictora” midiendo todas las variables en un mismo momento del tiempo y suponiendo “teóricamente” que una está antes y la otra después, en el caso de no poder llevar a cabo un estudio en donde la línea de tiempo sea tomada en cuenta.

Hay varios autores que señalan esta diferencia al menos de manera indirecta.  Gaviria y Castro (2005) son especialmente cuidadosos en la expresión de estas denominaciones de variables. Lo mismo Creswell (2009) quien menciona que a la variable independiente se le da el nombre alternativo de tratamiento, manipulada o bien antecedente o predictor. En estos últimos dos casos, la connotación es más pasiva y no implica manipulación.

Como lección final: si trabajas en un estudio experimental, entonces hablar de VI y VD es algo legítimo, si trabajas en un estudio no experimental, entonces hay denominaciones alternativas, una de las cuales es hablar de predictor y criterio.

Bibliografía

Creswell, J. W. (2009). Research design. Qualitative, quantitative, and mixed methods approaches. Thousand Oaks, CA: Sage.

Gaviria, J. L. y Castro, M. (2005). Modelos jerárquicos lineales. Madrid: La Muralla S. A.

Tests de normalidad sobre variables dependientes.

Una de las particularidades de realizar análisis paramétricos en donde se deben cumplir supuestos, consiste en la evaluación del comportamiento aproximadamente normal de las variables dependientes. Quienes ejecuten las acciones que están usualmente asociadas a la evaluación de este supuesto lo sabrán desde hace mucho: lo raro es que la variable ajuste al supuesto de normalidad.

De casualidad me he topado con el tema en R-Bloggers y lo dicho allí me produjo cierto alivio de culpa. En particular porque en muchas ocasiones y a pesar de mis intentos por hacer cambios, he debido trabajar con variables que de acuerdo a los tests estadísticos disponibles para ello, no ajustaban a la Normal. ¡Qué terror! ¿Y si alguien, con un celo de rigor elevado, criticara el haber trabajado con variables no normales y los resultados que se deriven de ello?. Bueno, relajo estimados. No es tan terrible y al parecer en la comunidad analítica hay ahora cierto grado de aceptación que esto puede ocurrir y que además, las pruebas estadísticas para detectar desvíos de la normalidad son todo menos confiables.

Leer más Tests de normalidad sobre variables dependientes.

La construcción de memos a partir de multicodificación en el análisis cualitativo de datos

A menudo me ha llamado la atención que algunos analistas de datos cualitativos que usan el enfoque de Teoría Fundamentada (TF), aplican las lecciones y ejemplos dados por Glaser y Strauss, como si fuesen reglas a seguir de modo rígido. Esto es especialmente cierto en el proceso de codificación abierta, en donde el investigador debe desarrollar los códigos desde los datos (codificación bottom-up).

El proceso de codificación en estos casos es complejo porque requiere hacer uso de la inferencia, que siempre contiene una cuota importante de subjetividad. En particular me llama la atención el haber visto algunos análisis realizados con base en TF en que la emergencia de los códigos iba acompañado de la identificación de las propiedades del código. Para decirlo de modo sencillo, cada código iría acompañado de una serie de propiedades, que pueden ser interpretados como atributos del código y que tienen la nada despreciable función de facilitar el entretejido conceptual brindando nexos o conexiones con otros códigos. Son algo así como “tentáculos conceptuales” que permiten entretejer proposiciones hasta llegar al modelo teórico buscado.

Glaser y Strauss (1967) brindan un ejemplo particularmente ilustrativo en su libro “The Discovery of Grounded Theory”. En él, tomando como base una enorme investigación realizada en un hospital mencionan las siguientes propiedades del código: condiciones, interacciones, estrategias/tácticas y consecuencias . El problema reside, sin embargo, en que estas propiedades NO SON FIJAS, y no pueden ser tomadas como celdas que deben ser “rellenadas” por el investigador. En efecto, las propiedades dependen del código y a su vez éste depende de los datos, no es posible esperar por tanto, que siempre tendré que cumplir con dar cuenta de las mismas propiedades en cada código.

Leer más La construcción de memos a partir de multicodificación en el análisis cualitativo de datos

La función reshape en el programa R

Antes que se me olvidé, como muchas cosas que he aprendido y que al final termino dejando en el tintero. La función reshape() puede  ser hallada en el paquete del mismo nombre: “reshape”. Su uso tiene relación con la entrada inmediatamente anterior referida al Análisis de Varianza Mixto. La función es útil cuando se desea aplicar análisis a diseños de medidas repetidas.

En efecto, en cualquier análisis, la estructura usual de ingreso de los datos es como se ve a continuación:

sujetos cond1ev1p5 cond1ev2p5 cond2ev1p5 cond2ev2p5
1 19.3 18.3 20.5 20.3
2 16.8 17.0 17.8 18.0
3 21.0 18.3 22.0 21.8
4 19.5 16.0 22.3 22.0
5 19.0 18.0 20.0 19.5
6 16.8 17.8 19.5 18.8
7 20.0 19.0 24.8 24.8
8 21.3 19.0 21.3 21.8

Figura 1. Datos para medidas repetidas.

Es decir, para cada sujeto una fila y cada tratamiento o intervención en columnas, con los resultados de dicha intervención (los valores adoptados por la variable dependiente o medidas repetidas para cada sujeto en fila) en columnas.

Leer más La función reshape en el programa R

Cálculo mediante R del Análisis de Varianza Mixto en un diseño intrasujeto simple

Se suponía era simple, o eso pensaba yo, que era simple. Sin embargo, me estuve dando cabezazos por horas porque por más que leía y releía los tutoriales no daba con la fórmula correcta. Usualmente cuando hago un cálculo estadístico, si es posible hacerlo paso a paso a mano o con ayuda de Calc (o Excel) lo realizo primero de esta forma, para aprehenderlo con detalle, lo comparo con la resolución ofrecida en algún libro y luego lo hago en R. En esta ocasión, quería usar la fórmula para el análisis de varianza mixto ofrecida en Balluerka y Vergara (2002). Lo hice. Luego me fui a R y por más que intentaba configurar el análisis no resultaba. Veamos el ejemplo:

sujetos cond1ev1 cond2ev1 cond1ev2 cond2ev2
s001 19.3 20.5 18.3 20.3
s004 16.8 17.8 17.0 18.0
s005 21.0 22.0 18.3 21.8
s006 19.5 22.3 16.0 22.0
s010 19.0 20.0 18.0 19.5
s011 16.8 19.5 17.8 18.8
s012 20.0 24.8 19.0 24.8
s013 21.3 21.3 19.0 21.8
s014 19.0 19.8 19.0 21.0
s015 20.0 20.0 18.3 21.3
s017 17.5 25.8 18.5 25.3
s019 18.8 19.5 17.5 19.3
s020 15.3 21.3 15.3 20.3
s021 18.8 19.5 19.3 20.5
s022 16.3 21.8 16.0 20.8
s023 19.0 21.5 20.0 22.5
s026 16.5 18.8 18.0 16.5
s027 18.0 23.0 19.0 22.3
s028 18.8 22.0 17.0 22.3
s030 16.0 23.8 17.0 22.5
s032 19.0 20.5 20.0 20.8

Sobre esta base de 21 sujetos, se pretende determinar el efecto de dos condiciones diferenciales (sin tratamiento en la primera columna y con tratamiento en la segunda columna). Las columnas 3 y 4 son los mismos tratamientos o condiciones, pero evaluado por un juez independiente, la intención era tener una corroboración independiente del efecto del tratamiento (la concordancia entre jueces se obtuvo mediante el coeficiente de correlación intraclase).

Leer más Cálculo mediante R del Análisis de Varianza Mixto en un diseño intrasujeto simple

Una duda sobre las medidas repetidas

Me ha surgido y me gustaría que alguien tenga opinión y la haga saber. Hay dos efectos no deseados (que derechamente podemos concebir como factores de contaminación): a) los efectos de período, tal como el aprendizaje y la fatiga y b) los efectos carry-over, referidos esencialmente a la prolongación de los efectos de tratamientos previos que afectarían la evaluación de tratamientos posteriores.

La duda tiene relación con los efectos carry-over. Y es que ocurre que si pensamos un diseño de medidas repetidas para educación, en donde habitualmente el tratamiento es una nueva metodología o nuevos procedimientos de trabajo para favorecer la asimilación de cierto conocimiento o habilidad, resulta muy difícil no concebir que dicha intervención genera cambios que son, como todo aprendizaje, acumulativos, lo que genera evidentemente  efecto carry-over.

Las dos soluciones obvias son:

a) Eliminar la intervención cuyos efectos puedan perdurar más allá de la instancia correspondiente de evaluación, para que no genere efectos de confundido en las medidas relativas a las nuevas condiciones que vendrán posteriormente.

b) Usar un diseño que ayude a controlar dicho efecto, como un diseño split-plot o cuadrado latino.

No obstante, si bien las soluciones están descritas en la literatura, mi duda es: ¿son aplicables diseños de investigación que conlleven la posibilidad de estos efectos indeseados en intervenciones que impliquen un proceso educativo gradual y acumulativo?.