Bienvenidos al sitio

El espacio está destinado a aquellos que están interesados en la metodología de la investigación social y sus aplicaciones, especialmente profesionales, estudiantes e instituciones que requieren apoyo en estas áreas. También pretende enriquecer la comunicación con alumnos, tesistas y colegas. Sean bienvenidos a establecer contacto conmigo para hacer críticas, sugerencias y compartir ideas o pensamientos.

Pablo Cáceres Serrano

¿Se pueden hacer cálculos estadísticos sobre puntuaciones estandarizadas?

La respuesta es sí, pero depende. Las puntuaciones Z o T son transformaciones lineales de las puntuaciones brutas o directas. En consecuencia no hay problemas de escala al utilizarlas. Siempre y cuando:

  • La puntuación típica provenga de una estandarización realizada en la población para las cuales se calcula el valor (tomar un valor estandarizado de una población distinta a la del sujeto que evaluó es un error severo).
  • La puntuación sea una transformación lineal que no altera la distribución original de las puntuaciones.
  • No se usen percentiles, porque son rangos, no son transformaciones lineales y por tanto no se les considera puntuaciones.
  • La puntuación estandarizada no se calcule en función de la media y desviación típica de la misma población a la que se le asignan posteriormente los valores tipificados. Si se lleva a cabo, entonces la media del grupo será siempre media 0 y desviación 1 (Z scores) y media 50 y desviación 10 (T score) o cualquier otra transformación que anulará cualuier intento de obtener valores comparables.

Un ejemplo bueno:

Aplicar el WISC a niños de un deteminado contexto, escuela, comunidad o colectivo. Sus puntuaciones directas son transformados a puntuaciones T y se puede calcular la media y desviación estándar de dichos grupos para cada escala del test. Las medias por escala entonces son comparables porque están en la misma puntuación. No se obtendrá media 50 y desviación 10 porque esas medias son obtenidas de puntuaciones que se han establecido sobre el total de la población de estandarización, en consecuencia, una media del grupo de 58 indica que el grupo está 8 puntos por encima de la media poblacional. Esto es legítimo.

Un ejemplo malo:

Aplicar una escala de actitud para comparar desempeños de dos grupos distintos en dos dimensiones diferentes de la misma escala, estandarizar sobre el mismo grupo en cada escala y comparar. No habrá diferencias, las medias y desviaciones de ambos grupos serán iguales.

Sobre tamaños de efecto

Acabo de explicar algo a un estudiante y no sé, desperté de pronto con aquello del tamaño de efecto. Concepto tan manoseado por tantos y tantos. De partida señalar que el tamaño de efecto no es un cálculo para hallar efectos en función de resultados estadísticos. Lo digo porque hoy escuché una aberración respecto a eso: “bueno, si se tienen estudios anteriores que permiten determinar un tamaño de efecto 0.21 con un Anova One Way, la muestra que debes tener para buscar ese tamaño de efecto es de 330 sujetos”.

¿Perdón? ¿Debo buscar una muestra para obtener un tamaño de efecto pequeño? Es primera que escucho tal horror. Que un investigador vaya por la vida buscando tamaños de efecto pequeños. ¡Cuando es todo lo contrario! No creo que exista un investigador de los “tamaños de efecto pequeños”. Pero veamos por qué y cómo desperté.

A partir de la salida de resultados usando el excelente programa G*Power version 3, obtuve lo siguiente:

gpower3

Como verán. La idea era obtener el tamaño de efecto a priori suponiendo que se trabajaría con tres grupos de 20 sujetos cada uno. Las diferencias de medias tienen relación con una medida de comprensión del lenguaje y los grupos han sido conformados en función de rangos de edad. Las medias y la desviación estándar informadas fueron obtenidas de un artículo de investigación que había realizado la misma investigación previamente.

Leer más Sobre tamaños de efecto

Escuela de verano en análisis de datos

Hace tiempo que no escribía aquí, mi vida la laboral es un infierno y no me deja casi tiempo para avanzar en estos temas, que tanto me apasionan, pero me agotan a la vez.

Bien valga comentar sobre una de las primeras noticas que publiqué en mi primitivo primer website allá por el 2002. La escuela de verano de la Universidad de Essex aún existe y pronto irá a inaugurar una nueva versión. Daría el alma por estar allí, pero no puedo. Dejo hecha la invitación que ellos hacen y si a alguien le sobra el tiempo, pues ya saben, no pueden perderse la oportunidad.

Escuela de verano de la Universidad de Essex

en Análisis de Datos para las Ciencias Sociales

Del 7 de julio al 15 de agosto de 2014

http://www.essex.ac.uk/summerschool/

Sobre los objetivos de investigación

No quiero olvidarlo, por eso lo anoto aquí antes que mi de débil cabeza lo pierda para siempre.

A menudo los estudiantes proponen objetivos de investigación en sus trabajos que en realidad no propenden a aspectos propios de las metas de su investigación. Suelen proponer tareas, como por ejemplo:

  • Construir una escala para medir los resultados obtenidos por los estudiantes en su capacidad de pensamiento crítico.

O bien

  • Calcular la muestra de sujetos que serán evaluados mediante la escala de pensamiento crítico.

Estas son tareas, no objetivos. Además, son tareas obvias, todos los proyectos podrían formular algo parecido y entonces cada proyecto evidenciaría objetivos que en realidad no son guías del estudio, sino recuentos de actividades.

Cuando formulen un objetivo deben tener siempre presente lo siguiente:

  1. Es una guía que describe los fines últimos que quiero lograr con mi investigación.
  2. Refiere a los propósitos últimos del estudio
  3. Si lo anterior no aclara, puede entenderse como “aquello que se pretende ocurra con la variable dependiente en un estudio”.

Usualmente los objetivos se redactan para dar cuenta de lo que se espera que ocurra con la variable dependiente. Por ejemplo:

  • Determinar el efecto de la metodología ABP sobre la capacidad de resolución creativa de problemas con base sociocientífica.

Donde, obviamente, la capacidad de resolución de problemas es la variable dependiente cuyo cambio o situación esperamos observar.

La versión gratuita de QDA Miner: QDA Miner Lite.

QDAMain1ES

No es muy común que las grandes empresas de software para análisis cualitativo presenten una versión gratuita de sus paquetes de software más destacados. QDA Miner es una excepción. Cierto es que Atlasti o Maxdqa ofrecen versiones demo desde hace mucho tiempo, pero una versión gratuita -lite- es distinto. La versión Lite tiene limitaciones, sin duda, pero es  completamente funcional en muchos otros aspectos, lo que lo habilita para hacer decentes análisis básicos e intermedios sobre material textual.

Adam Bendriss, Director de Marketing y Ventas de Provalis Research, me escribió un mensaje comentándome sobre el producto. Y dado que ya tenía información sobre la calidad del software de esta empresa, me pareció una buena idea mostrar esta nueva posibilidad.

QDA miner es un software de análisis cualitativo, pero la filosofía de la compañía consiste en combinar diferentes programas para producir análisis que representen adecuadamente la información cualitativa y cuantitativa de los datos. Es, de hecho, uno de los pocos programas con una clara orientación a los métodos mixtos, y si se combina el output de QDA Miner con programas como Wordstat  o Simstat, se pueden obtener análisis de estadística textual o análisis estadísticos clásicos, respectivamente.

Adam Bendriss no lo sabe, pero hace un par de años le pedí a César Cisneros, Académico mexicano de la Universidad Autónoma Metropolitana-Iztapalapa y experto en CAQDAS, su recomendación respecto de los mejores paquetes de software para análisis cualitativo. El me recomendó particularmente este software. Aún cuando actualmente yo promuevo esencialmente el software cualitativo de carácter gratuito, porque los científicos sociales usualmente no contamos con muchos recursos, recomiendo este programa, porque tiene méritos más que suficientes para estar en el nivel más alto de los desafíos que impone el análisis de datos en el contexto de métodos mixtos. Y hoy, métodos mixtos, es el porvenir.

¿ANCOVA O ANOVA en diseños con grupo control y pretest-postest?

Pequeña nota que conviene recordar porque es sumamente relevante y explica algo que siempre sospeché, pero que realmente no podía asegurar.

Cuando uno lleva a cabo un experimento se asume que el grupo experimental y control han sido aleatorizados, lo que implica que ambos grupos presentan variaciones debidas al azar. No obstante, cuando ambos grupos no han sido aleatorizados, los grupos no sólo difieren por variaciones al azar sino también por diferencias sistemáticas que pueden presentarse entre los grupos.

Esta situación entraña implicaciones relevantes para el tipo de análisis a aplicar. En efecto, cuando se estudia el “cambio”, desde el pretest al postest en diseños con grupo control, es común que la puntuación del postest (en ocasiones “ganancia” o “diferencia”) se regresione sobre la del pretest con el fin de controlar el efecto de éste último. El procedimiento implica un análisis de covarianza, en que se intenta eliminar la influencia de la covariable (puntuación pretest) sobre la variable efecto o respuesta (puntuación postest).

Sin embargo, el ANCOVA sólo es apropiado aplicarlo cuando en efecto los grupos han sido asignados aleatoriamente a los tratamientos. En otro caso, el uso de ANCOVA para grupos que no difieren sólo por variaciones al azar, sino también por diferencias sistemáticas, es inapropiado. Es el típico caso de diseños con grupos naturalmente conformados, como puede ocurrir con los diseños cuasiexperimentales.

Un ANOVA, en este último caso, resulta una elección más adecuada porque no implica la regresión del postest sobre el pretest y de este modo provee una estimación insesgada de la diferencia respecto del cambio entre los grupos, cuando los grupos difieren en la línea base.

Esto conlleva el importante hecho de que NO se debería llevar a cabo regresiones cuando los grupos pueden verse amenazados por la presencia de variación sistemática no controlada, y que el ANCOVA, que operacionaliza este proceder, tampoco es una elección adecuada. Y lo digo y rescato porque existe la tendencia a aplicar ANCOVA si se tiene un diseño clásico (pretest-postest con grupo control), independiente de si los grupos han sido o no aleatorizados.

Tener presente.

Referencias:

Mara, C. A., Cribbie, R. A., Flora,  D. B., Labrish, C., Mills, L. y Fiksenbaum, L. (2012). An improved model for evaluating change in randomized pretest, posttest, follow-up designs. Methodology, 8(3), 97-103.