Bienvenidos al sitio

El espacio está destinado a aquellos que están interesados en la metodología de la investigación social y sus aplicaciones, especialmente profesionales, estudiantes e instituciones que requieren apoyo en estas áreas. También pretende enriquecer la comunicación con alumnos, tesistas y colegas. Sean bienvenidos a establecer contacto conmigo para hacer críticas, sugerencias y compartir ideas o pensamientos.

Pablo Cáceres Serrano

Actividades de la European Association of Methodology

Las actividades para la primera parte del 2011 son:

  • La conferencia 2011 “American Sociological Association Spring Methodology Conference”, que se realizará en mayo desde el  18 al 20, organizada en Europa por el Departamento de Metodología y Estadística de la Universidad de Tilburg, Holanda. Para mayor información visite http://www.tilburguniversity.edu/asa.
  • La cuarta conferencia “Conference of the European Survey Research Association (ESRA)”  que se llevará a cabo en Lausanne, Suiza, del 18 al 22 de julio, 2011. Más información en http://surveymethodology.eu/conferences/.

Hace ya varios años que pertenezco a la EAM. Fui de hecho, el primer chileno, y si mal no me equivoco, el primer latinoamericano en pertenecer a dicha organización. Creo que el principal beneficio que he obtenido de la misma es el prestigio de pertenecer a una institución metodológica como pocas en el mundo, aún cuando hay muchas asociaciones muy específicas sobre aspectos metodológicos o analíticos en particular. El segundo beneficio ha sido la revista Methodology, de excelente calidad y que desgraciadamente por formación y ocupación, siempre veo como algo difícil de introducir en nuestro medio, no obstante lo valioso y esencial de su contribución.

Leer más Actividades de la European Association of Methodology

Sobre el problema de row.names en matrices

Hace un tiempo hablé de este tema en un post anterior. El problema era que cuando uno convierte un data.frame a matriz, con “as.matrix()” o hace un “cbind()” para pegar columnas, entonces automáticamente se agrega una columna nueva con la numeración de los casos u observaciones. Esta numeración no cambia, a cada fila a la que se ha asignado un valor, quedará con dicho valor como un identificador permanente.

Entonces, el problema era que muchos procedimientos, por ejemplo, los análisis de clasificación, usan un identificador para mostrar la posición de los casos en mapas perceptuales. Este valor ¿es el correspondiente a row.names?

La respuesta es SÍ: efectivamente, los procedimientos analíticos que requieren identificar los casos visualmente, como los mapas del análisis de correspondencias múltiples, exhiben como identificador el valor de row.names. Por esta razón -y aquí va la advertencia- cuando se deseen remover determinados casos hay que buscar al sujeto mostrado en row.names y borrarlo, NO HAY QUE GUIARSE POR LA COLUMNA DE NUMERACIÓN REAL, esa columna es como la primera columna numerada de Excel y si -siguiendo el identificador de row.names- se borran casos, los números de esa columna se renumeran y se pierde el orden original.

En consecuencia, se identifica un valor o caso por su valor en la columna adicionada row.names. Supongamos el 314 de una base de 600 casos. Vamos a la base para eliminar el caso con id: 314, lo buscamos en row.names y luego lo borramos. Si he borrado previamente datos, el caso 314 conservará su id en la columna row.names, pero se renumerará en la columna de numeración inicial. Entonces podría ser posible que el caso 314 se encuentre en la fila real 307.

El peligro consiste en ir a la fila de valores de posición real y borrar la fila 314 creyendo que es el caso identificado por el análisis, craso error porque podría corresponder a otro id de row.names. ¿Se entiende? Eso espero.

Tiempo… mi enemigo.

No sé cuánta verguenza acumulo actualmente por no haber sido capaz de actualizar mi espacio web en casi dos meses. No he sido capaz, lo juro. Todos mis días y todo mi día están absolutamente tapados de trabajo. Tengo algunos trabajos que no he podido entregar y que me significan un gran monto de dinero y aún así no tengo tiempo para terminarlos. No es flojera, es simplemente que no doy más. Y como infortunadamente el hilo se corta por lo más delgado, este blog ha sufrido las consecuencias de mi incapacidad para planificarme mejor. Es decir, aún cuando me planifico, simplemente no puedo cumplir mis propios plazos. A veces llega a ser desesperante.

Este año que viene trabajaré menos, necesito hacerlo así, porque sencillamente no podría enfrentar otro año así. Mi mente casi no recuerda nada, ayer vi una persona con la que he trabajado por meses y aunque la saludé y reconocí su rostro claramente, no sabía quien era, estuve casi media hora tratando de recordar quién era. Mal, muy mal.

Este 2011 tiene que ser diferente. Trabajé en muchos proyectos este año, pero de todos ellos, sólo uno me hizo sentir orgulloso, sólo en uno pude dedicarme en cuerpo y alma. El resto de mis intervenciones me averguenzan: no aprendí nada nuevo, sólo intenté malamente cumplir plazos y no hubo tiempo de reflexionar sobre las experiencias. Todo mecánico, que es la forma de trabajar que, digámoslo, tiene un buen número de profesionales. A mi eso me averguenza, yo no trabajo así, a mi el tiempo me incomoda, sé que es necesario tomarlo en cuenta, pero para mi es más valioso hacer las cosas bien, aunque tome tiempo.

Este 2011 retomaré mis escritos aquí, hay tantas cosas que quiero comentar y que estoy seguro a los analistas de datos les puede interesar. Un poco de paciencia, sí otra vez, pronto estaré en batalla nuevamente.

Feliz Año a todo el mundo.

Software para métodos mixtos

En realidad no existen programas específicos. No obstante, con R -como siempre- se pueden hacer muchas cosas. En particular si se utiliza el paquete tm (Text Mining) que facilita la cuantificación de textos. De hecho, se me ocurre que es el único paquete accesible de los pocos programas que hay dedicados a estadística textual. Por cierto, hay muchos procedimientos que no lleva cabo, como Análisis de Correspondencias Múltiples, Análisis Canónico de Correspondencias, Análisis de Conglomerados, etc. Pero eso no importa, porque hace lo más importante: construye las matrices textos*palabras o respuestas*palabras, que son la base para realizar estos análisis. Con esa funcionalidad para mi ya es suficiente.

El problema sin embargo, es que si bien la estadística textual parece estar a medio camino entre lo cuantitativo y lo cualitativo, lo cierto es que sigue siendo un análisis muy cuanti. Los métodos mixtos en verdad tratan con datos auténticamente cuanti y auténticamente cuali, la convergencia no la hace un programa de análisis, la convergencia es construida por el investigador.

Desde esta perspectiva, R y el paquete tm ofrecen una aproximación, pero no la única, para desarrollar este tipo de análisis.

Otra aproximación proviene de lo cualitativo. Necesitaba un paquete de análisis que supliera las mismas capacidades que toda la vida se han necesitado en investigación cualitativa, lo que significa que sea un programa que soporte la estructura de trabajo del análisis de contenido cualitativo o bien de Teoría Fundamentada.

Leer más Software para métodos mixtos

Buffet de profesores o Videolectures.net

Eso. ¿Por qué tuve que recibir la instrucción que pude recibir y no existió en la  universidad dónde estudié, la posibilidad de elegir además profesores de otras disciplinas, como ocurre en algunas universidad privadas? digo, para al menos compensar todo lo que NO se me enseñó. Al fin y al cabo casi todo lo que sé de Metodología (aparte de mi formación básica en mis inicios como ayudante) o lo aprendí en España o bien lo aprendí solo.

Es dramático darse cuenta que en Chile la enseñanza de la psicología matemática (en el sentido amplio del término) virtualmente no existe y la formación científica rigurosa es cosa de muy pocos. Es terrible darse cuenta que nuestros cursos de psicometría, de metodología, de estadística, están atrasados al menos 20 años (en psicometría 30 años por lo menos) comparados con los estadounidenses y europeos. Simplemente terrible, porque como profesor también estoy atrapado entre aguas.

Leer más Buffet de profesores o Videolectures.net

Construyendo nuevos objetos en R: cbind o objeto[condición]

La verdad es una nota ñoña sólo para mi, aunque apelo a cualquiera que sepa algo de esto a que comente el tema en particular.

En el entorno de programa R  (www.r-project.org), cuando se desea crear un nuevo objeto con base en un data.frame, por ejemplo, para dejar sólo columnas de variables cuantitativas, puedo usar dos procedimientos: cbind (ligar columnas) o bien segregar las columnas a través de la selección de un rango de columnas. En código, esto sería:

Leer más Construyendo nuevos objetos en R: cbind o objeto[condición]