Análisis de la métrica en aplicaciones de la estadística textual a la tipología de trayectorias
Campo Elias Pardo


Resumen

Cuando se realizan las técnicas de estadística textual en el análisis de trayectorias se construyen tablas se contingencia, que cruzan los itinerarios con las palabras código, que indican las etapas del conjunto de individuos. A las tablas de contingencia se les aplica los análisis de correspondencias y de clasificación, utilizando la distancia ji-cuadrado. En este trabajo se analizan y comparan las distancias ji-cuadrado y los órdenes inducidas por éstas para trayectorias residenciales hipotéticas, considerando diferentes formas de codificación. Se observan los efectos de agregar palabras para tener en cuenta la noción de censura, agregar información y eliminar palabras de baja frecuencia. Se constata la alta conveniencia de introducir la censura en forma anualizada. Se muestra que la opción de adicionar información agreagada esta justificada desde el punto de vista de la distancia ji-cuadrado. Se observa que la eliminación de palabras por un umbral de frecuencia ocasiona un desajuste en los marginales de la tabla de contingencia, que queda fuera de control en el análisis.

Palabras clave: métrica, distancia ji-cuadrado, análisis de correspondencias, clasificación, análisis de datos biográficos, análisis de datos longitudinales, análisis de datos.

PDF