Tablas de Contingencia o Tabulación Cruzada (crosstabs)
A manera de repaso, recordemos brevemente la trayectoria seguida en el estudio de la Estadística bajo el enfoque Descriptivo. Primero se estudiaba una única variable y el objetivo principal era describirla; posteriormente, en el caso de dos variables o caso bidimensional, iniciábamos tabulando los datos en una tabla de doble entrada en la que cada variable se situaba en una de sus dos dimensiones y en cada casilla la frecuencia conjunta de los valores de las variables. Esta tabla se denominaba Tabla de Frecuencias de la distribución bidimensional (o tabla de correlación) y en ella se recogía la información de la distribución bidimensional (conjunta) de manera resumida. A partir de ella, se definían las distribuciones marginales y condicionadas, e inmediatamente se abordaba la cuestión de la existencia de dependencia o independencia entre las variables; pues cuando hay más de una variable, interesa saber si éstas realmente aportan información sustancialmente diferente a las otras, o si, por el contrario, existe algún tipo de dependencia de forma que algunas de ellas pudieran explicar el comportamiento de las otras.
Este tema tratará sobre las tablas de contingencia de dos atributos medidos en escalas nominales como ordinales. Y a diferencia de lo estudiado en la Estadística Descriptiva básica, en la que trabajábamos con escalas de intervalo o de razón, lo que permitía estudiar la correlación existente entre las variables y los modelos de regresión, ahora pretendemos analizar variables cualitativas medidas en escalas nominales u ordinales, estando interesados en analizar el grado de la dependencia existente entre ellas (que llamaremos asociación) y el tipo de ésta. Y para ello utilizaremos las Tablas de Contingencia, que no son sino el equivalente a las Tablas de Frecuencia Bidimensionales cuando las variables analizadas son cualitativas.
Una Tabla de Contingencia de dimensión h-k es una tabla de doble entrada en la que se representan las frecuencias conjuntas de las h modalidades del atributo A (situadas en las filas) con cada una de las k modalidades del atributo B.
De forma gráfica, puede representarse de la siguiente manera una tabla de contingencia:
Si lo anterior le ha parecido un poco tormentoso de leer, no se preocupe, a continuación realizo un ejemplo más ilustrativo de lo que son las Tablas de Contingencia.
Recuerda usted cuando realizábamos investigación en la Universidad, y al realizar el análisis hacíamos cruces de preguntas (variables) para indagar un poco más sobre algunos aspectos que nos interesaban, entonces esto es lo que puede realizarse fácilmente con el SPSS en la opción de Tablas de Contingencia.
Por ejemplo, una investigación sobre la intención de voto arroja los siguientes resultados:
Género de la población investigada:
Masculino 45%
Femenino 55%
¿Asistirá a votar?
Si 70%
No 30%
Ante estos resultados, surge la interrogante: ¿Qué porcentaje de hombres y de mujeres votarán? O ¿Qué porcentaje de hombre y mujeres se abstendrán de votar?
La tabulación cruzada nos puede ayudar a resolver éstas interrogantes, y una nueva tabla podría quedar conformada de la siguiente manera, tomando de base los resultados obtenidos:
Género / Voto | Si | No | Total |
Femenino | 33% | 22% | 55% |
Masculino | 37% | 8% | 45% |
Total | 70% | 30% | 100% |
Y a partir de la tabla anterior, ya se pueden realizar análisis más profundos y llegar a conclusiones de mayor peso que solamente con la información que teníamos en un principio. Esto gracias a la Tabulación Cruzada. Ocurre entonces, que en ocasiones tenemos una base de datos enorme, pero que no logramos encontrar la forma de obtener más información a partir de la misma, y es aquí en donde el SPSS nos puede colaborar construyendo tabulaciones cruzadas con todas las variables que deseemos, y con un uso óptimo del tiempo.