Análisis Discriminante. Clasificación con 2 grupos

CLASIFICACIÓN CON 2 GRUPOS.

En esta situación, partimos de que la población se divide en 2 grupos o subpoblaciones, G₁ y G₂, sobre cuyos individuos se observan en general, “p” variables X = (X₁, X₂...Xy). Y supongamos que, en cada grupo G_f, (f = 1, 2), la variable absolutamente continua X = (X₁, X₂...X_y)’ se distribuye según una cierta función de densidad de probabilidad f_l(x). Además representaremos por “u” y “E” el vector de medias y la matriz de varianzas y covarianzas poblacionales y, análogamente, por u₁, u₂, E₁ y E₂ los correspondientes vectores de medias y matrices de varianzas y covarianzas de los respectivos grupos G₁ y G₂. En estas circunstancias, el Análisis Discriminante trata de establecer alguna regla que relacione características y grupos, de forma que permita la identificación (clasificación) óptima de individuos en función de sus características.

Un criterio muy importante empleado en el Análisis Discriminante, es el criterio de máxima verosimilitud, siempre induce a considerar como solución del problema planteado aquélla que explique con una máxima probabilidad lo que se observa en la realidad. Por tanto, la Regla de Máxima Verosimilitud aplicada al análisis discriminante para identificar (clasificar) un individuo de características x en alguno de los 2 grupos existentes será:

Asignar x al grupo G1 f1(x) f1(x)

Es decir, la regla de máxima verosimilitud asigna el nuevo individuo, que presenta características x, al grupo G_y en el que dichas características presentan la máxima probabilidad o densidad de probabilidad.

Para ilustrar intuitivamente el proceder de esta regla, supongamos que tenemos una única característica unidimensional clasificadora continua de forma que, en los grupos G₁ y G₂se distribuya y localice distintamente como aparece en los siguientes gráficos:

spss

Como observamos en el gráfico, un individuo de característica x presenta una densidad de probabilidad en cada distribución de cada grupo. Así, la característica x del individuo en el grupo G₂, se encuentra en una zona muy improbable, por ser mayor de lo común en este grupo. Sin embargo, la característica x del individuo se encuentra en una zona más probable en el grupo G₁, ya que se encuentra más cercana a la moda. Así pues, la regla de máxima verosimilitud nos inducirá a asignar los individuos que presentasen la característica x al grupo G₁, para el que la densidad de probabilidad en dicho valor de la característica, x, es más alta.