11 Clasificación


La principal aplicación de la regresión logística es la solución de problemas de clasificación binaria.


Una de las principales aplicaciones de un modelo de regresión logística es clasificar la variable cualitativa en función del valor que tomen los predictores. Para conseguir esta clasificación, es necesario establecer un threshold de probabilidad a partir de la cual se considera que la variable pertenece a uno de los niveles.

Por ejemplo, se puede asignar una observación al grupo \(1\) si \(\mathbb{P}(Y=1|X)>0.5\) y al grupo \(0\) en caso contrario. En ese caso, el threshold es 0.5:

\[ \hat{Y} = \begin{cases} 1 & \text{si } \hat{\pi}=\mathbb{P}(Y=1|X)>0.5,\\ 0 & \text{si } \hat{\pi}=\mathbb{P}(Y=1|X)<0.5 \end{cases} \]