10.1 Pseudo R2
A diferencia de los modelos de regresión lineal, en los modelos logísticos no se utiliza ni existe un equivalente a R2 que determine exactamente la varianza explicada por el modelo.
Se han desarrollado diferentes métodos conocidos como pseudo−R2 que intentan aproximarse al concepto de coeficiente de determinación. Su rango oscila entre 0 y 1, pero de ninguna manera se pueden interpretar igual a R2.
Uno de los pseudo−R2 más conocidos fue propuesto por McFadden’s:
R2McFadden=1−log(L(M1))log(L(M0)),
donde L el valor de likelihood de cada modelo. La idea es que, log(L), tiene un significado análogo a la suma de cuadrados de la regresión lineal. De ahí que se le denomine pseudo−R2.
R2McFaddentiene valor 0 si el modelo ajustado no mejora al modelo nulo, y valor de 1 si se ajusta perfectamente a los datos.
- En el ejemplo de Venta de Vehículos:
McFadden R2=0.142147,
Hay otros pseudo-R2: