9.3 Estimación de Parámetros
Si Y es una variable binaria, la regresión logística es tal que:
P(Y=1∣x)=eβ0+∑Kk=1βkxk1+eβ0+∑Kk=1βkxk
-
βk es el coeficientes de regresión parcial del predictor xk.
-
Indica el cambio medio del logaritmo de odds al incrementar en una unidad la variable xk, manteniendo constantes el resto de variables.
-
Por cada unidad que se incrementa xk,, los odds se multiplican por exp(βk).
Los parámetros \boldsymbol{\beta}=\{\beta_{0}, \beta_{1},\ldots, \beta_{K}\} se estiman mediante el método de Máxima Verosimilitud.
Es decir, para estimar los coeficientes de una regresión logística se utilizan algoritmos numéricos para maximizar la función:
\begin{aligned}
L(y ;(\mathbf{x}, \boldsymbol{\beta})) &=\prod_{i=1}^{n}\left(\mathbb{P}\left(Y_{i}=1 \mid \mathbf{x}_{i}, \boldsymbol{\beta}\right)\right)^{y_{i}}\left(1-\mathbb{P}\left(Y_{i}=1 \mid \mathbf{x}_{i}, \boldsymbol{\beta}\right)\right)^{1-y_{i}} \\
& \prod_{i=1}^{n}\left(\frac{e^{\beta_{0}+\sum_{k=1}^{K} \beta_{k} x_{i, k}}}{1+e^{\beta_{0}+\sum_{k=1}^{K} \beta_{k} x_{k, i}}}\right)^{y_{i}}\left(\frac{1}{1+e^{\beta_{0}+\sum_{k=1}^{K} \beta_{k} x_{i, k}}}\right)^{1-y_{i}}
\end{aligned}
\beta_0 es el valor esperado del logaritmo de odds cuando todos los predictores son cero. Puede transformarse a probabilidad con \exp(\beta_0)/(1+\exp(\beta_0)). El resultado corresponde a la probabilidad esperada de pertenecer a la clase 1 cuando todos los predictores son cero.
Los parámetros \beta_{k} indican el cambio en el \log \left ( \dfrac{\pi}{1-\pi} \right) causado por el cambio en una unidad en el valor de x_{k}, mientras que los \exp(\beta_{k}) definen el cambio en la razón de probabilidades, (\dfrac{\pi}{1-\pi}), causado por el cambio en una unidad en el valor de x_{k}.
Si \beta_{k} es positivo, \exp(\beta_{k}) será mayor que 1, es decir, \dfrac{\pi}{1-\pi} se incrementará.
Si \beta_{k} es negativo, \exp(\beta_{k}) será menor que 1, y \dfrac{\pi}{1-\pi} disminuirá.
El cambio en la probabilidad \pi causado por el cambio en una unidad en el valor de x_{k} es \beta_{k}\left(\dfrac{\pi}{1-\pi}\right), es decir, depende no sólo del coeficiente, sino también del nivel de probabilidad a partir del cual se mide el cambio.
Dado que la relación entre \mathbb{P}(Y=1) y \mathbf{x} no es lineal, los coeficientes de regresión \beta_k no representan el cambio en la probabilidad de Y asociado con el incremento en una unidad de x_k.
Cuánto se incremente la probabilidad de Y por unidad de x_k depende del valor de x_k , es decir, de la posición en la curva logística en la que se encuentre.
Esta es una diferencia muy importante respecto a la interpretación de los coeficientes de un modelo de regresión lineal.