Modelo de regresión lineal (MRLG) y estimacion mínimos cuadrados ordinarios (MCO)

Estamos viendo el modelo de regresión lineal general (MRLG) y hemos descrito el proceso de estimación de sus coeficientes B, mediante Mínimos Cuadrados Ordinarios (MCO).

Ya hemos visto el modelo de regresión general y analizado los coeficientes del model, los cuales tienen un papel primordial en el MRLG.

En el modelo de regresión lineal se requieren unos supuestos básicos para poder llevar a cabo un análisi correcto. Estos supuestos son:

S1: Supuesto de linealidad;: Nos referimos a la linealidad con respecto a los coeficientes B0, B1, B2…Bk, y no con respecto a las variables.

S2: La muestra tomada debe ser una muestra aleatoria qeu sigue el modelo de regresión lineal.

S3: No existe multicolinealidad. No existen relaciones lineales exactas entre las variables regresoras. Tampoco puede ocurrir que alguna de las variables regresoras sea constante. Es decir, X es de rango completo.

S4: Independencia y normalidad de los errores.

S5: Homocedasticidad y ausencia de correlación serial: La varianza del error es constante para todos los variables de la muestra.

Para verificar los supuestos de la Regresión Lineal Simple (MRL), existen varias pruebas y métodos gráficos que permiten evaluar cada supuesto:

Para verificar los supuestos de la Regresión Lineal Simple (MRL), existen varias pruebas y métodos gráficos que permiten evaluar cada supuesto. Aquí te detallo las más comunes:

1. Prueba de Linealidad

Gráfico de Dispersión (Scatter Plot):
- Traza un gráfico de dispersión entre la variable dependiente ( Y ) y la independiente ( X ). Si los puntos se distribuyen en torno a una línea recta, esto sugiere que el supuesto de linealidad es razonable.

Gráfico de Residuos vs. Valores Ajustados:

Tras ajustar el modelo de regresión, realiza un gráfico de los residuos frente a los valores ajustados. Si los residuos se distribuyen aleatoriamente alrededor de cero sin ningún patrón, el supuesto de linealidad se cumple.

Prueba de Adición de Potencias:
- Otra opción es usar términos polinomiales (como ( X^2 )) para verificar si hay una mejora significativa en el ajuste del modelo. Si la adición de términos no lineales mejora significativamente el modelo, puede que la relación no sea lineal.

2. Prueba de Independencia de los Errores

Durbin-Watson Test:
- Esta prueba es especialmente útil para datos de series temporales. Evalúa la autocorrelación de primer orden entre los residuos. Un valor cercano a 2 indica que no hay autocorrelación, mientras que valores cercanos a 0 o 4 indican una fuerte autocorrelación (positivo o negativo, respectivamente).
Gráfico de Residuos:
- Aunque es menos formal, observar un gráfico de los residuos en el orden en que fueron obtenidos también puede dar una indicación de autocorrelación si existe un patrón visible.

3. Prueba de Homocedasticidad (Varianza Constante)

Gráfico de Residuos vs. Valores Ajustados:
- En este gráfico, observa si los residuos se dispersan de manera constante a lo largo de los valores ajustados. Si ves un patrón de abanico (es decir, la dispersión de los residuos aumenta o disminuye), indica heterocedasticidad.
Prueba de Breusch-Pagan:
- Evalúa la dependencia de la varianza de los residuos en función de las variables independientes. Un valor de p bajo indica heterocedasticidad.
Prueba de White:
- Similar a Breusch-Pagan, esta prueba verifica si la varianza de los residuos depende de las variables independientes, aunque es más flexible al no asumir ninguna forma específica de relación.

4. Prueba de Normalidad de los Errores

<a href=»http://<script src=»https://gist.github.com/Eltallerdedatos/e98cbe96cc43e8af30a4aa70aa63bf93.js»>SUPUESTOS MODELO DE REGRESION LINEAL GENERAL

Histograma y Q-Q Plot (Gráfico Cuantil-Cuantil):
- Realizar un histograma de los residuos te permite ver si siguen aproximadamente una distribución normal. El Q-Q plot compara los cuantiles de los residuos con los de una distribución normal teórica. Si los puntos caen aproximadamente sobre la línea diagonal, los residuos siguen una distribución normal.
Prueba de Shapiro-Wilk:
- Esta prueba estadística verifica si los residuos siguen una distribución normal. Un valor de p alto (mayor a 0.05 generalmente) sugiere que no hay suficiente evidencia para rechazar la normalidad.
Prueba de Kolmogorov-Smirnov o Anderson-Darling:
- También evalúan la normalidad de los residuos, con la diferencia de que Anderson-Darling es más sensible a la cola de la distribución.