Regresión lineal : aplicación de la regresión lineal en un problema de pobreza

No Thumbnail Available
Date
2022-7-14
Authors
Ageitos, Camila Jazmín
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
El objetivo de esta tesis es realizar una lectura de los núcleos teóricos del artículo “Aplicación de la regresión lineal en un problema de pobreza”, el cual realiza un modelo de regresión lineal de una situación particular en el campo de la economía, la pobreza, con datos de los años 2010 y 2011 de las 13 principales ciudades de Colombia obtenidos del Departamento Administrativo Nacional de Estadística (DANE), profundizando en el estudio de residuos y observaciones influyentes, para luego replicar dicho análisis con datos de Argentina obtenidos de la encuesta EPH del Instituto Nacional de Estadísticas y Censos (INDEC) y realizar una conclusión con los valores obtenidos. Habiendo analizado y comprendido el contenido del paper mencionado y replicando el análisis para los datos de pobreza en las personas de 31 aglomerados urbanos principales de Argentina obtenidos de la encuesta permanente de hogares del INDEC, se demostró que existe una relación lineal significativa entre los datos del segundo semestre del año 2018 y los del segundo semestre del año 2019. Comenzó el análisis con un diagrama de dispersión donde se detectó una relación directa entre las variables y, además, se observó que los puntos parecen aproximarse a una línea recta. En consecuencia, se eligió el modelo de regresión lineal simple para representar la relación entre las variables. La ecuación estimada de la regresión obtenida fue ??= 8,9031 + 0,8342??, la pendiente de la recta es positiva, lo que implica que en los aglomerados donde se observó mayor pobreza en el segundo semestre del 2018, también se observó mayor pobreza en el segundo semestre del 2019. Pero como la pendiente es un número entre cero y uno, significa que el incremento en el porcentaje de pobreza en el segundo semestre del 2019 entre un aglomerado y otro es menor que en el segundo semestre del 2018. En el análisis se reveló que la ecuación de regresión explica en un 66,51% los valores observados de la pobreza en segundo semestre del 2019 según los valores de pobreza en el segundo semestre del 2018. Se demostró además con un coeficiente de correlación de 0,8155 que la relación directa de dependencia lineal es fuerte. Esta relación se pudo confirmar con las pruebas de significancia t y F. En el análisis de residuales, se concluyó en primer lugar que la varianza de ?? no es constante. En la gráfica de residuales estandarizados, se observó que aproximadamente el 96,8% de los datos está dentro del intervalo y no habría razón suficiente para dudar de que el término de error tenga distribución normal. Y, por último, en la gráfica de distribución normal los puntos parecen ajustarse a una línea recta, lo cual indica que los datos provienen de una distribución normal. En el análisis de outliers se encontró que un 77,4% de los ???? está dentro del rango (-1,1) y un 96,8% dentro de (-2,2), quedando un solo residual estandarizado con valor -3,2318, pero, al no haber error en la medición, el dato debe conservarse. Continuando con el análisis, se realizó la prueba de observaciones influyentes descartando ciertos valores en el análisis de regresión de la pobreza en Argentina, y en ninguno de los casos cambió la ecuación de regresión, ni el coeficiente de regresión, por lo cual se concluyó que no se detectan observaciones influyentes. Como se pudo validar que la relación es estadísticamente significativa entre las variables, y que el ajuste que proporciona la ecuación es bueno, la ecuación puede usarse para estimaciones y predicciones. Por este motivo se calcularon los intervalos de confianza del valor medio de ??, y el intervalo de predicción y se comprobó su validez con algunas observaciones. Así como también se calcularon los intervalos de confianza para los coeficientes de la ecuación de regresión
Description
Keywords
pobreza, regresión lineal, estadística
Citation