Investigación y desarrollo de software para la validación de la calidad de datos abiertos e identificación de patrones para predicciones
Permanent URI for this collection
Browse
Browsing Investigación y desarrollo de software para la validación de la calidad de datos abiertos e identificación de patrones para predicciones by Subject "Gobierno Abierto"
Results Per Page
Sort Options
-
ItemPropuesta de técnicas de validación para la calidad de datos abiertos e identificación de patrones para predicciones con Machine Learning: Segunda Parte(UNNOBA, 2023-4) Martínez, María Roxana ; Vilaboa, Pablo Alfredo ; Simon, Miguel Agustín ; Garcia Iannini, Juan Manuel ; Clavijo, Eugenio ; Colato, German Dario ; Catala, Nelson ; Bateca Caicedo, Carlos Alberto ; Lopumo, Serenela ; Zabala, Hernán Guillermo ; Parada, Gonzalo ; Chaglasian Sganga, Ayelén Malena ; Vargas Navarro, Rocio Del Carmen ; Tsiros, Sebastian Martin DemetrioDentro de los varios focos del paradigma de Gobierno Abierto, existen los conjuntos de datos abiertos públicos disponibilizados en los sitios web gubernamentales, éstos permiten no sólo una mejor transparencia en las actividades públicas que se realizan, sino que, además, pueden ser reutilizados a través de estudios para brindar mejores servicios y obtener beneficios para la sociedad. Mantener estos datos con calidad, permite que se lleven a cabo, análisis de escenarios para predecir y evitar posibles falencias o errores en la toma de decisiones políticas que tenga un alto impacto en los ciudadanos. Actualmente, no existen demasiados trabajos de investigación que se centren en el contenido de los datasets, en aspectos de: análisis de contenido interno, validación, herramientas de verificación, cotejo en las estructuras de datos, guías de buenas prácticas, o bien reconocimiento de patrones estructurales, entre otros temas. Es por esto, por lo que, este trabajo de investigación se centra en dichos puntos mencionados para validar la calidad de los datos públicos abiertos y que éstos puedan ser utilizados con un fin positivo en la comunidad. Este trabajo, no solo trabaja en prototipos de software en validaciones de datos específicos, sino que, además, permite estudiar modelos predictivos, que a través del aprendizaje automático pueden brindar un mejor análisis para la toma de decisiones.
-
ItemPrototipo OpenMapGeoData para validación de datos geolocalizados abiertos en Argentina(Sociedad Argentina de Informática (SADIO), 2023-11-13) Martínez, María Roxana ; Simon, Miguel Agustín ; Vilaboa, Pablo AlfredoLos datos geolocalizados abiertos que se encuentran disponibles en portales gubernamentales de la Argentina tienen un rol importante, ya que pueden ser utilizados para ser analizados y así obtener un valor agregado para los ciudadanos sobre los resultados arrojados. Existen organismos públicos que ponen a disposición información geográfica en distintos formatos abiertos (GeoJSON, SHP, KMZ/KML, WKT, TopoJSON entre otros) y en diversas plataformas a través de infraestructuras de datos espaciales (IDEs). Este trabajo propone un prototipo de desarrollo propio (OpenMapGeoData) para analizar el contenido de datasets geoespaciales en formato GeoJson, teniendo en cuenta aspectos en concepto de calidad del contenido ofrecido en los portales públicos de este tipo de datos. La herramienta ofrece validar un dataset geolocalizado, y mostrar un “estado de salud” del contenido y, además, visualizar un mapa con cada uno de los puntos utilizados en el dataset. Algunos criterios de validación son: numeración decimal para coordenadas de latitud y longitud, ubicación geográfica a través de la dimensión geometry (punto geolocalizado), datos incompletos, formato del dato geolocalizado, condiciones estructurales de la cantidad de dígitos referenciados, entre otros. Finalmente, se analizan los resultados obtenidos al utilizar el prototipo para una validación de 40 datasets extraídos de portales públicos.
-
ItemTesis Doctoral: Métricas de calidad para validar los conjuntos de datos abiertos públicos gubernamentales(UNNOBA, 2023-4) Martínez, María RoxanaEn estos tiempos, los datos son un recurso indispensable para cualquier actividad de gestión pública, por lo que es necesario mantenerlos actualizados, claros y completos. Este trabajo se enfoca en el contexto de Gobierno Abierto en aspectos del tratamiento del dato público abierto que disponibilizan las entidades estatales. Con el fin de identificar mejoras en los aspectos de calidad de los datasets abiertos, esta tesis plantea métricas críticas y no críticas para su análisis y validación de contenido, por lo que, como parte de la propuesta, se presenta un prototipo de desarrollo propio, llamado HEVDA (HErramienta de Validación de Datos Abiertos). A modo de caso de estudio, se extrae una muestra de datasets públicos estatales que son validados con HEVDA, para obtener un análisis sobre las mediciones utilizadas y realizar así, un estudio cuantitativo sobre los resultados arrojados. Esta herramienta de validación permite detectar en forma sencilla, las falencias y errores en las fuentes de datos abiertas que podrían complicar la interoperabilidad para su utilización en diversos orígenes de bases de datos y softwares externos de otros organismos. Para evaluar la calidad de datos es necesario tener en cuenta determinadas características en el conjunto de datos analizados, por lo que se realiza un relevamiento detallado de los aspectos más notables en cuestiones de calidad de datos sobre criterios estándares de norma ISO/IEC 25012 [1], estándares universales de calidad de datos [2], dimensiones de la calidad de los datos [3], trabajos relevados y estudios realizados [4] en esta temática. En el estudio desarrollado, se puede analizar sí es factible definir métricas de calidad de datos públicos gubernamentales en un formato abierto para efectuar un análisis cuantitativo a través de una herramienta amigable y sencilla.