Validación de la calidad en datos abiertos con respecto a la detección de errores ortográficos utilizando la métrica del factor Syntactic Correctness

Thumbnail Image
Date
2021-3
Authors
Martínez, María Roxana
Parkinson, Christian Aníbal
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Tecnológica Nacional. Facultad Regional San Francisco
Abstract
En este trabajo se muestran distintos principios de calidad de los datos abiertos propuestos por organizaciones reconocidas a nivel internacional en la temática de gobierno abierto. Se verifica la calidad del dato a través de la métrica para la detección de errores ortográficos, utilizando el concepto del factor Syntactic Correctness. Por lo que, se presenta una sección con los trabajos relacionados orientados a la calidad de los portales de datos abiertos, y de las diversas herramientas de detección de errores ortográficos existentes. El objetivo y aporte de esta investigación fue incorporar y adaptar la herramienta más apropiada (según análisis comparativo realizado y verificado en este mismo estudio) con la inclusión de nuevas características y funciones de detección, en un desarrollo propio de software, el cual realiza un control de la calidad de los datos abiertos desde el aspecto de la detección de errores ortográficos en los datos de cada uno de los campos del tipo cadena de texto que conforman al Dataset analizado. Se tuvo en cuenta distintos criterios de análisis, que llevó al diseño de algoritmos en el prototipo para una mejor detección de falencias, como así de cantidad de ocurrencias por error. Además, se detectan los campos completos, es decir se analiza campo por campo (lo que conforma un registro), con el fin de verificar que todos fueron cargados, en caso contrario, se contabiliza como campo faltante. Este resultado, permite que un usuario utilice la herramienta de validación, y logre una mejor concientización de los aspectos que implican la calidad en los datos abiertos.
Description
Keywords
calidad de datos abiertos, herramienta de validación, ortografía en datos abiertos, gobierno abierto
Citation
Martínez, R-; Parkinson, C. (2020). Validación de la calidad en datos abiertos con respecto a la detección de errores ortográficos utilizando la métrica del factor Syntactic Correctness. En: Congreso Nacional de Ingeniería Informática y Sistemas de Información, CoNaIISI. 8. 5-6 nov 2020, Córdoba, Argentina. Memoria de trabajos. p.:236-247