Clasificación y Depuración de Datos de Segunda Sección del Boletín Oficial de la República Argentina mediante aprendizaje de máquina

Thumbnail Image
Date
2023-10-20
Authors
Balich, Néstor Adrián
Balich, Franco Adrian
Fraga, Hugo
Journal Title
Journal ISSN
Volume Title
Publisher
Sociedad Argentina de Informática (SADIO)
Abstract
La segunda sección del Boletín Oficial de la República Argentina en donde se publican los avisos comerciales y judiciales es un importante medio de difusión de información para empresas, instituciones y particulares, pero la gran cantidad de información almacenada desde su creación suma a la que se publica diariamente hace que la depuración de las bases de datos sea un proceso complejo y costoso. La aplicación de técnicas de machine learning (ML) en la clasificación de textos ha evolucionado significativamente, especialmente en el uso de modelos de aprendizaje profundo en áreas como la identificación de noticias falsas y la detección de spam. También se han realizado estudios sobre el uso de técnicas de ML en la identificación y corrección de errores en bases de datos, incluyendo la corrección de errores en imágenes médicas y la identificación de avisos comerciales ilegales en la web. Se propone el desarrollo de un modelo de aprendizaje de máquina para la clasificación, detección y corrección de los avisos comerciales de la segunda sección del Boletín Oficial de la República Argentina. La comparación y evaluación de diferentes modelos de IA. La creación de dos prototipos mediante metodologías agiles de desarrollo en base al diseño de dos productos mínimos viables (MPV) que permitan rápidamente a los usuarios finales testear la usabilidad, efectividad de los prototipos y definir tiempos estimados del proceso de corrección de todos los avisos de la 2da clasificados para evaluación por parte del modelo de IA.
Description
Keywords
clasificación, inteligencia artificial, aprendizaje supervisado, depuración, base de datos
Citation
Balich, N.; Balich, F.; Fraga, H. (2023). Clasificación y depuración de datos de la segunda sección del Boletín Oficial de la República Argentina mediante aprendizaje de máquina. En: Memorias de Las JAIIO, 9(2), 66-73.