Extracción de información de facturas(ar) agrupada en jerarquías de negocios

No Thumbnail Available
Date
2022-12-16
Authors
Maciel, Marcos Antonio
Pons, Claudia Fabiana
Journal Title
Journal ISSN
Volume Title
Publisher
Sociedad Argentina de Informática, SADIO
Abstract
Las compañías intercambian una gran cantidad y variedad de facturas (ar) en formato digital e incluso en formato de papel. La extracción automática de información se vuelve compleja por la diversidad en las extensiones y diseños de estos documentos. El objetivo de extraer información es alimentar procesos de negocios con datos clasificados y que cumplan con parámetros de calidad. Para abordar la complejidad se propone un pipeline que integra un modelo de inteligencia artificial y un modelo de programación tradicional capaz de extraer información en jerarquía de negocios y en un segundo paso procesarla en un motor de reglas para cumplir con parámetros de calidad personalizados. En este artículo se presenta la extracción de información de facturas argentinas mediante la clasificación de entidades con el modelo de inteligencia artificial preentrenado LayoutLM, conversión del resultado en una jerarquía de negocios para reutilizarlo en un motor de reglas con capacidad de optimizar la calidad de la información y robustecer los procesos de negocios, así demostramos que el uso integrado de programación con inteligencia artificial y programación tradicional es una solución superadora al uso en forma independiente.
Description
Keywords
machine learning, layout, document image understanding, invoice, rule engine
Citation
Maciel, H.; Pons, C. (2022). Extracción de información de facturas(ar) agrupada en jerarquías de negocios. En: Memorias de las JAIIO 8(2):7-21