Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal

Las entidades fiscalizadoras superiores, y en específico su ente rector, la Organización Internacional de las Entidades Fiscalizadoras Superiores (INTOSAI), han impulsado en los últimos cuatro años iniciativas encaminadas al uso de tecnologías y métodos para sus procesos de vigilancia y fiscalización que sean replicables y que generen resultados tangibles en el contexto fiscal. En este sentido, la Contraloría General de la República de Colombia viene fortaleciendo su infraestructura tecnológica y capacidades técnicas con mirar a mejorar y optimizar sus esfuerzos en cuanto a la vigilancia de los recursos de los colombianos. Aunque dicha tarea no es sencilla, esta entidad ha logrado detectar patrones de aquellos contratistas que acaparan la c... Ver más

Guardado en:

2256-1498

11

2021-02-16

48

64

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.

info:eu-repo/semantics/openAccess

http://purl.org/coar/access_right/c_abf2

Revista Mutis - 2021

id 617b0a2335745414215857b2bc5a19b3
record_format ojs
spelling Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal
Othman, R., Aris, N. A., Mardziyah, A., Zainan, N., & Amin, N. M. (2015). Fraud detection and prevention methods in the Malaysian public sector: Accountants’ and internal auditors’ perceptions. Procedia Economics and Finance, 28(April), 59-67. https://doi.org/10.1016/s2212-5671(15)01082-5
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Al-Amini, H. S. (2020). The future of public sector auditing: Living in times of change. International Journal of Government Auditing, 47(1), 4-5. http://intosaijournal.org/wp-content/uploads/2020/02/INTOSAI-Journal_Winter-2020.pdf
Álvarez-Jareño, J. A., Badal-Valero, E., & Pavía, J. M. (2018). Aplicación de métodos estadísticos, económicos y de aprendizaje automático para la detección de la corrupción. Revista Internacional de Transparencia e Integridad, 9, 1-11. https://dialnet.unirioja.es/servlet/articulo?codigo=6977094
Bologa, A. R., Bologa, R., & Flores, A. (2010). Big data and specific analysis methods for insurance fraud detection. Database Systems Journal, 1(1), 30-39. Contraloría General de la República de Colombia [CGR]. (2018). Plan Estratégico CGR 2018-2022. CGR.
Córdoba-Larrarte, C. F. (2019). Océano: monitoreo eficiente en la contratación pública. Economía Colombiana, 356, 4-5. https://www.economiacolombiana.co/revista/oceano-393
García, J., Molina, J. M., Berlanga, A., Patricio, M. A., Bustamante, A. L., & Padilla, W. R. (2018). Ciencia de datos. Técnicas analíticas y aprendizaje estadístico. Alfaomega.
Giraldo-Polanía, L. A, Parra-Ortiz, J. W., Cotrino-García, Y., Dulce-Vanegas, M. F., & Tafur-Díaz, J. (2018). Big data. Análisis de caso en la Contraloría de Bogotá con la entrega de bonos. Contraloría de Bogotá. https://www.olacefs.com/wp-content/uploads/2018/10/1%c2%b0-Premio-Bogot%c3%a1-Colombia.pdf
Hsu, B. M. (2020). Comparison of supervised classification models on textual data. Mathematics, 8(5). https://doi.org/10.3390/MATH8050851
Li, S. (2018). Multi-class text classification with scikit-learn. https://towardsdatascience.com/multi-class-text-classification-with-scikit-learn-12f1e60e0a9f
Mohamed, A. (2005). Survey on multiclass classification methods. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.175.107&rep=rep1&type=pdf
Organización Internacional de Entidades Fiscalizadoras Superiores [INTOSAI] (s.f.) About us. https://www.intosai.org/about-us
Pedregosa, F., Varoquaux, G., Gramfor, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Pettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M., & Duchesnay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12, 2825-2830.
Español
Rennie, J. D. M., & Rifkin, R. (2001). Improving multiclass text classification with the support vector machine. Massachusetts Institute of Technology.
Song, Y. Y., & Lu, Y. (2015). Decision tree methods: Applications for classification and prediction. Shanghai Archives of Psychiatry, 27(2), 130-135. https://doi.org/10.11919/j.issn.1002-0829.2
Wirth, R., & Hipp, J. (2000). CRISP-DM: Towards a standard process model for data mining. Proceedings of the Fourth International Conference on the Practical Application of Knowledge Discovery and Data Mining. http://citeseerx.ist.psu.edu/viewdoc/summary? https://doi.org/10.1.1.198.5133
info:eu-repo/semantics/article
http://purl.org/coar/resource_type/c_6501
http://purl.org/redcol/resource_type/ARTREF
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/version/c_970fb48d4fbd8a85
info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
Text
Revista Mutis - 2021
https://creativecommons.org/licenses/by-nc-sa/4.0
Publication
Artículo de revista
Las entidades fiscalizadoras superiores, y en específico su ente rector, la Organización Internacional de las Entidades Fiscalizadoras Superiores (INTOSAI), han impulsado en los últimos cuatro años iniciativas encaminadas al uso de tecnologías y métodos para sus procesos de vigilancia y fiscalización que sean replicables y que generen resultados tangibles en el contexto fiscal. En este sentido, la Contraloría General de la República de Colombia viene fortaleciendo su infraestructura tecnológica y capacidades técnicas con mirar a mejorar y optimizar sus esfuerzos en cuanto a la vigilancia de los recursos de los colombianos. Aunque dicha tarea no es sencilla, esta entidad ha logrado detectar patrones de aquellos contratistas que acaparan la contratación estatal, logrando estar en diferentes sectores económicos sin tener probablemente la competencia técnica para cumplir el objeto contractual estipulado. A estos se les conoce en el ámbito de la Contraloría General como contratistas “multiobjeto”. En el presente artículo se muestra la construcción de un conjunto de datos de 1.998 registros etiquetado por expertos, que corresponden a contratos del sector educativo en Colombia. Con este instrumento se llevó a cabo el entrenamiento y las pruebas sobre un clasificador automático construido para los objetos contractuales a fin de detectar presuntos contratistas “multiobjeto”. Adicionalmente, se encontró que el mejor algoritmo de clasificación fue “Máquina de Soporte Vectorial Lineal”, con una exactitud de 84 %, el cual permitió finalmente listar por agrupamiento los presuntos contratistas de este tipo.
Dulce Vanegas, Manuel Francisco
Beltrán Gómez, Adam
minería de texto
aprendizaje de máquina
contratación estatal
control fiscal
11
1
text/xml
application/pdf
https://revistas.utadeo.edu.co/index.php/mutis/article/view/1732
Universidad de Bogotá Jorge Tadeo Lozano
Revista Mutis
Detection of Multi-object Contractors through Text Mining to Targeting the Exercise of Fiscal Control and Surveillance
Journal article
Supreme audit institutions, and specifically its governing body, the International Organization of Supreme Audit Institutions (INTOSAI), have promoted during the last four years a series of initiatives in the fiscal context aimed at the use of technologies and methods that are replicable and generate tangible results, thus reinforcing the surveillance and auditing processes carried out by supreme audit institutions. In this sense, the Comptroller General of the Republic of Colombia has been strengthening its technological infrastructure and technical capacities in order to improve and optimize its efforts in the monitoring of the resources of Colombian citizens. Although this task is not an easy one, this entity has managed to detect patterns of contractors who monopolize state contracting and are inserted into different economic sectors, without probably having the technical competence to fulfill stipulated contractual deeds. These subjects are known in the field of the General Comptroller’s office as “multi-object” contractors. This article explains the construction of a data set of 1,998 records labeled by experts that correspond to education sector contracts. Training and tests were carried out with this tool on an automatic classifier built for the contractual objects in order to detect suspected “multi-object” contractors. It was found that the best classification algorithm was the “Linear Vector Support Machine,” with an accuracy of 84%, which will eventually find presumed multi-object contractors by grouping.
fiscal control and surveillance
state’s procurement
machine learning
Text mining
2021-02-16
48
2256-1498
https://revistas.utadeo.edu.co/index.php/mutis/article/download/1732/1740
64
https://revistas.utadeo.edu.co/index.php/mutis/article/download/1732/1977
2021-02-16T00:00:00Z
10.21789/22561498.1732
2021-02-16T00:00:00Z
https://doi.org/10.21789/22561498.1732
institution UNIVERSIDAD JORGE TADEO LOZANO
thumbnail https://nuevo.metarevistas.org/UNIVERSIDADJORGETADEOLOZANO/logo.png
country_str Colombia
collection Revista Mutis
title Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal
spellingShingle Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal
Dulce Vanegas, Manuel Francisco
Beltrán Gómez, Adam
minería de texto
aprendizaje de máquina
contratación estatal
control fiscal
fiscal control and surveillance
state’s procurement
machine learning
Text mining
title_short Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal
title_full Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal
title_fullStr Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal
title_full_unstemmed Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal
title_sort detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal
title_eng Detection of Multi-object Contractors through Text Mining to Targeting the Exercise of Fiscal Control and Surveillance
description Las entidades fiscalizadoras superiores, y en específico su ente rector, la Organización Internacional de las Entidades Fiscalizadoras Superiores (INTOSAI), han impulsado en los últimos cuatro años iniciativas encaminadas al uso de tecnologías y métodos para sus procesos de vigilancia y fiscalización que sean replicables y que generen resultados tangibles en el contexto fiscal. En este sentido, la Contraloría General de la República de Colombia viene fortaleciendo su infraestructura tecnológica y capacidades técnicas con mirar a mejorar y optimizar sus esfuerzos en cuanto a la vigilancia de los recursos de los colombianos. Aunque dicha tarea no es sencilla, esta entidad ha logrado detectar patrones de aquellos contratistas que acaparan la contratación estatal, logrando estar en diferentes sectores económicos sin tener probablemente la competencia técnica para cumplir el objeto contractual estipulado. A estos se les conoce en el ámbito de la Contraloría General como contratistas “multiobjeto”. En el presente artículo se muestra la construcción de un conjunto de datos de 1.998 registros etiquetado por expertos, que corresponden a contratos del sector educativo en Colombia. Con este instrumento se llevó a cabo el entrenamiento y las pruebas sobre un clasificador automático construido para los objetos contractuales a fin de detectar presuntos contratistas “multiobjeto”. Adicionalmente, se encontró que el mejor algoritmo de clasificación fue “Máquina de Soporte Vectorial Lineal”, con una exactitud de 84 %, el cual permitió finalmente listar por agrupamiento los presuntos contratistas de este tipo.
description_eng Supreme audit institutions, and specifically its governing body, the International Organization of Supreme Audit Institutions (INTOSAI), have promoted during the last four years a series of initiatives in the fiscal context aimed at the use of technologies and methods that are replicable and generate tangible results, thus reinforcing the surveillance and auditing processes carried out by supreme audit institutions. In this sense, the Comptroller General of the Republic of Colombia has been strengthening its technological infrastructure and technical capacities in order to improve and optimize its efforts in the monitoring of the resources of Colombian citizens. Although this task is not an easy one, this entity has managed to detect patterns of contractors who monopolize state contracting and are inserted into different economic sectors, without probably having the technical competence to fulfill stipulated contractual deeds. These subjects are known in the field of the General Comptroller’s office as “multi-object” contractors. This article explains the construction of a data set of 1,998 records labeled by experts that correspond to education sector contracts. Training and tests were carried out with this tool on an automatic classifier built for the contractual objects in order to detect suspected “multi-object” contractors. It was found that the best classification algorithm was the “Linear Vector Support Machine,” with an accuracy of 84%, which will eventually find presumed multi-object contractors by grouping.
author Dulce Vanegas, Manuel Francisco
Beltrán Gómez, Adam
author_facet Dulce Vanegas, Manuel Francisco
Beltrán Gómez, Adam
topicspa_str_mv minería de texto
aprendizaje de máquina
contratación estatal
control fiscal
topic minería de texto
aprendizaje de máquina
contratación estatal
control fiscal
fiscal control and surveillance
state’s procurement
machine learning
Text mining
topic_facet minería de texto
aprendizaje de máquina
contratación estatal
control fiscal
fiscal control and surveillance
state’s procurement
machine learning
Text mining
citationvolume 11
citationissue 1
publisher Universidad de Bogotá Jorge Tadeo Lozano
ispartofjournal Revista Mutis
source https://revistas.utadeo.edu.co/index.php/mutis/article/view/1732
language Español
format Article
rights Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
Revista Mutis - 2021
https://creativecommons.org/licenses/by-nc-sa/4.0
references Othman, R., Aris, N. A., Mardziyah, A., Zainan, N., & Amin, N. M. (2015). Fraud detection and prevention methods in the Malaysian public sector: Accountants’ and internal auditors’ perceptions. Procedia Economics and Finance, 28(April), 59-67. https://doi.org/10.1016/s2212-5671(15)01082-5
Al-Amini, H. S. (2020). The future of public sector auditing: Living in times of change. International Journal of Government Auditing, 47(1), 4-5. http://intosaijournal.org/wp-content/uploads/2020/02/INTOSAI-Journal_Winter-2020.pdf
Álvarez-Jareño, J. A., Badal-Valero, E., & Pavía, J. M. (2018). Aplicación de métodos estadísticos, económicos y de aprendizaje automático para la detección de la corrupción. Revista Internacional de Transparencia e Integridad, 9, 1-11. https://dialnet.unirioja.es/servlet/articulo?codigo=6977094
Bologa, A. R., Bologa, R., & Flores, A. (2010). Big data and specific analysis methods for insurance fraud detection. Database Systems Journal, 1(1), 30-39. Contraloría General de la República de Colombia [CGR]. (2018). Plan Estratégico CGR 2018-2022. CGR.
Córdoba-Larrarte, C. F. (2019). Océano: monitoreo eficiente en la contratación pública. Economía Colombiana, 356, 4-5. https://www.economiacolombiana.co/revista/oceano-393
García, J., Molina, J. M., Berlanga, A., Patricio, M. A., Bustamante, A. L., & Padilla, W. R. (2018). Ciencia de datos. Técnicas analíticas y aprendizaje estadístico. Alfaomega.
Giraldo-Polanía, L. A, Parra-Ortiz, J. W., Cotrino-García, Y., Dulce-Vanegas, M. F., & Tafur-Díaz, J. (2018). Big data. Análisis de caso en la Contraloría de Bogotá con la entrega de bonos. Contraloría de Bogotá. https://www.olacefs.com/wp-content/uploads/2018/10/1%c2%b0-Premio-Bogot%c3%a1-Colombia.pdf
Hsu, B. M. (2020). Comparison of supervised classification models on textual data. Mathematics, 8(5). https://doi.org/10.3390/MATH8050851
Li, S. (2018). Multi-class text classification with scikit-learn. https://towardsdatascience.com/multi-class-text-classification-with-scikit-learn-12f1e60e0a9f
Mohamed, A. (2005). Survey on multiclass classification methods. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.175.107&rep=rep1&type=pdf
Organización Internacional de Entidades Fiscalizadoras Superiores [INTOSAI] (s.f.) About us. https://www.intosai.org/about-us
Pedregosa, F., Varoquaux, G., Gramfor, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Pettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M., & Duchesnay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12, 2825-2830.
Rennie, J. D. M., & Rifkin, R. (2001). Improving multiclass text classification with the support vector machine. Massachusetts Institute of Technology.
Song, Y. Y., & Lu, Y. (2015). Decision tree methods: Applications for classification and prediction. Shanghai Archives of Psychiatry, 27(2), 130-135. https://doi.org/10.11919/j.issn.1002-0829.2
Wirth, R., & Hipp, J. (2000). CRISP-DM: Towards a standard process model for data mining. Proceedings of the Fourth International Conference on the Practical Application of Knowledge Discovery and Data Mining. http://citeseerx.ist.psu.edu/viewdoc/summary? https://doi.org/10.1.1.198.5133
type_driver info:eu-repo/semantics/article
type_coar http://purl.org/coar/resource_type/c_6501
type_version info:eu-repo/semantics/publishedVersion
type_coarversion http://purl.org/coar/version/c_970fb48d4fbd8a85
type_content Text
publishDate 2021-02-16
date_accessioned 2021-02-16T00:00:00Z
date_available 2021-02-16T00:00:00Z
url https://revistas.utadeo.edu.co/index.php/mutis/article/view/1732
url_doi https://doi.org/10.21789/22561498.1732
eissn 2256-1498
doi 10.21789/22561498.1732
citationstartpage 48
citationendpage 64
url2_str_mv https://revistas.utadeo.edu.co/index.php/mutis/article/download/1732/1740
url4_str_mv https://revistas.utadeo.edu.co/index.php/mutis/article/download/1732/1977
_version_ 1797158817583071232