Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal
Las entidades fiscalizadoras superiores, y en específico su ente rector, la Organización Internacional de las Entidades Fiscalizadoras Superiores (INTOSAI), han impulsado en los últimos cuatro años iniciativas encaminadas al uso de tecnologías y métodos para sus procesos de vigilancia y fiscalización que sean replicables y que generen resultados tangibles en el contexto fiscal. En este sentido, la Contraloría General de la República de Colombia viene fortaleciendo su infraestructura tecnológica y capacidades técnicas con mirar a mejorar y optimizar sus esfuerzos en cuanto a la vigilancia de los recursos de los colombianos. Aunque dicha tarea no es sencilla, esta entidad ha logrado detectar patrones de aquellos contratistas que acaparan la c... Ver más
2256-1498
11
2021-02-16
48
64
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
Revista Mutis - 2021
id |
617b0a2335745414215857b2bc5a19b3 |
---|---|
record_format |
ojs |
spelling |
Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal Othman, R., Aris, N. A., Mardziyah, A., Zainan, N., & Amin, N. M. (2015). Fraud detection and prevention methods in the Malaysian public sector: Accountants’ and internal auditors’ perceptions. Procedia Economics and Finance, 28(April), 59-67. https://doi.org/10.1016/s2212-5671(15)01082-5 Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0. Al-Amini, H. S. (2020). The future of public sector auditing: Living in times of change. International Journal of Government Auditing, 47(1), 4-5. http://intosaijournal.org/wp-content/uploads/2020/02/INTOSAI-Journal_Winter-2020.pdf Álvarez-Jareño, J. A., Badal-Valero, E., & Pavía, J. M. (2018). Aplicación de métodos estadísticos, económicos y de aprendizaje automático para la detección de la corrupción. Revista Internacional de Transparencia e Integridad, 9, 1-11. https://dialnet.unirioja.es/servlet/articulo?codigo=6977094 Bologa, A. R., Bologa, R., & Flores, A. (2010). Big data and specific analysis methods for insurance fraud detection. Database Systems Journal, 1(1), 30-39. Contraloría General de la República de Colombia [CGR]. (2018). Plan Estratégico CGR 2018-2022. CGR. Córdoba-Larrarte, C. F. (2019). Océano: monitoreo eficiente en la contratación pública. Economía Colombiana, 356, 4-5. https://www.economiacolombiana.co/revista/oceano-393 García, J., Molina, J. M., Berlanga, A., Patricio, M. A., Bustamante, A. L., & Padilla, W. R. (2018). Ciencia de datos. Técnicas analíticas y aprendizaje estadístico. Alfaomega. Giraldo-Polanía, L. A, Parra-Ortiz, J. W., Cotrino-García, Y., Dulce-Vanegas, M. F., & Tafur-Díaz, J. (2018). Big data. Análisis de caso en la Contraloría de Bogotá con la entrega de bonos. Contraloría de Bogotá. https://www.olacefs.com/wp-content/uploads/2018/10/1%c2%b0-Premio-Bogot%c3%a1-Colombia.pdf Hsu, B. M. (2020). Comparison of supervised classification models on textual data. Mathematics, 8(5). https://doi.org/10.3390/MATH8050851 Li, S. (2018). Multi-class text classification with scikit-learn. https://towardsdatascience.com/multi-class-text-classification-with-scikit-learn-12f1e60e0a9f Mohamed, A. (2005). Survey on multiclass classification methods. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.175.107&rep=rep1&type=pdf Organización Internacional de Entidades Fiscalizadoras Superiores [INTOSAI] (s.f.) About us. https://www.intosai.org/about-us Pedregosa, F., Varoquaux, G., Gramfor, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Pettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M., & Duchesnay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12, 2825-2830. Español Rennie, J. D. M., & Rifkin, R. (2001). Improving multiclass text classification with the support vector machine. Massachusetts Institute of Technology. Song, Y. Y., & Lu, Y. (2015). Decision tree methods: Applications for classification and prediction. Shanghai Archives of Psychiatry, 27(2), 130-135. https://doi.org/10.11919/j.issn.1002-0829.2 Wirth, R., & Hipp, J. (2000). CRISP-DM: Towards a standard process model for data mining. Proceedings of the Fourth International Conference on the Practical Application of Knowledge Discovery and Data Mining. http://citeseerx.ist.psu.edu/viewdoc/summary? https://doi.org/10.1.1.198.5133 info:eu-repo/semantics/article http://purl.org/coar/resource_type/c_6501 http://purl.org/redcol/resource_type/ARTREF info:eu-repo/semantics/publishedVersion http://purl.org/coar/version/c_970fb48d4fbd8a85 info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 Text Revista Mutis - 2021 https://creativecommons.org/licenses/by-nc-sa/4.0 Publication Artículo de revista Las entidades fiscalizadoras superiores, y en específico su ente rector, la Organización Internacional de las Entidades Fiscalizadoras Superiores (INTOSAI), han impulsado en los últimos cuatro años iniciativas encaminadas al uso de tecnologías y métodos para sus procesos de vigilancia y fiscalización que sean replicables y que generen resultados tangibles en el contexto fiscal. En este sentido, la Contraloría General de la República de Colombia viene fortaleciendo su infraestructura tecnológica y capacidades técnicas con mirar a mejorar y optimizar sus esfuerzos en cuanto a la vigilancia de los recursos de los colombianos. Aunque dicha tarea no es sencilla, esta entidad ha logrado detectar patrones de aquellos contratistas que acaparan la contratación estatal, logrando estar en diferentes sectores económicos sin tener probablemente la competencia técnica para cumplir el objeto contractual estipulado. A estos se les conoce en el ámbito de la Contraloría General como contratistas “multiobjeto”. En el presente artículo se muestra la construcción de un conjunto de datos de 1.998 registros etiquetado por expertos, que corresponden a contratos del sector educativo en Colombia. Con este instrumento se llevó a cabo el entrenamiento y las pruebas sobre un clasificador automático construido para los objetos contractuales a fin de detectar presuntos contratistas “multiobjeto”. Adicionalmente, se encontró que el mejor algoritmo de clasificación fue “Máquina de Soporte Vectorial Lineal”, con una exactitud de 84 %, el cual permitió finalmente listar por agrupamiento los presuntos contratistas de este tipo. Dulce Vanegas, Manuel Francisco Beltrán Gómez, Adam minería de texto aprendizaje de máquina contratación estatal control fiscal 11 1 text/xml application/pdf https://revistas.utadeo.edu.co/index.php/mutis/article/view/1732 Universidad de Bogotá Jorge Tadeo Lozano Revista Mutis Detection of Multi-object Contractors through Text Mining to Targeting the Exercise of Fiscal Control and Surveillance Journal article Supreme audit institutions, and specifically its governing body, the International Organization of Supreme Audit Institutions (INTOSAI), have promoted during the last four years a series of initiatives in the fiscal context aimed at the use of technologies and methods that are replicable and generate tangible results, thus reinforcing the surveillance and auditing processes carried out by supreme audit institutions. In this sense, the Comptroller General of the Republic of Colombia has been strengthening its technological infrastructure and technical capacities in order to improve and optimize its efforts in the monitoring of the resources of Colombian citizens. Although this task is not an easy one, this entity has managed to detect patterns of contractors who monopolize state contracting and are inserted into different economic sectors, without probably having the technical competence to fulfill stipulated contractual deeds. These subjects are known in the field of the General Comptroller’s office as “multi-object” contractors. This article explains the construction of a data set of 1,998 records labeled by experts that correspond to education sector contracts. Training and tests were carried out with this tool on an automatic classifier built for the contractual objects in order to detect suspected “multi-object” contractors. It was found that the best classification algorithm was the “Linear Vector Support Machine,” with an accuracy of 84%, which will eventually find presumed multi-object contractors by grouping. fiscal control and surveillance state’s procurement machine learning Text mining 2021-02-16 48 2256-1498 https://revistas.utadeo.edu.co/index.php/mutis/article/download/1732/1740 64 https://revistas.utadeo.edu.co/index.php/mutis/article/download/1732/1977 2021-02-16T00:00:00Z 10.21789/22561498.1732 2021-02-16T00:00:00Z https://doi.org/10.21789/22561498.1732 |
institution |
UNIVERSIDAD JORGE TADEO LOZANO |
thumbnail |
https://nuevo.metarevistas.org/UNIVERSIDADJORGETADEOLOZANO/logo.png |
country_str |
Colombia |
collection |
Revista Mutis |
title |
Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal |
spellingShingle |
Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal Dulce Vanegas, Manuel Francisco Beltrán Gómez, Adam minería de texto aprendizaje de máquina contratación estatal control fiscal fiscal control and surveillance state’s procurement machine learning Text mining |
title_short |
Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal |
title_full |
Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal |
title_fullStr |
Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal |
title_full_unstemmed |
Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal |
title_sort |
detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal |
title_eng |
Detection of Multi-object Contractors through Text Mining to Targeting the Exercise of Fiscal Control and Surveillance |
description |
Las entidades fiscalizadoras superiores, y en específico su ente rector, la Organización Internacional de las Entidades Fiscalizadoras Superiores (INTOSAI), han impulsado en los últimos cuatro años iniciativas encaminadas al uso de tecnologías y métodos para sus procesos de vigilancia y fiscalización que sean replicables y que generen resultados tangibles en el contexto fiscal. En este sentido, la Contraloría General de la República de Colombia viene fortaleciendo su infraestructura tecnológica y capacidades técnicas con mirar a mejorar y optimizar sus esfuerzos en cuanto a la vigilancia de los recursos de los colombianos. Aunque dicha tarea no es sencilla, esta entidad ha logrado detectar patrones de aquellos contratistas que acaparan la contratación estatal, logrando estar en diferentes sectores económicos sin tener probablemente la competencia técnica para cumplir el objeto contractual estipulado. A estos se les conoce en el ámbito de la Contraloría General como contratistas “multiobjeto”. En el presente artículo se muestra la construcción de un conjunto de datos de 1.998 registros etiquetado por expertos, que corresponden a contratos del sector educativo en Colombia. Con este instrumento se llevó a cabo el entrenamiento y las pruebas sobre un clasificador automático construido para los objetos contractuales a fin de detectar presuntos contratistas “multiobjeto”. Adicionalmente, se encontró que el mejor algoritmo de clasificación fue “Máquina de Soporte Vectorial Lineal”, con una exactitud de 84 %, el cual permitió finalmente listar por agrupamiento los presuntos contratistas de este tipo.
|
description_eng |
Supreme audit institutions, and specifically its governing body, the International Organization of Supreme Audit Institutions (INTOSAI), have promoted during the last four years a series of initiatives in the fiscal context aimed at the use of technologies and methods that are replicable and generate tangible results, thus reinforcing the surveillance and auditing processes carried out by supreme audit institutions. In this sense, the Comptroller General of the Republic of Colombia has been strengthening its technological infrastructure and technical capacities in order to improve and optimize its efforts in the monitoring of the resources of Colombian citizens. Although this task is not an easy one, this entity has managed to detect patterns of contractors who monopolize state contracting and are inserted into different economic sectors, without probably having the technical competence to fulfill stipulated contractual deeds. These subjects are known in the field of the General Comptroller’s office as “multi-object” contractors. This article explains the construction of a data set of 1,998 records labeled by experts that correspond to education sector contracts. Training and tests were carried out with this tool on an automatic classifier built for the contractual objects in order to detect suspected “multi-object” contractors. It was found that the best classification algorithm was the “Linear Vector Support Machine,” with an accuracy of 84%, which will eventually find presumed multi-object contractors by grouping.
|
author |
Dulce Vanegas, Manuel Francisco Beltrán Gómez, Adam |
author_facet |
Dulce Vanegas, Manuel Francisco Beltrán Gómez, Adam |
topicspa_str_mv |
minería de texto aprendizaje de máquina contratación estatal control fiscal |
topic |
minería de texto aprendizaje de máquina contratación estatal control fiscal fiscal control and surveillance state’s procurement machine learning Text mining |
topic_facet |
minería de texto aprendizaje de máquina contratación estatal control fiscal fiscal control and surveillance state’s procurement machine learning Text mining |
citationvolume |
11 |
citationissue |
1 |
publisher |
Universidad de Bogotá Jorge Tadeo Lozano |
ispartofjournal |
Revista Mutis |
source |
https://revistas.utadeo.edu.co/index.php/mutis/article/view/1732 |
language |
Español |
format |
Article |
rights |
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0. info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 Revista Mutis - 2021 https://creativecommons.org/licenses/by-nc-sa/4.0 |
references |
Othman, R., Aris, N. A., Mardziyah, A., Zainan, N., & Amin, N. M. (2015). Fraud detection and prevention methods in the Malaysian public sector: Accountants’ and internal auditors’ perceptions. Procedia Economics and Finance, 28(April), 59-67. https://doi.org/10.1016/s2212-5671(15)01082-5 Al-Amini, H. S. (2020). The future of public sector auditing: Living in times of change. International Journal of Government Auditing, 47(1), 4-5. http://intosaijournal.org/wp-content/uploads/2020/02/INTOSAI-Journal_Winter-2020.pdf Álvarez-Jareño, J. A., Badal-Valero, E., & Pavía, J. M. (2018). Aplicación de métodos estadísticos, económicos y de aprendizaje automático para la detección de la corrupción. Revista Internacional de Transparencia e Integridad, 9, 1-11. https://dialnet.unirioja.es/servlet/articulo?codigo=6977094 Bologa, A. R., Bologa, R., & Flores, A. (2010). Big data and specific analysis methods for insurance fraud detection. Database Systems Journal, 1(1), 30-39. Contraloría General de la República de Colombia [CGR]. (2018). Plan Estratégico CGR 2018-2022. CGR. Córdoba-Larrarte, C. F. (2019). Océano: monitoreo eficiente en la contratación pública. Economía Colombiana, 356, 4-5. https://www.economiacolombiana.co/revista/oceano-393 García, J., Molina, J. M., Berlanga, A., Patricio, M. A., Bustamante, A. L., & Padilla, W. R. (2018). Ciencia de datos. Técnicas analíticas y aprendizaje estadístico. Alfaomega. Giraldo-Polanía, L. A, Parra-Ortiz, J. W., Cotrino-García, Y., Dulce-Vanegas, M. F., & Tafur-Díaz, J. (2018). Big data. Análisis de caso en la Contraloría de Bogotá con la entrega de bonos. Contraloría de Bogotá. https://www.olacefs.com/wp-content/uploads/2018/10/1%c2%b0-Premio-Bogot%c3%a1-Colombia.pdf Hsu, B. M. (2020). Comparison of supervised classification models on textual data. Mathematics, 8(5). https://doi.org/10.3390/MATH8050851 Li, S. (2018). Multi-class text classification with scikit-learn. https://towardsdatascience.com/multi-class-text-classification-with-scikit-learn-12f1e60e0a9f Mohamed, A. (2005). Survey on multiclass classification methods. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.175.107&rep=rep1&type=pdf Organización Internacional de Entidades Fiscalizadoras Superiores [INTOSAI] (s.f.) About us. https://www.intosai.org/about-us Pedregosa, F., Varoquaux, G., Gramfor, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Pettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M., & Duchesnay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12, 2825-2830. Rennie, J. D. M., & Rifkin, R. (2001). Improving multiclass text classification with the support vector machine. Massachusetts Institute of Technology. Song, Y. Y., & Lu, Y. (2015). Decision tree methods: Applications for classification and prediction. Shanghai Archives of Psychiatry, 27(2), 130-135. https://doi.org/10.11919/j.issn.1002-0829.2 Wirth, R., & Hipp, J. (2000). CRISP-DM: Towards a standard process model for data mining. Proceedings of the Fourth International Conference on the Practical Application of Knowledge Discovery and Data Mining. http://citeseerx.ist.psu.edu/viewdoc/summary? https://doi.org/10.1.1.198.5133 |
type_driver |
info:eu-repo/semantics/article |
type_coar |
http://purl.org/coar/resource_type/c_6501 |
type_version |
info:eu-repo/semantics/publishedVersion |
type_coarversion |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
type_content |
Text |
publishDate |
2021-02-16 |
date_accessioned |
2021-02-16T00:00:00Z |
date_available |
2021-02-16T00:00:00Z |
url |
https://revistas.utadeo.edu.co/index.php/mutis/article/view/1732 |
url_doi |
https://doi.org/10.21789/22561498.1732 |
eissn |
2256-1498 |
doi |
10.21789/22561498.1732 |
citationstartpage |
48 |
citationendpage |
64 |
url2_str_mv |
https://revistas.utadeo.edu.co/index.php/mutis/article/download/1732/1740 |
url4_str_mv |
https://revistas.utadeo.edu.co/index.php/mutis/article/download/1732/1977 |
_version_ |
1797158817583071232 |