Métodos de minería de datos ligados a la inteligencia artificial aplicables a riesgo crediticio

  1. Jimbo Santana, Patricia 1
  2. Villa Monte, Augusto 2
  3. Lanzarini, Laura 2
  4. Fernández Bariviera, Aurelio 3
  1. 1 Universidad Central del Ecuador
    info

    Universidad Central del Ecuador

    Quito, Ecuador

    ROR https://ror.org/010n0x685

  2. 2 Universidad Nacional de La Plata
    info

    Universidad Nacional de La Plata

    La Plata, Argentina

    ROR https://ror.org/01tjs6929

  3. 3 Universitat Rovirai Virgili
Revista:
FIGEMPA: Investigación y Desarrollo

ISSN: 2602-8484

Año de publicación: 2017

Título del ejemplar: FIRE

Volumen: 1

Número: 1

Páginas: 98-106

Tipo: Artículo

DOI: 10.29166/REVFIG.V1I1.61 DIALNET GOOGLE SCHOLAR lock_openDialnet editor

Otras publicaciones en: FIGEMPA: Investigación y Desarrollo

Resumen

Cuando las instituciones financieras seleccionan, apropiadamente, a sus clientes disminuyen su riesgo de crédito. Los bancos utilizan diversas metodologías con la finalidad de clasificar a sus clientes de acuerdo al riesgo de impago que presentan; para esto se analiza un conjunto de variables personales, así como la situación financiera del cliente que es sujeto de crédito. El análisis y procesamiento exhaustivo de la información del cliente lleva bastante tiempo, una de las causas es que los datos a analizar no son homogéneos. En este trabajo se presenta un método alternativo capaz de construir, a partir de la información disponible, un conjunto de reglas, de clasificación con tres características principales: precisión adecuada, baja cardinalidad y facilidad de interpretación. Esto último está dado por el uso de un número reducido de atributos en la conformación del antecedente. Esta característica, sumada a la baja cardinalidad del conjunto de reglas permite distinguir patrones sumamente útiles a la hora de comprender las relaciones entre los datos y tomar decisiones. Cuando se trata de decidir el otorgamiento de créditos, resulta sumamente útil contar con una herramienta de este tipo. Mientras más simple sea el modelo, menor será la cantidad de características del sujeto de crédito que deben ser analizadas, por lo que las decisiones pueden tomarse con mayor rapidez; esto permite que el método resulte atractivo para los oficiales de crédito en las instituciones financieras, ya que se puede dar una respuesta al solicitante del crédito en menor tiempo logrando una ventaja competitiva. La metodología propuesta ha sido aplicada a dos bases de datos conocidas en la literatura y a dos bases de datos reales de entidades financieras del Ecuador, una Cooperativa de Ahorro y Crédito y un Banco que otorgan diferentes tipos de créditos y tienen agencias en las regiones costa, sierra y oriente. Los resultados obtenidos han sido satisfactorios. Finalmente se exponen las conclusiones y se sugieren futuras líneas de investigación.

Referencias bibliográficas

  • . Agrawal, R., Srikant, R. (1994) Fast algorithms for mining association rules in large databases. In: Proceedings of the 20th International Conference on Very Large Data Bases, VLDB ’94, pp. 487–499.
  • Aggarwal, C. (2015): Data Mining: The Textbook. Springer Publishing Company, Incorporated.
  • . Altman, E.I., (1968). Financial ratios, discriminant analysis and the prediction of corporate bankruptcy. The Journal of Finance, 23(4), pp.589–609.
  • Altman, E.I., and A. Sounders. (1998). Credit risk measurement: Developments over the last 20 years. Journal of Banking and Finance, 21, 1721-1742.
  • . Duffie, D., Singleton, K. J. (2003): Credit Risk: Pricing, Measurement, and Management. Princeton University Press. ISBN 0-691-09046-7.
  • . Frank, E., Witten, I. H., (1998). Generating accurate rule sets without global optimization. In: Proceedings of the Fifteenth International Conference on Machine Learning, ICML ’98., pp. 144–151.
  • Hung, C. & Huang, L. (2010). Extracting Rules from Optimal Clusters of Self-Organizing Maps. In Second International Conference on Computer Modeling and Simulation. ICCMS ’10. pp. 382–386
  • . MacQueen, J. B. (1967). Some methods for classification and analysis of multivariate observations,” in Proc. of the fifth Berkeley Symposium on Mathematical Statistics and Probability, L. M. L. Cam and J. Neyman, Eds., vol. 1. University of California Press, pp. 281,297.
  • . Kennedy, J. & Eberhart, R. (1995). Particle swarm optimization. In, Proceedings of IEEE International Conference on Neural Networks. pp. 1942–1948, vol.4.
  • . Kohonen, T. (2012). Self-Organizing Maps. Vol. 30, Springer Series in Information Sciences. Springer, Heidelberg.
  • . Lanzarini, L., Villa Monte, A., Aquino, G., De Giusti, A. (2015). Obtaining classification rules using lvqPSO. 6th International Conference Advances in Swarm and Computational Intelligence. Lecture Notes in Computer Science. Vol 9140 183-193. https://doi.org/10.1007/978-3-319-20466-6_20
  • . Lanzarini, L., Villa-Monte, A., Ronchetti, F. (2015). SOM+PSO: A Novel Method to Obtain Classification Rules. Journal of Computer Science & Technology (JCS&T), 15(1), 15-22.
  • . Quinlan, J.R. (1993). C4.5: programs for machine learning. Morgan Kaufmann Publishers.
  • Roszbach, K. (2003). Bank Lending Policy, Credit Scoring and the Survival of Loans. Sveriges Risksbank Working Paper Series, 154.
  • Saunders, A., Allen L. (2002): Credit Risk Measurement: New Approaches to Value at Risk and Other Paradigms, 2nd Edition. John Wiley & Sons, Inc. ISBN: 978-0-471-27476-6.
  • Venturini, G. (1993). Sia: A supervised inductive algorithm with genetic search for learning attributes based concepts, in Machine Learning: ECML-93, ser. Lecture Notes in Computer Science, P. Brazdil, Ed. Springer Berlin Heidelberg, vol. 667, pp. 280–296.
  • Wang, Z., Sun, X. & Zhang, D. (2007). A PSO-Based Classification Rule Mining Algorithm. In D.-S. Huang, L. Heutte, & M. Loog, eds. Advanced Intelligent Computing Theories and Applications. With Aspects of Artificial Intelligence: Third International Conference on Intelligent Computing, ICIC 2007, Qingdao, China, August 21-24, 2007. Proceedings. Berlin, Heidelberg: Springer Berlin Heidelberg, pp. 377–384.
  • . Witten, I.H., Eibe, F. & Hall, M.A. (2011). Data Mining Practical Machine Learning Tools and Techniques. 3rd. ed., San Francisco, CA: Morgan Kaufmann Publishers Inc.
  • Zadeh, L.A. (1965). Fuzzy sets. Information and Control, 8(3), pp.338–353.
  • Asok, K., Nanda, Moshe Shaked. (2001). The Hazard Rate and the Reversed Hazard Rate Orders, with Applications to Order Statistics, pp.853– 864.
  • Ríos Insua, M.J. (1984). On the hierarchical models and their relationship with the decision problem with partial information a priori.