Las microfinancieras en México desempeñan un papel crucial al otorgar créditos a personas de bajos ingresos, buscando atender sus necesidades y potenciar el desarrollo. Sin embargo, uno de los principales desafíos para estas entidades es la incertidumbre sobre la capacidad de sus clientes para cumplir con los pagos. El presente estudio se propuso como objetivo principal crear un modelo predictivo que ayude a definir los perfiles de clientes que incumplen los pagos. Identificando la correlación de variables determinantes sobre el grado de morosidad e infiriendo el comportamiento de pago futuro de los clientes.
Planteamiento del Problema
El problema central para las microfinancieras en México radica en la dificultad de evaluar si los clientes cumplirán con sus pagos de manera regular. Considerando, que a menudo están excluidos del sistema financiero tradicional por no cumplir con los requisitos bancarios ni el SCORE crediticio. La mora es un indicador crítico que mide el riesgo y afecta la estabilidad y sostenibilidad financiera de estas instituciones. A pesar de que los préstamos no están respaldados por las garantías usuales de los bancos tradicionales. Para el propósito de este estudio, un cliente es considerado “mal pagador” si tiene un atraso mayor a treinta días en su cuota. Mientras que un atraso de treinta días o menos lo clasifica como “cumplido”. La morosidad, aunque no siempre implica una pérdida definitiva, exige mayores provisiones contables y puede deteriorar la lealtad del cliente. Generando incluso un “efecto contagio” en bancas comunales y aumentando los gastos operativos en la recuperación de créditos.

Justificación y Motivación
Actualmente, las entidades financieras tradicionales evalúan la capacidad de pago de un cliente basándose en factores como ingresos, gastos, edad, situación familiar, estabilidad laboral, antigüedad en el domicilio, nivel de estudios, referencias personales y el historial de crédito (SCORE crediticio). No obstante, las microfinancieras otorgan créditos a personas de bajos ingresos que, por diversas razones, no califican satisfactoriamente en muchos de estos puntos. Por esta razón, el estudio se justifica en la necesidad de elaborar una herramienta que, basándose en los propios datos de los clientes de microfinancieras e identificando variables no consideradas en los Score Crediticios tradicionales, permita predecir si un cliente cumplirá con sus pagos de forma regular. Este modelo busca no solo reducir la morosidad y sus costos asociados, sino también permitir a la microfinanciera modificar sus procesos de recuperación de cartera y controlar la calidad de la digitación manual de datos.
Metodología
Para abordar el objetivo de identificar las causas del incumplimiento de pagos en una microfinanciera, se aplicó la metodología CRISP-DM.
La fase de Comprensión del Negocio definió el objetivo de usar la minería de datos para descubrir patrones que mejoren las estrategias comerciales, con la ayuda de un servidor con SQL Server, Pentaho y R Studio.
En la Comprensión de los Datos, se recolectaron 46,537 registros de créditos de la gestión 2024. Se analizaron 42 variables sobre clientes, créditos y pagos. La variable objetivo fue “Buen pagador”, que se etiquetó en función de los días de mora.
Durante la Preparación de los Datos, se unificaron las diferentes fuentes en una tabla maestra. Las variables de texto se convirtieron a valores numéricos y se crearon nuevas variables como rangos de edad. Se eliminaron variables con valores nulos o irrelevantes, como los identificadores.
Finalmente, en la fase de Modelado, se empleó el algoritmo Random Forest para la predicción, entrenando el modelo con el 70% de los datos. Esta metodología permitió un enfoque sistemático para construir un modelo predictivo robusto.
Resultados
El proceso de modelado arrojó hallazgos significativos al comparar el rendimiento del modelo con variables pre y post-otorgación del crédito:
• Variables Pre-Crédito: El modelo inicial, utilizando variables capturadas antes de otorgar el crédito (como género, estado civil, edad, nivel de educación, ingresos, información del buró de crédito), no obtuvo los resultados esperados. La matriz de confusión mostró un porcentaje de falsos positivos del 58%, lo cual fue considerado demasiado alto para una predicción efectiva. Esto indicó que los datos disponibles antes de la otorgación del crédito no eran adecuados para predecir el comportamiento del cliente con la fiabilidad requerida.
• Variables Post-Crédito: En contraste, al utilizar variables relacionadas con el crédito una vez que este ya había sido otorgado (como negocio propio, rubro, región, agencia, estado del crédito, producto, monto desembolsado, saldo de cartera, capital pagado, número de cuota actual, plazo, tasa de interés), el modelo de Random Forest demostró una precisión considerablemente mayor. La matriz de confusión para este modelo arrojó un porcentaje de falsos positivos de solo el 6%, considerado un buen valor al estar por debajo del 20%. El área bajo la curva (AUC) cercana a 1 también confirmó la alta precisión del modelo.
Las cuatro variables con mayor peso y relevancia en el modelo post-crédito fueron:
1. Imp_capital_pagado_mo (capital pagado): Se observó que el 64% de los clientes con un importe de capital pagado entre 0 y 500 pesos mexicanos entran en mora.
2. Id_estado_credito (estado de crédito): Aunque es una variable determinante, su importancia se debe a que refleja directamente el estado de la cartera (vigente vs. vencido).
3. Saldo_cartera (saldo por pagar): La mayor parte de los malos pagadores se concentraron en saldos de cartera entre 0 y 20,000 pesos mexicanos, sugiriendo que préstamos menores a esta cantidad tienen mayor probabilidad de mora.
4. Nro_cuota (número de cuota actual): Se identificó que a partir de la cuota 4, los clientes comienzan a entrar en mora.
Estos hallazgos indicaron que el riesgo de incumplimiento tiende a aumentar con el transcurso del tiempo en el crédito.
Conclusiones
Los ejercicios realizados con el modelo predictivo permitieron extraer conclusiones fundamentales. Si bien las variables consideradas relevantes antes de la otorgación del crédito (como edad, estado civil, género, ingresos, empleo, nivel de estudios, etc.) no fueron suficientes para armar un modelo predictivo que identifique a un buen cliente pagador en la etapa pre-crédito, el estudio sí reveló un comportamiento predictivo significativo una vez que el crédito ya ha sido otorgado. Las variables como capital pagado, estado de crédito, saldo de cartera y número de cuota demostraron tener una mayor inferencia para determinar si un cliente es buen pagador o no en la etapa de post-otorgación de crédito.
Específicamente, se determinó que el comportamiento predictivo indica que los clientes suelen cumplir con los pagos hasta la cuarta cuota, comenzando a dejar de pagar a partir de la quinta. Además, se halló que a menor saldo de cartera (préstamos menores a 20,000 pesos mexicanos), mayor es la probabilidad de mora, y que los préstamos con pagos acumulados entre 0 y 500 pesos mexicanos presentan un 64% de probabilidad de entrar en mora.
El estudio también evidenció la importancia de la calidad de los datos; la información registrada manualmente por los asesores presentó inconsistencias, sugiriendo la necesidad de implementar más controles en el sistema de captura para mejorar la inferencia de las variables. A futuro, se recomienda obtener más información de los burós de crédito para analizar el comportamiento previo del cliente y evaluar si nuevas variables pueden mejorar la precisión del algoritmo predictivo pre-crédito. La solución técnica y económica se considera viable, con una inversión inicial estimada en 12,620 USD en equipos y software, y costos operativos de personal de 13,200 USD por tres meses, los cuales podrían recuperarse en aproximadamente 12 meses gracias a la mejora en la eficiencia de los asesores al reducir el tiempo dedicado a la recuperación de cartera.
Referencias bibliográficas
- Asociación de instituciones financieras de desarrollo: https://www.finrural.org.bo/
- Introducción al FICO Score (Círculo de crédito): Introducción a FICO Score 3
- Los Burós de crédito en México: Círculo de crédito, www.circulocredito.com.mx
- Pro Mujer, una empresa social: https://promujer.org
- Guía de CRISP-DM de IBM SPSS Modeler: https://www.ibm.com/docs/es/spss-modeler/saas?topic=SS3RA7_sub/modeler_crispdm_ddita/modeler_crispdm_ddita-gentopic1.html
- Random Forest: A Complete Guide for Machine Learning: https://builtin.com/data-science/random-forest-algorithm
- FinDev, Inclusion Financiera: https://www.findevgateway.org/es/finequityalc
Autores: Omar Pastor Ralde y Oswaldo Flores Fernández. Máster en Big Data e Inteligencia Artificial Aplicada

