Scoring alternativo, big data, y machine learning: cómo les sirven a las Fintech

¿Qué es el scoring?

Los modelos de scoring nacieron como una herramienta de análisis basada en esquemas matemáticos que tienen como variable objetivo determinar la probabilidad de pago de una persona que toma crédito.

Estos modelos se construyen tomando variables socioeconómicas duras, como por ejemplo, tipo de empleo, remuneraciones, localización geográfica, edad, historial crediticio, entre otras.

En su origen, funcionaban como un complemento del análisis de riesgo tradicional basado en el estudio de documentación y del historial del sujeto de crédito pero con la subjetividad del analista. Con el tiempo se fueron perfeccionando y quienes otorgan préstamos, por una cuestión de efectividad y de eficiencia, empezaron a adoptarlos como única regla de decisión. Lo que podemos ver de estos modelos basados en variables, solo pueden explicar parcialmente lo que se busca determinar, y tienen como falencia el no poder segmentar poblaciones a partir de otras variables que son probabilísticamente más asertivas.

El avance de la tecnología, el abaratamiento de los costos de procesamiento de datos, y el aumento de las variables disponibles para el análisis, permiten hoy desarrollar modelos que incorporan datos comportamentales de las personas, y establecer esquemas de segmentación más precisos y con mayor nivel de predicción.

Esto toma mucha mayor utilidad en las económicas en las cuales el segmento informal es importante.

Dentro de los modelos que hoy podemos encontrar, se encuentran aquellos que combinan las variables sociodemográficas con otras tales como el uso de herramientas tecnológicas como los celulares, la circulación a partir del seguimiento de aplicaciones o el comportamiento en redes sociales. Hay que resaltar la importancia de contar con la autorización de la persona a ser calificada.

Mitos y verdades sobre el scoring

Existen varios mitos acerca de los modelos de scoring, al ser estos “cajas negras” hay una tendencia natural a plantear que una variable en particular es la que determina el puntaje del scoring, por ejemplo, la edad o una determinada zona geográfica. Es importante entender que lo que hacen los modelos es tomar una gran cantidad de variables y ponderarlas en función de la combinación de estas variables y no tan solo por el peso que puede tener una u otra en sí misma.

Lo que hubiera sido impensado hace 15 años atrás, que cualquier empresa, sin importar su tamaño, pudiera almacenar grandes cantidades de datos para sobre esas bases trabajar en el desarrollo de modelos, hoy con la llegada y maduración de las tecnologías cloud, generó la posibilidad de almacenar grandes volúmenes de datos a un costo variable sin necesidad de asumir altas inversiones de hardware. Esto permite la utilización de la big data a todas las empresas del sector y generar las condiciones para realizar análisis descriptivos del comportamiento de una población tomando en cuenta una gran cantidad de variables. 

¿Cuál es la mejor metodología para las Fintech? 

Con la utilización de herramientas de machine learning, se generan los modelos de scoring. Estas herramientas permiten además de desarrollar un modelo estático, generan esquemas por aprendizaje asistido. Es decir, los resultados obtenidos a partir de la utilización de los modelos, retroalimentan el modelo generando porcentajes más altos de aciertos en las respuestas. El próximo paso dentro de la evolución de los modelos es la utilización de esquemas de redes neuronales, que lo que hace es establecer una metodología de análisis dinámica y autónoma que se retroalimenta en tiempo real con los resultados obtenidos como consecuencia de las decisiones tomadas basadas en análisis anteriores.

En base a los datos propios con que cuentan las Fintech, se pueden desarrollar modelos de scoring basados en la propia experiencia de la cartera, y con esto generar mejores condiciones para la inclusión financiera de las personas que al no tener historial crediticio o no contar con los requisitos del análisis tradicional hoy se encuentran excluidas del sistema de préstamos o tarjetas de crédito.

El trabajo con datos sensibles de personas debe ser tomado con muchísima responsabilidad por parte de las empresas. Como dijimos anteriormente, requiere una autorización explícita por parte de los clientes, para utilizar los datos únicamente para lo que las personas dieron su autorización. Es importante aplicar herramientas de seguridad informática que protejan cualquier tipo de filtración de las bases de datos. En este sentido, las empresas delegan gran parte de este control y de estas medidas de seguridad en los proveedores de servicios en la nube, de ahí tanta importancia a la hora de seleccionar donde los agentes van a almacenar los datos de sus clientes.

últimas noticias
noticias relacionadas