Entendiendo el Umbral de Coincidencia de Nombres

Creado por Omaira Moreno, Modificado el Vie, 11 Jul a 3:00 P. M. por Omaira Moreno

¿Alguna vez te has preguntado cómo nuestra plataforma se asegura de mostrarte los resultados más relevantes cuando realizas una consulta por nombre?


En este artículo, te enseñamos cómo Tusdatos utiliza el “Umbral de Coincidencia de Nombres”; una herramienta que asegura la certeza, cercanía y calidad de los resultados que obtienes al generar tus reportes. Conoce más de cerca cómo filtramos la información para ayudarte  a tomar decisiones más rápidas y con mayor confianza.


¿Qué es el Umbral de Coincidencia de Nombres?


El Umbral de Coincidencia de Nombres, es un filtro inteligente que aplicamos a ciertos resultados de fuentes donde se realizan búsquedas por nombre. Es el porcentaje mínimo de similitud que un nombre encontrado en una fuente debe tener con el nombre que se consulta, con el fin de que dicho resultado sea incluido en el reporte.


Es importante destacar que este umbral es configurado internamente por Tusdatos para cada fuente que consultamos por nombre. Definimos este porcentaje de coincidencia mínimo, tomando en cuenta la naturaleza de uso de cada fuente y la calidad de los resultados que muestra. Esto nos permite optimizar la precisión y relevancia de la información que entregamos, adaptándonos a las particularidades de cada origen de datos.


¿Cómo calculamos el porcentaje de coincidencia de cada resultado?


Una vez que la plataforma de Tusdatos obtiene los resultados de las distintas fuentes; se compara el nombre relacionado en la consulta, con el nombre encontrado en cada resultado. Para hacer esta comparación, utilizamos un algoritmo avanzado llamado Distancia de Levenshtein.


En términos sencillos, el algoritmo de Levenshtein calcula qué tan diferentes son dos cadenas de texto (en este caso, los nombres), lo hace contando el número mínimo de cambios (inserciones, eliminaciones o sustituciones de letras) necesarios para transformar un nombre en el otro. Cuanto menor sea el número de cambios, mayor será el porcentaje de coincidencia. 


Si de la comparación resulta un puntaje mayor al Umbral de Coincidencia configurado para esa fuente, el resultado de la búsqueda se aceptará y se presentará en el reporte, de lo contrario, el resultado no se mostrará como relevante.


Es muy importante que el nombre que proveas sea lo más completo posible, ya que el orden de los nombres y apellidos influye directamente en este cálculo.


Ejemplo del uso del Umbral Mínimo de Coincidencia


Tomemos como ejemplo la búsqueda del nombre "Juan Manuel Santos Calderón". Supongamos que para una de nuestras fuentes, el Umbral de Coincidencia establecido es del 90%.


Aquí te mostramos cómo se comportan algunos resultados encontrados, basándonos en cómo nuestro algoritmo calcula su porcentaje de coincidencia:


Nombre Encontrado en Fuente

% de Coincidencia
¿Se Muestra en el Reporte? (con Umbral del 90%)

Explicación


JUAN MANUEL SANTOS CALDERÓN

100%


Coincidencia exacta, sin importar mayúsculas/minúsculas.
Juan Manuel Santos Calderon
96%
Muy alta coincidencia, solo difiere en el acento.
Juan Santos Calderón
85%
NO
Un nombre y dos apellidos coinciden, pero la ausencia de un segundo nombre reduce la coincidencia por debajo del 90%.
Juan Gabriel Santos Calderón
87%
NO
Los apellidos coinciden y están en orden, pero el segundo nombre es diferente, lo que baja el puntaje.
Juan Manuel Santos
80%
NO
Coinciden dos nombres y un apellido, pero no es lo suficientemente alto para nuestro umbral.
Juan Calderón Santos
60%
NO
Los apellidos están invertidos y solo coincide un nombre, resultando en un porcentaje bajo.
Santos Calderón Juan Manuel
56%
NOMismo nombre, pero el orden es muy diferente al buscado, impactando fuertemente el porcentaje.



Si tienes dudas adicionales, puedes escribirnos a la cuenta sac@tusdatos.co o a través del chat de ayuda de nuestra página para atender tus inquietudes.

¿Le ha sido útil este artículo?

¡Qué bien!

Gracias por sus comentarios

¡Sentimos mucho no haber sido de ayuda!

Gracias por sus comentarios

¡Háganos saber cómo podemos mejorar este artículo!

Seleccione al menos una de las razones
Se requiere la verificación del CAPTCHA.

Sus comentarios se han enviado

Agradecemos su esfuerzo e intentaremos corregir el artículo