¿Tienes valores incorrectos en tu base de datos y no tienes claro qué hacer para arreglarlos? A continuación te proporcionamos una guía para resolver ese problema fácilmente.

 

¿Qué entendemos como valor incorrecto?

Un valor de un campo es incorrecto cuando no se corresponde con los valores permitidos para el campo en cuestión.

Por ejemplo, un valor del campo municipio es incorrecto cuando el valor existente:

  1. No se corresponde con ninguno de los municipios permitidos (un municipio no existente en España, por ejemplo).
  2. Contiene algún error de escritura en el momento de guardar el valor (en lugar de Madrid se ha guardado Mardid).

Todos esos errores son subsanables aplicando las depuraciones y validaciones pertinentes antes o después del proceso de captación.

 

¿Cuando necesitamos revisar los datos existentes?

Para determinar si tenemos que arreglar el valor de un campo es fundamental conocer si el valor es esencial para alguna acción de nuestro negocio.

Por ejemplo, si necesitamos ejecutar:

  • Una acción de email marketing. En ese caso, el campo correo será fundamental y por lo tanto, revisaremos que no existan errores en los valores existentes.
    Por ejemplo: [email protected] o [email protected] se corresponderían con [email protected]
  • Una campaña de comunicación por correo, teléfono o dirección postal. En nuestro caso, necesitamos confirmar que el nombre del contacto es correcto.
    Por ejemplo: “Juan Maneul” se correspondería con “Juan Manuel”.
  • Un envío postal. No disponemos de todos los datos de la dirección postal o no la tenemos correctamente completada debido a errores en el momento del alta del usuario.
    Ejemplo: “Calle maiorca 120, BCN” se correspondería con “Calle Mallorca, 120, 08036, Barcelona”.

Así pues, es muy importante tener claro qué campos son fundamentales para nuestro negocio. Una vez clarificados los campos afectados, hemos de realizar una revisión (o perfilado) para tener claro qué número de registros se verán afectados en el momento de la revisión.

 

¿Cómo podemos evitar errores en nuestros campos?

Para evitar problemas de valores no válidos, tenemos dos opciones:

  1. Evitar la entrada de datos no válidos, aplicando reglas de negocio estrictas durante la captación
  2. Limpiar los datos una vez captados.

La primera opción es la recomendable en el caso de querer limitar posibles errores en la base de datos.

En ciertos casos puede ser interesante aplicar las validaciones mínimas en aquellos campos no críticos y aplicar criterios más estrictos cuando el usuario quiera guardar los campos que puedan ser utilizados en las futuras acciones (como código postal, dirección …).

 

¿Qué técnicas podemos aplicar para corregir valores en nuestra base?

En la actualidad hay multitud de técnicas aplicables para detectar y corregir cualquier error, como por ejemplo:

  1. Patrones o expresiones regulares:
    Permite detectar si los valores de los campos cumplen ciertas reglas y eliminar aquellos no aceptados.
    Por ejemplo, para teléfonos únicamente aceptar dígitos.
  2. Distancia Levenshtein:
    Permite asignar valores cercanos teniendo en cuenta el número de carácteres diferentes entre el valor esperado y el valor correcto.
    Por ejemplo, para el valor Jaun se asignaría el valor Juan (un carácter de diferencia entre el valor correcto y el valor en origen).
  3. Lógica difusa:
    Permite asignar valores correctos con errores durante la entrada, aplicando algoritmos fonéticos (existen multitud de algoritmos: metaphone, double metaphone, Soundex, Caverphone, …).
    Por ejemplo, hotmail.com o htmial.com equivalen a HTMLKM, con lo cual asignaríamos para todos los casos hotmail.com como valor correcto.
  4. Diccionarios:
    Permite asignar un valor correcto partiendo de un conjunto limitado de valores aceptados. Cada nueva entrada no identificada, supone una correspondencia en el diccionario.
    Por ejemplo,es aplicable a cambios de nombres de calles o variantes dialectales de una misma calle (Conde Urgell, Compte d’Urgell, …).

Como véis, hay multitud de opciones para resolver los errores detectados en nuestros campos y todo depende del campo a corregir y de lo estricto que queramos ser.

Además, es muy común combinar las anteriores técnicas para solventar problemas complejos de valores incorrectos.

 

¿Cómo te ayuda UProc en la revisión?

UProc nace con la finalidad de proporcionar todas las utilidades necesarias para depurar, validar, enriquecer y unificar tus bases de datos en un catálogo centralizado y categorizado en múltiples famílias y tipologías de datos.

En el caso que quieras limpiar o revisar los valores de tu fuente de datos, puedes acceder al Catálogo y seguir los siguientes pasos:

Después de comprobar el valor en la herramienta, puedes ver el resultado de tu petición debajo de los datos de entrada, en la sección “Resultados”.

Para integrarte fácilmente puedes utilizar nuestra Api. Si clicas el enlace “Mostrar información de la API” puedes encontrar ejemplos en múltiples lenguajes de programación que tu equipo técnico podrá utilizar para acelerar el proceso de integración con UProc.

 

¿Puedo limpiar múltiples valores con UProc?

Para enriquecer múltiples valores tienes que registrarte y utilizar el Asistente de Procesado (subiendo un fichero – excel o csv -) o hacer una llamada a la Api.

 

¿Necesitas entender mejor en qué consiste la depuración y/o normalización?

Puedes consultar la entrada Como tratar tus datos: Formato para resolver tus dudas sobre la limpieza de datos.

Además, estamos a tu completa disposición desde el chat o el formulario de contacto para solucionar cualquier consulta que tengas sobre el servicio.

Atentamente,

El Equipo de UProc

Share on LinkedIn15Share on Facebook0Tweet about this on TwitterShare on Google+0

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.plugin cookies

ACEPTAR
Aviso de cookies