Finalizamos nuestra serie de artículos sobre «Cómo tratar tus datos». En esta última entrada, haremos un resumen de todos los criterios de tratamiento analizados anteriormente, para que puedas entender las fases necesarias de un tratamiento de datos.

 

Fases en un tratamiento de datos

Tal y como hemos comentado en nuestras anteriores entradas, existen cuatro tipos de fases para tratar todo tipo de datos:

  1. Formateo o Limpieza
  2. Validación
  3. Completado o Enriquecimiento
  4. Unificación o Deduplicación

I. Formateo o Limpieza

Limpiar un dato permite eliminar el ruido de un valor para que el valor resultante se ajuste a las características del campo tratado.

Si eliminamos los carácteres no permitidos de un teléfono, estaremos asegurando un formato correcto y podremos pasar una validación del formato del teléfono.

Puedes obtener más información sobre la limpieza de datos, leyendo la entrada Cómo tratar tus datos (I): Formato.

 

II. Validación

Validar un dato implica comprobar si el valor cumple con las reglas específicas del tipo de campo.

Hay múltiples validaciones disponibles que dependen de las reglas que nos interesen cumplir. Cuando más estrictos seamos con el valor en origen, más fiable será la validez del campo tratado.

Puedes obtener más información sobre la validación de datos consultando la entrada Como tratar tus datos (II): Validación.

 

III. Completado o Enriquecimiento

Completar un dato supone agregar datos adicionales relacionados con un valor inicial. El enriquecimiento permite obtener un mayor conocimiento de un registro existente.

Para asegurar que el dato en origen sea correcto, se recomienda aplicar las reglas mínimas de validación o el enriquecimiento devolverá resultados poco fiables y ajustados a la realidad.

Puedes aprender más sobre el enriquecimiento consultando Cómo tratar tus datos (III): Completado.

 

IV. Unificación o Deduplicación

Estamos ante la última fase de un tratamiento, que permite unificar los datos eliminando los registros duplicados de una base.

Es posible aplicar una deduplicación a un dato no tratado previamente, aunque para obtener los mejores resultados es recomendable limpiar y formatear los datos en origen.

Puedes obtener más información sobre la unificación leyendo la entrada Cómo tratar tus datos (IV): Unificación.

 

Próximamente…

En el futuro, seguiremos analizando los casos de uso más comunes, analizaremos las herramientas disponibles en UProc y publicaremos las novedades relacionadas con el tratamiento de datos.

Recuerda que estamos a tu completa disposición desde el chat o el formulario de contacto para resolver cualquier consulta o duda que tengas sobre el servicio.

 

Atentamente,

El Equipo de UProc



¿Quieres explorar las herramientas?

Regístrate


¿Quieres hablar con un experto?

Reserva una demo