Migración: Cirujanos de los datos

En un proceso de migración, una vez definida la estrategia a seguir y planificado el proyecto de migración nos dispondremos a “operar”: establezcamos un analogismo, entre una operación de trasplante y un proceso de migración:

El cirujano, es el especialista con grandes habilidades, que utiliza una serie de instrumentos y técnicas específicas, y tiene un gran conocimiento en áreas científicas, anatómicas y fisiológicas. Además asiste y comunica a todos los interesados, tanto al paciente como al resto de los equipos médicos.

El “migrador” es ese especialista, que al igual que el cirujano, trabaja con instrumentos y técnicas específicas, debe tener un altísimo conocimiento en la materia a migrar, asiste y comunica al resto del equipo.

La migración es una operación de trasplante: se extrae la información de un sistema y se traslada a otro sistema, de manera que todo siga funcionando.

La migración es una operación de trasplante

La información, al igual que los órganos que se trasplantan, son vitales, forman parte del ser, sin ella en la inmensa mayoría de las ocasiones es difícil continuar.

En un trasplante de un órgano, tanto el conocimiento del cirujano, como las técnicas que se usan son cruciales. Esto mismo ocurre en una migración, tanto el conocimiento como las herramientas son muy importantes.

En este artículo, nos vamos a centrar en las técnicas. Tecnológicamente hay que contar con los instrumentos necesarios, que nos permitan llegar a las profundidades de los datos, dándonos toda la información para poder tomar decisiones y, sobre todo, minimizar los riesgos inherentes a las migraciones.

Una de las técnicas más usadas son los procesos ETL: extraer, transformar y cargar (load). Este es un enfoque tradicional en lo que se refiere a migración y como su propio nombre indica está compuesta por tres pasos:

  • Extraer los datos de los diferentes sistemas de origen.  Durante este paso los datos se leen y recopilan, de las diferentes fuentes de datos origen: bases de datos, sistemas de ficheros, aplicaciones, eventos…
  • Transformar los datos. Se realizarán aquí la validación, normalización, homogenización de los datos, cambio de formatos, así como los procesos de ordenación y filtrado. En esta fase los datos extraídos se convierten a un formato aceptado para que el paso siguiente lo entienda.
  • Cargar los datos en el sistema destino. Este paso puede llevarse a cabo por un proceso automático, es decir, es posible estandarizar la carga de la información.
ETL

En cada uno de estos pasos debemos seleccionar las herramientas que nos ayudarán a llevarlos a cabo. Hay herramientas de mercado, pero cuando se trata de un proceso de migración a medida, nos tendremos que construir nuestras propias herramientas.

Al igual que las herramientas que utiliza el cirujano, estas deben tener una serie de capacidades que nos permitan llevar a cabo la intervención con éxito. Según un informe publicado por Gartner, se destacan las siguientes capacidades:

  • Capacidad para conectar y adaptarse a las diferentes fuentes de datos.
  • Capacidad para entregar los datos a otras bases de datos, aplicaciones o procesos.
  • Capacidad para transformar los datos. Desde conversión de datos, cálculos simples hasta procesos más complejos.
  • Capacidad para modelar datos, crear y mantener modelos de datos, realizar el metadato y documentarlo.
  • Capacidad para diseñar el entorno de desarrollo.
  • Capacidad para gestionar los datos.
  • Capacidad para adaptarse a las plataformas de hardware y sistemas operativos existentes.
  • Capacidad de operación y administración, como son gestión de errores, controles de seguridad, monitorización, etc.
  • Capacidad de integración con los diferentes componentes que conforman la herramienta.
  • Por último, debe ser una arquitectura orientada a servicios.

La técnica ETL funciona a la perfección cuando nos encontramos con fuentes de datos estructurados, volúmenes de datos a procesar manejables, y procesos de transformación intensos.

En los últimos tiempos, ha surgido un nuevo enfoque: ELT:  extraer, cargar y transformar que atiende a nuevas necesidades. Si con las técnicas ETL, los datos se mueven desde la fuente de datos hasta un el almacenamiento provisional, con las técnicas ELT aprovechamos el almacén de datos para realizar transformaciones básicas.

La aparición de este nuevo enfoque no significa que las técnicas ETL dejen de estar en vigor, al contrario, ambos enfoques van a convivir y pueden usarse según las necesidades. En próximos artículos profundizaremos en las diferencias entre ambas técnicas.

Como conclusión y siguiendo nuestro analogismo, nos encontramos ante un proceso de trasplante de información, en la que usamos diferentes herramientas. Nuestro objetivo será trasplantar la información con éxito y descubrir en el camino aquella información que pone en riesgo nuestra migración:

¿Seremos capaces de encontrar esas células malignas que se encuentran en los datos, destriparlos y desecharlas?

¿Seremos capaces de encontrar esas células malignas que se encuentran en los datos, destriparlos y desecharlas?

Compartir: