Big Data Analytics: el futuro de la analítica digital

Big Data Analytics - tristan elosegui
Analytics: conectando los puntos

En el anterior post vimos los pasos previos al Big Data: basic y small data. Ahora nos toca adentrarnos en el mundo del Big Data. Es un tema que da para decenas de post, así que lo mejor es que empecemos por el principio.

¿Qué es Big Data?

“Es el término que se refiere a un conjunto de datos tan grande y complejo, que resulta difícil de procesar usando los sistemas de gestión de bases de datos disponibles o las aplicaciones tradicionales de procesamiento de datos”

Definición de Big Data de Wikipedia

¿Cuál es el origen del Big Data?

La realidad es que la gestión de grandes volúmenes de datos no es algo nuevo. Lo que ha cambiado es el volumen y la velocidad con la que se generan los datos y nuestra capacidad para analizarlos.

Según IBM, se generan más de 2,5 quintillones de bytes al día. Tal es el volumen de datos que el 90% de los datos del mundo han sido creados durante los últimos dos años. Este es un dato que he visto en varios blogs, pero no he encontrado nada más concreto y actualizado. Así que si conoces el dato actualizado, te agradecería que dejases un comentario en el post.

Los beneficios que ofrece el análisis de estos grandes volúmenes de información para las empresas e instituciones son inmensos. Por este motivo, según crece nuestra capacidad de analizar y procesar datos, los esfuerzos orientados al big data son cada vez mayores.

Tipos de datos en Big Data

Smart Data

Son todos los datos referentes al negocio (tanto online, como offline). En este grupo podemos encontrar desde las cifras de ventas, datos sobre los clientes, datos sobre nuestra actividad online, etc. todo aquello que esté relacionado con la consecución de los objetivos de la empresa.

Identity Data

Son todos los datos que nos permiten identificar a nuestros clientes actuales y potenciales: datos sobre sus gustos, historial de compras, perfil de internauta, tipo de interacción con nuestros contenidos (web, redes sociales, blog, mobile…), etc.

Toda esta información nos permite personalizar nuestra oferta de producto, contenido y canal de comunicación al máximo.

En esta etapa es cuando entran en escena las herramientas de CRM y Business Intelligence.

Open data

Agrupa al resto de datos externos a la empresa y que son accesibles por todo el mundo. Por su volumen y diversidad, nos será más difícil sacarles partido. Pero una vez encontrada la fuente de datos (e integrada), los beneficios que podemos sacar de esta información son enormes.

Voy a ir directamente a la interpretación y visualización de los datos, saltándome la parte más técnica. Ya sabéis que no es lo mío, así que ‘zapatero a tus zapatos’.

Para ello nada mejor que un caso práctico de Big Data para explicarlo.

El caso es un poco antiguo, pero lo he elegido, porque se entiende muy bien.

Veremos como, en 2011, T-mobile consiguió reducir en un 50% las portabilidades de clientes tomando decisiones basadas en Big Data.

Analizando el altísimo volumen de datos que guardan de sus clientes (cuánto gastan, número y duración de llamadas, uso de datos, incidencias registradas, etc. etc.), se dieron cuenta de que las portabilidades dependían de tres factores:

  • Facturación (Smart Data).
  • Número y frecuencia de las incidencias (Smart Data)
  • Sentimiento de los clientes hacia la empresa: opiniones positivas, negativas y neutras que los clientes manifiestan en redes sociales (Identity Data).

Analizando:

  • Los patrones de comportamiento (en su facturación y llamadas)
  • y añadiéndole el dato de la opinión (positiva, negativa o neutra) + la influencia de cada cliente en redes sociales.

Consiguieron determinar el ‘customer lifetime value’ de  cada cliente que potencialmente podía abandonar la compañía, y así diseñar un plan de retención de clientes en base a incentivos.

Fuentes: caso práctico T-Mobile del Blog de Zenith Media y foto de SumAll

More from Tristán Elósegui

Hablemos de SEO: entrevista a Lino Uruñuela

¿Qué es SEO y cuáles son sus ventajas? SEO son las técnicas...
Leer más

18 Comentarios

  • Hola Tristán, desde hace poco estoy introduciéndome en el mundo de la analítica web, y me sorprende mucho cómo todo se centra en on line… todo se mide desde la web y por la web, sin embargo hay muchísimos factores externos que pueden influir o influyen en los datos,
    desde la humildad he hecho esta reflexión en mi blog:

    http://planificacionmedios.com/2014/04/30/del-analisis-a-la-paralisis-reflexiones-sobre-analitica-web/

    me gustaría que se hablase más en general de todo lo que afecta a internet, y que se enseñase a los que nos estamos iniciando a interpretar los datos.

  • Hola Tristan, me encanta el tema…
    Pero… en el ejemplo que has puesto todavía no veo Big Data… veo Datamining o Minería de Datos ¿Donde piensas que éstá la línea que los separa?

  • Muchas gracias por tu comentario Ana.

    En mi opinión Big Data es ‘todo aquello que no cabe en un Excel’ (aunque ya sabemos que cabe casi de todo! :-)). Es decir, grandes volúmenes de datos.

    Como digo en el post, existen tres tipos de datos dentro de lo que llamamos Big Data: smart, identity y open data. En el ejemplo se recogen los dos primeros. Para mi lo que le da la categoría de big data es el cruce de datos entre las opiniones encontradas en redes sociales (su clasificado, etc.) y la bbdd de clientes, para ofrecer a cada cliente el plan de retención/fidelización más adecuado.

    Hay otros ejemplos más claros (con volúmenes de datos más bestias), pero me gustó este por su aplicación directa al negocio.

  • Ya verás Tristán, soy Estadístico. Hace un tiempo intenté entrar en aquello que se llamaba “Big Data” y me encontré en un mundo de datos sin estructurar y programadores Java que para nada tenía que ver con las espectativas que se le daba desde otros paises… desilusión y tirada de toalla¡¡¡ Me gusta mucho más esta visión que le estais dando. Más interpretación y menos herramientas… Al finál, de qué vale tener un Ferrari si no sabes hacerlo correr como tal¡¡¡

  • Exacto. Esta es la idea Ana!

    Para mi lo más importante es sacar partido a los datos. Si el volumen es de 100 TB o de ‘sólo’ 1 GB, me da igual. Lo importante es que tomemos decisiones de negocio. Parece que sino combinamos los datos de la temperatura por segundo en el polo con las ventas de ventiladores en Cádiz, no estamos haciendo big data. Creo que la fuerza del big data está en combinar todas las fuentes de datos relevantes para la empresa (tanto off como on) y sacar partido de ello. Y eso no tiene porque requerir que usemos datos ‘open source’ a base de TBs almacenados.

  • Hola Tristán

    Soy social media tronkel en una agencia de internet y Cada vez mas los clientes nos piden estrategias de bigdata basadas en apalancamientos y la respuesta es la misma: no podemos generar una estrategia de apalancamiento sin forzar el bigdata hacia lo que el cliente o el forzer pueda asumir”. La cantidad de datos es tan brutal que el bigdata ha de virar hacia el social data forzado a curación por profesionales del mercadeo especificado en pautas de vejez del contenido y no de la forma. Si la cosa tira hacia un bigdata analítico y curado por community managertos no se podrá asumir más que la cantidad que un usuario pueda condensar en un tweet.

    Gracias por el magnífico post

  • Muchas gracias por tu aportación Rocío.

    Si te he entendido bien, tu enfocas el big data desde Social Media (toda la información que podamos extraer de posteos en redes sociales), no? (muy resumido).

    El Big Data va mucho más allá. Los datos que podemos sacar de redes sociales (sentiment analysis, social media analytics, etc.) es una parte del big data. No hay otra manera de enfocarlo, que desde el punto de vista global (tanto on, como off).

  • Genial Tristán, gracias por el post.

    Más arriba veía que te consultaban sobre la línea separadora entre la Minería de Datos o Data Mining con el Big Data. Y de lo que he leido, me parece que si seguimos hablando de volumen, sea el que fuese, podemos seguir hablando de Data Mining, pero hay otras dos V’s que dan cuenta del Big Data, que son la Variedad (fuera de los datos estructurados, tenemos a los no estructurados, como todo eso que fluye sin cesar en el social media) y la Velocidad, ya que entramos a hablar de análisis en tiempo real, para una toma de decisiones al instante. Por otro lado veo al Big Data como un concepto que va más allá de las técnicas y que empieza por la cultura de cada organización para centrar sus decisiones en datos, empezando desde lo más “pequeño”. Saludos, felicitaciones y gracias por tus geniales posts.

  • Hola Tristán,

    muy bueno el post. Siguiendo con lo que comenta Rocío y tu propia respuesta, estoy contigo que no hay que reducir Big Data a social data. Ahora bien, complementar las variables que has mencionado en tu post (smart, identity, open) con variables que reflejen los social data (ej, número de amigos que han comprado el mismo producto) mejora también la predicción de la adopción/abandono. El contagio social es un factor clave, que aunque varía según mercados, es importante tenerlo en cuenta. En concreto en proyecto con telcos, que es el caso que mejor conozco, funciona muy bien.

    Saludos

  • Totalmente de acuerdo Miguel Ángel!

    Lo que quería decir con mi respuesta anterior, es que no es necesario usar open data, para considerarlo Big Data. En el ejemplo de T-mobile se usa smart data (data mining puro) e identity data (opiniones de los clientes de T-mobile en redes sociales) y con ello consiguieron unos resultados espectaculares.

    Es verdad que cuanto más nos acercamos al open data mayor velocidad, volumen y variedad.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *