Una vez que ha quedado clara la diferencia entre Big Data y Business Intelligence en anteriores publicaciones, hoy afrontaremos diferentes características del Big Data que resaltan su valor como base informacional si está bien tratada. Más concretamente, como explica Márquez, N. (2016), hoy nos centraremos en las “4V” del Big Data: Volumen, Velocidad, Variedad y Veracidad.
- Volumen: se refiere básicamente a la acumulación de gran cantidad de datos que se acumulan diariamente en una empresa. Éste es uno de los principales retos para cualquier departamento de IT o informática de una empresa: saber gestionar y procesar tal cantidad de información. Según Gartner, en torno a 25 mil millones de dispositivos estarán conectados a la red en 2020 (en menos de 4 años). El verdadero reto no está en saber recopilar dicha información, sino en desarrollar un método continuo de recopilación y gestión del dato en directo, dado que cada día que pase se generará una mayor cantidad de información diaria a tratar.
- Velocidad: se refiere a la rapidez a la que se generan los datos en la actualidad. Es, como hemos mencionado, el mayor reto de todos, ya no solo para el departamento de informática, sino para todo resto de departamentos (financiero, marketing, logística, etc.). La clave está en saber recopilar, gestionar, analizar y sobre todo extraer información de negocio de valor en tiempo real.
- Variedad: se refiere a la gran diferencia que hay en el formato, el origen (las características generales del dato), etc. Hoy en día el dato puede recopilarse en un formato estructurado, fácil de tratar (bases de datos estructuradas, formatos predefinidos, etc.) hasta datos no estructurados extraídos de redes sociales, de videos, etc. La habilidad para saber tratar dicho dato y transformarlo a un formato fácil de analizar definirá la capacidad de dicha empresa de saber gestionar y aprovechar el volumen de datos existente.
- Veracidad: se refiere a la calidad, la predictibilidad y la disponibilidad del dato. Es la variable menos uniforme y menos sencilla de controlar, debido a la dificultad de cerciorarnos de que un dato es 100% fiable. La clave para poder afrontar con garantías esta última faceta del dato es tener un equipo imparcial que ayude a mantener los datos limpios para su posterior evaluación de estrategia de Big Data.
Concluyendo, el dato se ha vuelto tan importante (debido a su fácil acceso, a su volumen masivo, y sobre todo a la gran cantidad de información que de él se puede extraer) que debería ser una prioridad para cualquier empresa actual. Y lo más importante no está en depurar dicho dato a la perfección en una de sus cuatro facetas, sino en realizar un trabajo depurativo en todas ellas, para poder desarrollar la capacidad de trabajar con una gran cantidad de datos, que se actualicen diariamente, que provengan de fuentes muy heterogéneas, y sin la seguridad al 100% de su veracidad y fiabilidad.
En función de tu esfuerzo en el tratamiento del dato, tendrás un mejor o peor resultado en su posterior análisis.
¿A qué esperas para empezar a cuidar tu dato?
Referencias bibliográficas
- Márquez, Nubia. “El futuro se escribe con B de Big Data y Business Intelligence”. tuataratech.com 06/2016. 07 de Septiembre de 2016. http://www.tuataratech. com/2016/06/el-futuro-se-escribe-con-b-de-big-data.html