Noticias
Nuevos cursos, tecnológias, novedades del sector y toda la actualidad Ibertech
El pasado miércoles 21 de febrero, Ibertech estuvo presente en la sesión de DB2 Big SQL que tuvo lugar en las instalaciones de IBM.
En la sesión se hablaron de los siguientes conceptos:
¿Qué es el Big Data?
El concepto de BIG DATA surge de que almacenamos, procesamos yanalizamos los datos podemos extraer valor. Los datos están estructurados como:
Estructurados: bbdd relacional), Semiestructurados: HTML, y no estructurados: por ejemplo, comentarios de twitter.También existen sources que nos proporcionan datos.
Los datos se caracterizan por
– VARIEDAD – VELOCIDAD – VOLUMEN – VERACIDAD – VALOR
El análisis de los datos es:
-Descriptivo: saber que pasa con los datos de lo que se disponen, es como una foto de nuestra situación____DASHBOARD.
-Predictivo: realizamos una pregunta a nuestrosistema para predecir lo que va a pasar en el futuro, hacemos un SCORES
-Prescriptivo: sabiendo lo que va a pasar , te da recomendaciones de como debes actuar.
-Conectivo: actuar respecto a esas preguntas.
¿ Qué es HortonWorks Data Platform ?( HDP)
Es un producto entre IBM+Hortonworks, es una plataforma opensource.
Características: open(100% abierto) centralizada(gestión derecursos), interoperable(amplio ecosistema de proveedores de nubes y centro de datos), y preparada(monitoreo para la empresa).
Hay dos Framework para hacer el procedimiento de los datos:
–APACHE HADOOP: mapea , reduce y disminuye lainformación a distintos nodos. Con un algoritmo se hace un push delprocedimiento,es como hacer una pirámide reduce la carga de datos.
–APACHE SPARK : es un motor de ejecución, el procedimiento de datos lohace en memoria para procesar los datos en menos tiempo.
¿Qué es IBM Big SQL?
Big SQL es un motor SQL de procesamiento en paralelo de forma masiva (MPP) que se despliega directamente en el clúster del sistema de archivos distribuido por Hadoop (HDFS) físico. Este motor SQL lleva el procesamiento a los mismos nodos que contienen los datos. Big SQL utiliza una infraestructura de ejecución en paralelo de baja latencia que accede a los datos de Hadoop de forma nativa para lectura y escritura.
Algunas de las fuentes de datos que interactúan más con BIGSQL son: sistemastransaccionales(legacys), análisis de los Loads, eventos de laempresa,..También hay que señalar que Big SQL nos facilita el análisis de losdatos, da seguridad a las tablas, crea tablas por Web HDFS(que nospermite atacar a Hadoop)trae los datos para el query y federa,luego BIG SQL da portabilidad.
Finalmente se acabó la sesión con un caso práctico y un laboratorio con la documentación dada.