logo ibertech
zoho linkedin twitter
ES | EN | PT

Noticias

Nuevos cursos, tecnológias, novedades del sector y toda la actualidad Ibertech

Inicio / Servicios / Noticias / SESIÓN IBM DB2 BIG SQL

SESIÓN IBM DB2 BIG SQL


 

El pasado miércoles 21 de febrero, Ibertech estuvo presente en la sesión  de DB2 Big SQL que tuvo lugar en las instalaciones de IBM.

En la sesión se hablaron  de los siguientes conceptos:

 

¿Qué es el Big Data?
El concepto de BIG DATA surge de que almacenamos, procesamos y analizamos  los datos podemos extraer valor. Los datos están estructurados como:

Estructurados: bbdd relacional), Semiestructurados: HTML, y no estructurados: por ejemplo, comentarios  de twitter.También existen sources que nos proporcionan datos.

Los datos se caracterizan por

– VARIEDAD               – VELOCIDAD            –  VOLUMEN                  – VERACIDAD                   – VALOR

El análisis de los datos es:

-Descriptivo:  saber que pasa con los datos de lo que se disponen, es como una foto de nuestra situación____DASHBOARD.  

-Predictivo: realizamos una pregunta a nuestro sistema para predecir lo que va a pasar  en el futuro, hacemos un SCORES  

-Prescriptivo: sabiendo lo que va a pasar , te da recomendaciones de como debes actuar.

-Conectivo: actuar respecto a esas preguntas.

 

¿ Qué es HortonWorks Data Platform ?( HDP)

Es un producto entre IBM+Hortonworks, es una plataforma opensource.

Características: open(100% abierto) centralizada(gestión de recursos), interoperable(amplio ecosistema de proveedores de nubes y centro de datos), y preparada(monitoreo  para la empresa).

Hay dos Framework para hacer el procedimiento de los datos:

APACHE HADOOP: mapea , reduce y disminuye la información a distintos nodos. Con un algoritmo se hace un push del procedimiento,es como hacer una pirámide reduce la carga de datos.

APACHE SPARK : es un motor de ejecución,  el procedimiento de datos lo hace en memoria para  procesar los datos en menos tiempo.

 

¿Qué es IBM Big SQL?

Big SQL es un motor SQL de procesamiento en paralelo de forma masiva (MPP) que se despliega directamente en el clúster del sistema de archivos distribuido por  Hadoop (HDFS) físico. Este motor SQL lleva el procesamiento a los mismos nodos que contienen los datos. Big SQL utiliza una infraestructura de ejecución en paralelo de baja latencia que accede a los datos de Hadoop de forma nativa para lectura y escritura.

Algunas de las fuentes de datos que interactúan más con BIG SQL son: sistemas transaccionales(legacys), análisis de los Loads, eventos de la empresa,..También hay que señalar que Big SQL  nos facilita el análisis de los datos, da seguridad a las tablas, crea tablas por Web HDFS(que nos permite atacar a Hadoop)trae los datos para el query y  federa, luego BIG SQL da portabilidad.

Finalmente se acabó la sesión con un caso práctico  y un laboratorio con la documentación dada.

 

 

Compártelo:
IBERTECH España
C/ Cronos, 63, 1er piso 6
28037 Madrid
Tel: +34 916 59 25 25
Fax: +34 91 219 27 72

IBERTECH Brasil
Rua Fidêncio Ramos, 160 - 16º andar.
Vila Olimpia
CEP 04551-010 - São Paulo -SP
Tel: +(55)(11) 2506 0527
Fax: +(55)(11) 5504 1910
© 2023 Ibertech