Data Platform Framework, la soluzione Qintesi per data lake e (big) data warehouse in cloud

Grazie a una metodologia a template, che combina in maniera opportuna i servizi Google, la Data Platform Framework semplifica e velocizza la gestione di tutto il ciclo di vita del dato

Pubblicato il 15 Nov 2021

Fabrizio Pincelli

Giornalista

Statistica bayesiana: cos’è e come aiuta il processo decisionale

È un fatto indiscusso che per essere competitiva un’azienda, oggi, dev’essere versatile, reattiva e agile. Solo in questo modo può operare efficacemente in un mercato molto variabile, riuscendo a soddisfare le sempre più mutevoli richieste dei clienti. Nel raggiungimento di tali risultati, ricopre un ruolo fondamentale l’analisi dei dati. Infatti, è attraverso gli insight che si ricavano tramite gli analytics che si possono prendere decisioni strategiche “informate”, basate su fatti concreti e non su intuizioni o supposizioni.

Data lake e (big) data warehouse in cloud

Va da sé che la gestione e la conservazione dei dati sono aspetti sempre critici per un’azienda. Disporre di un data lake o di un data warehouse è indispensabile se si vuole che le informazioni siano sempre disponibili e facilmente reperibili per elaborazioni e analisi. E con caratteristiche come storage illimitato, facile scalabilità, tariffazione basata sul traffico e nessuna necessità di manutenzione, il cloud rappresenta sicuramente una valida opzione per l’archiviazione dei propri dati.

La conferma arriva dai numeri. Infatti, secondo le previsioni di Gartner, il data management in cloud è una sorta di passaggio obbligato. Da un sondaggio condotto dall’azienda di analisi emerge che entro il 2022 il 50% delle nuove implementazioni di sistemi in cloud avrà anche un data management in cloud. Non solo: per l’anno successivo, il 2023, Gartner prevede che addirittura il 75% di tutti i database sarà su una piattaforma cloud. Siccome alcune aziende – come, per esempio, quelle dei settori finanziario o bancario – per motivi normativi o di policy difficilmente porteranno tutti i loro dati in cloud, dalla previsione Gartner si può dedurre che nel giro di un paio d’anni praticamente tutte le altre organizzazioni punteranno su un data management in cloud.

Tuttavia, avverte la stessa Gartner, tali organizzazioni molto facilmente potrebbero fronteggiare un aumento della complessità nella governance e nell’integrazione dei dati. In tal senso, potrebbe essere di aiuto una soluzione come la Data Platform Framework di Qintesi, un insieme di strumenti e funzionalità che nasce proprio con l’intento di semplificare la gestione dei dati in cloud attraverso una metodologia comune. Un esempio concreto arriva dal fatto che consente di ridurre da alcuni mesi a poche settimane il tempo necessario all’implementazione di data lake e di (big) data warehouse in cloud. Ma le caratteristiche che permettono a un’azienda di trarre vantaggio da un’efficace governance dei dati vanno ben oltre.

Gestire tutto il ciclo di vita del dato con la Data Platform Framework

La Data Platform Framework di Qintesi è una piattaforma in grado di gestire tutto il ciclo di vita del dato, dall’ingestion derivante da diverse fonti, comprese le più complesse e poco conosciute, fino alla visualizzazione in dashboard e applicazioni di reportistica. Il tutto passando attraverso processi di pulizia, anonimizzazione e trasformazione del dato stesso.

Alla base della Data Platform Framework c’è una metodologia imperniata su template, che copre tutte le funzionalità di cui si compone una data platform in termini di rapidità di configurazione, scalabilità, flessibilità e data management agile. Affinché la Data Platform Framework possa supportare al meglio un’organizzazione consentendole di rispondere in modo efficace ai requisiti di business, tali template sono scelti e modellati in base alle esigenze specifiche dell’azienda.

La duttilità della soluzione di Qintesi nasce dal fatto che combina in maniera opportuna i servizi Google, per coprire nel modo più efficace ed efficiente possibile tutte le funzionalità di cui si compone una data platform.

Ricordiamo, infatti, che, attraverso la Cloud Platform, Google rende disponibile una suite completa di servizi di cloud computing. I più noti sono sicuramente la ricerca, la posta elettronica, lo storage e Youtube. Ma a questi si aggiungono una serie di strumenti di data management e una grande varietà di servizi modulari, tra cui:

  • infrastruttura;
  • archiviazione e gestione dati;
  • elaborazione e analisi dei dati;
  • intelligenza artificiale e machine learning;
  • security e sviluppo.

Data la numerosità di queste componenti, non è sempre immediato individuare quali possano essere le più indicate per rispondere alle esigenze di un’azienda. Di questo si fa carico la Data Platform Framework tramite la sua metodologia a template.

Un template per ogni necessità

Come detto, la Data Platform Framework copre tutto il ciclo di vita del dato. In questo senso, integrare i dati provenienti da fonti eterogenee è il primo step per poter rendere fruibili le informazioni all’interno di una data platform. Qintesi ha sviluppato template che possono connettersi direttamente a sistemi sorgente sia on premises sia in cloud con varie modalità, effettuare ingestion in Real Time (per esempio, a seguito dell’immissione di un nuovo ordine), in streaming (come nel caso di dati trasmessi dai sensori IoT) oppure batch (per gestire il caricamento dati in modo massivo).

Non solo. I template consentono di adottare la modalità di gestione di infrastrutture come Infrastructure as a Code, automatizzando via codici il deployment dell’ambiente, insieme ad eventuali aggiornamenti. Le modifiche diventano processi ripetibili senza interventi manuali, eliminando quindi ogni tipo di errore. È, poi, possibile avvalersi della metodologia CI/CD per automatizzare, accelerare e razionalizzare le attività di sviluppo, testing e deployment del codice applicativo, integrando le componenti Google o strumenti open source come GitHub.

Sempre attraverso i template si può strutturare un data warehouse o un data lake e organizzare le loro informazioni in zone con diversi livelli operativi per i diversi fruitori delle informazioni (data scientist, data analyst o business analyst). Si possono, poi, trasformare dati grezzi in modelli fruibili da applicazioni analitiche, machine learning e di intelligenza artificiale per permettere di ottenere il massimo valore possibile.

I template permettono anche di gestire il data catalog che contiene le informazioni sulle entità presenti nel modello dati, compresa la loro definizione di business e di data lineage (il percorso delle informazioni dal sistema sorgente al report finale). Infine,viene effettuato un monitoraggio continuo dei processi di caricamento e trasformazioni del dato in modo da poter rispondere rapidamente a eventuali criticità.

Soluzione in continua evoluzione

Com’è tipico della strategia di Google, tutte le componenti della Cloud Platform sono in continua evoluzione. Analogamente, anche la Data Platform Framework è in costante crescita e i template sono in continua evoluzione e perfezionamento.

New call-to-action

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

Articoli correlati

Articolo 1 di 5