Lakehouse

L’evoluzione dell’architettura di gestione dei dati.

30 mar 2021

C’è un interesse sempre maggiore nei confronti dei big data e delle nuove modalità di analisi e gestione dei dati.

Ma perché sono così importanti e come mai le aziende sono sempre più interessate ad aumentare il proprio know-how in ambito data management?

 

Avere accesso ai dati, oggi più che mai, è strategicamente fondamentale. Questi, infatti, indirizzano le scelte e le azioni future delle compagnie, facendo la differenza nella la loro crescita e nel loro successo.

Negli ultimi trent’anni, quindi, sono state investite moltissime risorse su questo tema, raggiungendo risultati notevoli, in particolare nello sviluppo di Data warehouse: uno strumento eccezionale in grado di processare grandissime quantità di dati strutturati (ovvero che rispettano un set di regole predeterminato) in modo molto rapido ed efficace.

Con il tempo le aziende sono diventate sempre più esigenti, così, oltre ai dati strutturati, si è presentata la necessità di ricavare informazioni di qualità da fonti sempre più variegate. I dati semi o non strutturati (cioè derivanti da testi, video, audio, file archiviati ed immagini) hanno assunto grande importanza e centralità. Per gestirli si è fatto ricorso ai Data Lake: repository in grado di raccogliere dati grezzi, non elaborati e di grandi dimensioni.

Ancora più importante della capacità di organizzare dati, è, però, avere possibilità di analizzarli e trasformarli in informazioni capaci di supportare le scelte aziendali. Sotto questo punto di vista i Data Lake, pur essendo integrabili con sistemi di intelligenza artificiale, risultano poco funzionali.

È a questo punto che entrano in gioco i Lakehouse, un’idea di data solution che combina i migliori elementi di Data Lake e Data Warehause. Un’Open Architecture affidabile, rapida, economica e facilmente integrabile, per raccogliere ed elaborare dati. Uno strumento che si candida a rivoluzionare il modo di gestione e analisi dei Big Data.

 

L’argomento, molto vasto ed estremamente attuale, merita certamente maggiore approfondimento, che potremo fare grazie a KLab.

 

Nel suo prossimo evento, infatti, la Community ospiterà Lucrezia Noli, data scientist and Customer Success Engineer di Databricks, che spiegherà come funziona una piattaforma dati flessibile, dove Data Scientist, Data Engineer e Data Analyst possono collaborare in tempo reale.

L’occasione ideale per fare chiarezza e capire appieno le potenzialità di questo strumento.

 

 

Iscriviti gratuitamente all'evento!