Business Intelligence open source con Pentaho

di Luigi Santangelo

Pubblicato 23 Settembre 2013
Aggiornato 17 Giugno 2019 10:32

Per imprese commerciali e PMI in cerca di strumenti gratuiti per l'analiai dei dati di mercato e su clienti e utenti, Pentaho offre utili ed efficaci strumenti.

Per mantenersi competitive sul mercato, è importante affidarsi ad adeguati strumenti di Business Intelligence, in grado di fornire un supporto al processo decisionale del management attraverso la sistematica raccolta, elaborazione e analisi dei dati. Sul mercato sono oggi disponibili anche soluzioni BI open source, come la piattaforma Pentaho. Rilasciata anche sotto licenza OS (Community Edition), fornisce tutte le funzionalità utili per una PMI.  Ulteriori servizi (compreso supporto e training) sono poi offerti con la Enterprise Edition a pagamento.

Strumenti

Ai servizi di base forniti dal framework centrale possono essere collegati tool e add-on aggiuntivi, per formare una infrastruttura completa. Il core della piattaforma è composto da due web app in Java, con accesso via browser:  BI Server (accesso alle risorse) e Administrator Console (gestione utenti e privilegi).  Fanno poi parte della suite applicativi quali Kettle, Weka, Report Design, Metadata Editor, Dashboard e strumenti OLAP (OnLine Analytical Processing) utili alle organizzazioni commerciali che vogliono eseguire operazioni analitiche su grosse quantità di dati ed ottenere un feedback immediato su clienti e utenti.  In particolare, segnaliamo Schema Workbench  (per creare proiezioni visuali) e Mondrian (server OLAP per l’analisi dei dati in real time).Kettle, noto anche come Pentaho Data Integration (PDI) o Spoon, trasforma i dati provenienti da sorgenti eterogenee (Database Management System, documenti di testo, file xml, LDAP, file ldif, rss e json, fogli excel, tabelle di access e altro ancora), ripulendoli e adattandoli per il caricamento nel database, allineandoli con i dati del livello operativo, attraverso una comoda interfaccia. Dopo aver stabilito il canale di input, è possibile definire le operazioni di trasformazione  sui dati: aritmetiche e logiche, splitting e cutting, mapping, aggregazione, join, merging e sorting, validazione e altro ancora. Infine i dati vengono caricati con un’operazione di output, in differenti sistemi.

Metadata Editor permette di costruire una rappresentazione logica del modello di dati del database fisico in modo da facilitare la creazione di query senza dover conoscere la sintassi SQL; permette quindi la creazione di Metadata Domain che definiscono il mapping tra la struttura fisica del database e il corrispondente modello logico, il cui utilizzo permette di: utilizzare terminologie orientate al business; ridurre i costi di intervento per le modifiche al db; definire i parametri di sicurezza con cui gli utenti possono accedere ai dati; eseguire formattazioni di date, testi e numeri.

Report Designer semplifica la creazione di report attraverso un’interfaccia semplice ed intuitiva. Si connette al datasource e recupera i dati attraverso query, creando poi in un’area di lavoro composta da bande/sezioni: Page Header, Report Header, Details, Report Footer e Page Footer, alle quali ne possono essere aggiunte altre (Group Header, Details Header, Detail Footer e Group Footer). Per rendere il report indipendente dal sottostante livello di persistenza, è possibile recuperare i dati attraverso il metadata source, creato con l’omonimo strumento di editor: in questo modo  ci si può concentrare sui concetti di business descritti attraverso i metadati. Il report potrà poi essere pubblicato sul Pentaho BI Server per  essere accessibile dagli utenti autorizzati.

Pentaho Data Mining  o Weka (Waikato Environment for Knowledge Analysis) permette di trasformare grandi quantità di dati in schemi e regole per creare un modello di facile lettura e interpretazione di dati esistenti e futuri, di particolare utilità per le imprese commerciali in cerca di informazioni strategiche su utenti e clienti. Applicazione Java dotata di GUI (che facilita l’interazione con i dati e la visualizzazione dei risultati), fornisce anche una libreria per integrare le funzionalità di data-mining nelle proprie applicazioni. Weka è in grado di importare dati da differenti fonti, compresi file CSV e Database e fornisce differenti metodi operativi, da Regressione Lineare a Clustering o Nearest Neighbor (scarica Pentaho Community Edition).