La corsa all’impiego dell’analisi dei dati strutturati, per migliorare la capacità di decisione nelle organizzazioni, ha probabilmente raggiunto un punto di svolta simbolico quando Microsoft ha inserito due algoritmi (decision treees e clustering) di data mining in Sql Server 2000.
Sembra questo un segnale importante del processo di accettazione di una tecnologia e di un metodo (e dei servizi necessari per utilizzarli) assai complessi e dai costi spesso proibitivi e fino a qualche anno fa applicabili solo in poche aziende.
Ora i maggiori database fanno della business intelligence, data mining compreso, uno dei maggiori punti di forza.
Ma è dunque vero che il data mining (Dm) è diventato «popolare»?
Una risposta relistica probabilmente è: sì, ma solo in parte.
Le applicazioni commerciali che lo utilizzano in effetti sono " almeno potenzialmente " numerose (cfr. l’articolo qui sotto) e per i responsabili dei progetti di business intelligence le funzioni di questo tipo direttamente vendute con l’engine cominciano a essere fra i fattori di valutazione dei database.
Tuttavia i costi e la complessità sono tutt'altro che irrilevanti, e vanno ben oltre il «motore».
Intanto, se è vero che in Sql Server il data mining, come l’Olap, è compreso nel prezzo, in Oracle, per esempio, è ancora un extra e piuttosto costoso.
E dalle differenze emergono anche le diverse ambizioni di portata funzionale dei due strumenti, con Microsoft a proporre quasi un «assaggio».
Infatti, la data mining option per Oracle 9i costa 20 mila dollari per cpu (l’enterprise edition del database ne costa 40 mila, e altri 20 mila dollari costa l’Olap option).
Soprattutto (e vale anche per Microsoft), la natura dell’analisi tipica del mining " «discovery driven», alla ricerca di relazioni sconosciute e inattese fra variabili anche molto numerose (altrimenti definito proprio knowledge discovery) " richiede progetti complessi, software aggiuntivi, sviluppo su misura, adattamenti organizzativi, personale molto specializzato, consulenti all’altezza, enormi quantità di dati da trattare e hardware più potente di una «semplice» soluzione per le query ad hoc o l’Olap.
Un'occhiata a qualsiasi documento metodologico di sintesi dedicato all’implementazione del data mining (basta fare una ricerca sul sito di una rivista specializzata come DmReview per rendersene conto) mostra la quantità e l’intreccio fra i fattori in gioco sul piano strategico e su quello tecnico: identificazione degli obiettivi di business da raggiungere; disponibilità della tipologia di dati giusta e di qualità adeguata (aspetto decisivo per ogni data warehouse ma più radicale quando si fa Dm) e in quantità sufficiente; interrelazione fra il personale dell’It e chi deve effettuare le analisi.
E questa lista si può allungare facilmente.
A ciò si deve poi aggiungere che la premessa indispensabile al successo di un progetto è proprio il fatto che il data mining sia necessario e giustificato: definire con precisione quando bastano applicazioni di query e reporting o di Olap e quando invece serva il data mining è già un'operazione decisiva.
E sovente i due tipi di analisi - per aggregati e induttive - vanno combinati, perché complementari, accrescendo però la complessità del progetto.
In definitiva il Dm può essere definito più popolare perché le aziende oggi hanno più spesso bisogno delle analisi che esso consente.
E non perché i costi e i rischi complessivi di un progetto adeguato siano alla portata di piccoli bilanci o comunque votati al risparmio.
Ultimi Articoli
“Assonanze”, memoria e identità al centro dell’incontro con Patrizia Starnone al Circolo della Stampa di Milano
ESA, completato l’addestramento della Riserva astronauti: ora pronti per le missioni
Quando vesto John Travolta parto dalla persona, non dal personaggio
Alex Donovan debutta con - Le tue stelle: il primo singolo dal 15 maggio
Matteo Perin racconta John Travolta: “Vestire lui significa vestire una parte della storia del cinema”
Colon VR-Prevention Lab: in Lombardia la realtà virtuale entra nella prevenzione del tumore al colon-retto
Premio Loano 2026, “Mater Nullius” di Davide Ambrogio è il miglior album 2025
Notre Dame de Paris supera quota 350 mila biglietti venduti per il tour del 25° anniversario
Lodigiano, approvato l’avanzamento dell’Aqst regionale