DBS564

Data Mining

Corso Gold
Certificazione
Le tecniche di Data Mining offrono oggi un supporto sempre più rilevante alle decisioni aziendali attraverso l'analisi dei dati su larga scala. Le metodologie di analisi e gli algoritmi proposti trovano applicazione in svariati ambiti sia commerciali, come il marketing e la competitive intelligence, sia scientifici, come l'analisi di dati biologici e clinici per lo studio di malattie genetiche e la validazione di terapie mediche. Il corso presenta il processo di analisi ed elaborazione dei dati al fine di estrapolare informazioni utili per il supporto alle decisioni aziendali. Verranno presentate le principali tecniche di analisi dei dati, quali la classificazione, l'estrazione di associazioni, il clustering e le loro principali applicazioni in ambito aziendale. Lezioni teoriche si alterneranno allo sviluppo di casi di studio, la cui progettazione sarà a cura dei partecipanti. I casi di studio prevedono l'utilizzo del software open source Rapid Miner e saranno mirati all'applicazione delle tecniche apprese, all'analisi critica e alla validazione dei risultati.

Durata 3 giorni

Programma

Introduzione al Data Mining: fondamenti ed applicazioni:
classificazione delle tecniche di data mining
analisi dei contesti applicativi.
Preparazione dei dati per l'analisi:
integrazione e filtraggio dei dati
aggregazione, discretizzazione e campionamento dei dati
feature selection
misure di distanza.
Tecniche di analisi dei dati.
Classificazione:
alberi di decisione
classificazione basata su regole
classificazione Bayesiana
tecniche di validazione.
Estrazione di regole di associazione:
principali algoritmi
indici di qualità.
Clustering:
principali algoritmi
tecniche di validazione.
Strumenti per il Data Mining:
classificazione dei software
introduzione al software open source Rapid Miner
uso di Rapid Miner per la preparazione, classificazione, clustering e visualizzazione dei dati.
Casi di studio:
creazione di una base di dati e preparazione dei dati da analizzare mediante Rapid Miner
classificazione di dati mediante Rapid Miner
estrazione di regole di associazione mediante Rapid Miner.
Il tuo IPv4: 3.141.100.120

Newsletter

Nome:
Email: