
Struttura didattica
Il Master è annuale, corrisponde a 60 CFU (crediti formativi universitari) e ha una durata di 1.500 ore tra didattica frontale, studio individuale, tirocinio. E' prevista una prova finale (discussione Tesi di Master).
Le 1.500 ore sono così articolate:
- Didattica frontale n. 310 ore, studio individuale n. 690 ore, corrispondenti ad un totale di 40 CFU
- Tirocinio n. 400 ore, pari a 16 CFU
- Prova finale n. 100 ore, pari a 4 CFU
Il piano didattico 2022/2023 è strutturato nei seguenti Insegnamenti (cliccare sul nome dell'Insegnamento per vederne l’articolazione):
Software per la business intelligence e metodologie di programmazione
- L'agenda del master e presentazione degli argomenti
- Business Intelligence, Data Science: excursus sui moduli del Master
- Backend: Strumenti per archiviazione e aggiornamento dei dati, flate tables, DW e DataMart
- Corso di SAS Base e SAS Guide: Strumenti per la raccolta dei dati e data quality - Access Data
- Corso di SAS Base e SAS Guide: Strumenti per la raccolta dei dati e data quality - Manage Data
- Corso di SAS Base e SAS Guide: Strumenti per la raccolta dei dati e data quality - Analyze Data
- Corso di SAS Base e SAS Guide: Strumenti per la raccolta dei dati e data quality - Reporting
- Linguaggio SQL
- Informazioni geografiche e Qgis
- Qlik View
- Visualizzazione dei dati e Dashboard, Tableau
- R
- Python
- Verifica di fine modulo
Data management e trattamento dei dati non strutturati
- Esplorare le fonti informative interne ed esterne in ambito Pubblica Amministrazione (Government e Agende digitali, Open data, Cataloghi dati)
- Costruire applicazioni e basi informative a partire dai bisogni di conoscenza (tecniche di Data Design Thinking e Service Design)
- Come costruire basi dati decisionali (modellare i dati decisionali, la costruzione della base dati decisionale)
- Introduzione a Data Integration
- Integrazione dei dati
- Seminario Knime
- Verifica di fine modulo
Raccolta dei dati e data quality
- Sensori, IoT, piattaforme Big Data
- Informazioni geografiche e Qgis
- La gestione del data anagrafico per il riconoscimento e la contattabilità del Cliente
- Verifica di fine modulo
Statistica per la BI
- Eventi e probabilità
- Test di ipotesi
- Distribuzioni di probabilità
- Verifica di fine modulo
Mining I – Statistica descrittiva
- Uso del software R e dell'IDE Rstudio per analisi statistiche
- I dati, le funzioni, i grafici, altri oggetti: statistica descrittiva
- Test statici parametrici e non parametrici
- La correlazione e la regressione
- ANOVA a una via
- Tabelle di contingenza e indipendenza statistica
- Verifica di fine modulo
Mining II – Machine learning e text mining
- Introduzione NLP e livelli di analisi (sintassi, semantica)
- Sistemi e approcci per la rappresentazione delle conoscenza e l'elaborazione linguistica
- Rappresentazione di concetti e nozione di distanza semantica. Text analytics e word sense disambiguation
- Rappresentazioni di sensi e rappresentazione della semantica della frase: WordNet e FrameNet
- Ricerca di documenti testuali basata su keywords; Vector Space Model e Document Similarity
- Introduzione, preprocessing, tipi di dati, misure di similarità e dissimilarità
- Classificazione (introduzione, k-Nearest Neighbors, Naive Bayesian networks, alberi di decisione, random forests, valutazione della performance: accuratezza, F-measure, cross validation, curve ROC)
- Clustering (introduzione, K-means, Clustering gerarchico: Single link e Complete link, DBScan, cenni sulla valutazione della performance)
- Regole di associazione
- Esercitazioni con Knime su classificazione e clustering
- Verifica di fine modulo
Mining III – Sintesi dell'informazione statistica
- Individuazione di differenti tipologie di clienti: analisi cluster
- Sintesi dei fenomeni multidimensionali: analisi fattoriale e analisi delle corrispondenze
- Esempi di sintesi dell'informazione statistica in ambito Pubblica Amministrazione(indicatori e cruscotti di performance, data e text mining, visualizzazione di informazioni)
- Conoscere i propri clienti costruendone il profilo attraverso la Segmentazione Comportamentale: identificazione dell’obiettivo e impostazione dell’analisi
- Interpretazione dei risultati, passaggio in produzione e supporto alle strategie di marketing dell’azienda
- Verifica di fine modulo
Modelli e modelli di equazioni strutturali
- Modelli di regressione lineare e regressione logistica
- Valutazione di un modello logistico
- Scelta dei modelli (lineari, non lineari), Analisi delle corrispondenze
- Modelli: descrizione ed esempi di modelli. Utilizzi delle probabiltà condizionali. Previsione e formalizzazione
- Il contesto in cui i numeri vengono prodotti e i modelli “teorici” da cui derivano: obiettivi e trattamento dei dati nei modelli
- Modelli strutturali: Path Analysis
- Utilizzo di SAS Enterprise Miner
- Verifica di fine modulo
Tecniche di simulazione
- Tuning dei modelli
- Stima dei modelli
- Esempi di simulazione: le distribuzioni di potenza. Pareto e Zipf
- Previsione: analisi what-if
- Esercitazione sulla costruzione di modelli strutturali
- Verifica di fine modulo
Interpretazione e comunicazione delle relazioni statistiche
- Informazioni per la Business Intelligence in impresa
- Responsabilità legale della ricerca, proprietà dei dati del finanziatore, copy right e open access nella sua diffusione
- Visualizzazione dei dati e Dashboard
- La comunicazione di dati scientifici agli stakeholder: modelli e criticità della comunicazione, il caso dei bilanci sociali
- Modi efficaci di comunicazione dei risultati e dei numeri nell'ambito Business Intelligence
- Fondamenti psicologici per le rappresentazioni grafiche, tools grafici, dashboards
- La comunicazione giornalistica dei numeri ed altre rappresentazioni grafiche
- Verifica di fine modulo
Il PROGRAMMA DI DETTAGLIO di ogni Insegnamento è anche scaricabile in formato pdf. Clicca qui.
A completamento dell'attività didattica sono inoltre previste alcune ore di approfondimento nell’uso di specifici software (es. SAS) con attività laboratoriali ed esercitazioni su casi reali, la cui frequenza è facoltativa, che verranno pianificate in alcuni martedì pomeriggio.
Compatibilmente con le misure adottate dall'Università di Torino, a seguito delle misure nazionali e regionali di gestione del quadro pandemico, le lezioni saranno previste in presenza. Sarà tuttavia garantita la partecipazione alle lezioni da remoto in modalità sincrona esclusivamente per i residenti fuori Regione Piemonte e in caso di ragioni sanitarie legate all'emergenza covid.
La partecipazione a tutte le attività nei giorni ed orari di frequenza sopra indicati è obbligatoria. Non è prevista la registrazione delle lezioni.
Lo svolgimento delle attività in presenza è subordinato al rispetto delle modalità previste dal Protocollo di regolamentazione delle misure per il contrasto e il contenimento della diffusione del virus Covid-19 in Ateneo.
Al fine di una proficua partecipazione alle lezioni online ed allo svolgimento delle attività pratiche del Master e alla sperimentazione dei software utilizzati è richiesto che lo studente sia in possesso di un computer portatile o notebook con una configurazione che garantisca discrete prestazioni (indicativamente, ma non tassativamente: processore da almeno 1GHz, 8 GB RAM, webcam e microfono) e di una connessione veloce ad Internet.
Per verificare l’apprendimento, durante il percorso didattico saranno svolte delle verifiche in itinere con valutazione espressa in trentesimi, mentre, a conclusione dell’intero percorso, è prevista una verifica finale, valutata in centodecimi, consistente nella discussione della tesi di Master, legata all’esperienza del tirocinio.
E’ richiesto il superamento positivo di tutte le verifiche al fine dell’ottenimento del Diploma di Master/Attestato di frequenza (sezione “Titoli”).