Il corso prevede la trattazione dei seguenti argomenti per il raggiungimento dei risultati di apprendimento attesi: introduzione alla programmazione in R; introduzione all'apprendimento statistico, tecniche di visualizzazione dei dati; tecniche di regressione e classificazione; apprendimento non supervisionato (analisi delle componenti principali, metodi di raggruppamento); introduzione al Text Mining; algoritmi per la preparazione dei testi; visualizzazione di dati testuali; metodologie statistiche ed algoritmi per l’analisi dei dati testuali; tecniche di estrazione dei dati da social media.
1. Introduzione ad R
2. Introduzione a data mining e statistical learning.
3. Tecniche di visualizzazione dei dati
4. Richiami di probabilità
5. La distribuzione Normale multivariata
6. Modelli di apprendimento supervisionati (Regressione, Classificazione)
7 Modelli di apprendimento non supervisionati (Clustering, ACP)
8. Introduzione al Text Mining
9. Preparazione dei testi (Standardizzazione o preprocessing, tokenizzazione, Stopwords, Stemming, modello “Bag of words”)
10. Visualizzazione dati testuali
11. Analisi statistica dei dati testuali
12. Classificazione automatica di testi
13. Topic models
14. Web scraping
SEDE DI CHIETI
Via dei Vestini,31
Centralino 0871.3551
SEDE DI PESCARA
Viale Pindaro,42
Centralino 085.45371
email: info@unich.it
PEC: ateneo@pec.unich.it
Partita IVA 01335970693