Flusso di Lavoro Statistico: Elaborazione Dati ISTAT Incidenti Stradali (Excel, Access, Octave, R)
Classificato in Informatica
Scritto il in
italiano con una dimensione di 3,52 KB
Progetto Applicativo: Elaborazione Dati Statistici Multisoftware
Il seguente documento descrive il flusso di lavoro adottato per l'elaborazione e la visualizzazione dei dati relativi agli incidenti stradali con morti e feriti in Italia, raccolti dall'ISTAT per gli anni 2016-2017, suddivisi per regione.
Fase 1: Acquisizione e Pre-Elaborazione in Microsoft Excel
Una volta scaricati i dati dal sito istat.it, le tabelle sono state aperte separatamente su Excel. Attraverso le funzioni integrate del software, sono stati calcolati i principali indicatori statistici per ogni colonna:
- La somma
- La media
- La deviazione standard
Successivamente, per rappresentare visivamente i dati elaborati, sono stati creati dei grafici, scegliendo le tipologie classiche di rappresentazione:
- Grafici a istogrammi
- Grafici a barre
- Grafici a torta
Fase 2: Gestione e Relazioni del Database con Access
Dopo aver salvato i dati elaborati in Excel, si è proceduto all'importazione nel software Access. L'importazione è stata eseguita selezionando Nuova origine dati -> Da file -> Excel e seguendo la procedura guidata.
Funzionalità Applicate in Access
Per ottimizzare la gestione e la visualizzazione dei dati, sono state implementate diverse funzionalità:
- Creazione di una Query: Questa operazione ha semplificato la visualizzazione e la modifica dei dati. In questa fase, si è deciso di escludere alcuni dati non pertinenti.
- Applicazione di un Filtro: Un ulteriore filtro è stato applicato alla query per escludere specifici sottoinsiemi di dati.
- Funzione Relazioni: Utilizzata per combinare i dati tra le tabelle e le query create.
- Maschera: È stata imposta una maschera, un'interfaccia grafica utilizzabile per aggiungere, modificare o visualizzare i dati memorizzati nel database.
Fase 3: Calcolo Statistico Avanzato tramite Octave
I dati trattati sono stati aperti su Octave. Le colonne di interesse sono state copiate in un documento denominato mywork.txt. Dopo aver salvato il file .txt nella cartella bin di Octave, digitando il comando >>disp(mywork) è stato possibile visualizzare i dati sotto forma di Array.
Operazioni Eseguite in Octave
Sono state applicate diverse funzioni statistiche, tra cui:
- Somma
- Media
- Range
- Varianza
Inoltre, sono state estratte le colonne in singole matrici, applicati i costrutti di controllo for e if, e infine, tramite il comando plot, sono stati visualizzati i grafici dei vari dati.
Fase 4: Implementazione Statistica e Visualizzazione in R
I dati di interesse sono stati importati da Excel a R. L'importazione è avvenuta copiando la tabella desiderata da Excel (Ctrl+C) e digitando sulla console di R il comando read.delim('clipboard', header=TRUE).
Elaborazione e Costrutti in R
Le varie colonne sono state divise in matrici separate, ad esempio tramite il comando A <- mywork[2:2]. Sono state applicate operazioni aritmetiche e statistiche fondamentali:
- Somma
- Media
- Varianza
- Massimo e Minimo
Infine, sono stati creati dei grafici e sono stati applicati i costrutti di controllo switch e if.