Flusso di Lavoro Statistico: Elaborazione Dati ISTAT Incidenti Stradali (Excel, Access, Octave, R)

Classificato in Informatica

Scritto il in italiano con una dimensione di 3,52 KB

Progetto Applicativo: Elaborazione Dati Statistici Multisoftware

Il seguente documento descrive il flusso di lavoro adottato per l'elaborazione e la visualizzazione dei dati relativi agli incidenti stradali con morti e feriti in Italia, raccolti dall'ISTAT per gli anni 2016-2017, suddivisi per regione.

Fase 1: Acquisizione e Pre-Elaborazione in Microsoft Excel

Una volta scaricati i dati dal sito istat.it, le tabelle sono state aperte separatamente su Excel. Attraverso le funzioni integrate del software, sono stati calcolati i principali indicatori statistici per ogni colonna:

  • La somma
  • La media
  • La deviazione standard

Successivamente, per rappresentare visivamente i dati elaborati, sono stati creati dei grafici, scegliendo le tipologie classiche di rappresentazione:

  • Grafici a istogrammi
  • Grafici a barre
  • Grafici a torta

Fase 2: Gestione e Relazioni del Database con Access

Dopo aver salvato i dati elaborati in Excel, si è proceduto all'importazione nel software Access. L'importazione è stata eseguita selezionando Nuova origine dati -> Da file -> Excel e seguendo la procedura guidata.

Funzionalità Applicate in Access

Per ottimizzare la gestione e la visualizzazione dei dati, sono state implementate diverse funzionalità:

  1. Creazione di una Query: Questa operazione ha semplificato la visualizzazione e la modifica dei dati. In questa fase, si è deciso di escludere alcuni dati non pertinenti.
  2. Applicazione di un Filtro: Un ulteriore filtro è stato applicato alla query per escludere specifici sottoinsiemi di dati.
  3. Funzione Relazioni: Utilizzata per combinare i dati tra le tabelle e le query create.
  4. Maschera: È stata imposta una maschera, un'interfaccia grafica utilizzabile per aggiungere, modificare o visualizzare i dati memorizzati nel database.

Fase 3: Calcolo Statistico Avanzato tramite Octave

I dati trattati sono stati aperti su Octave. Le colonne di interesse sono state copiate in un documento denominato mywork.txt. Dopo aver salvato il file .txt nella cartella bin di Octave, digitando il comando >>disp(mywork) è stato possibile visualizzare i dati sotto forma di Array.

Operazioni Eseguite in Octave

Sono state applicate diverse funzioni statistiche, tra cui:

  • Somma
  • Media
  • Range
  • Varianza

Inoltre, sono state estratte le colonne in singole matrici, applicati i costrutti di controllo for e if, e infine, tramite il comando plot, sono stati visualizzati i grafici dei vari dati.

Fase 4: Implementazione Statistica e Visualizzazione in R

I dati di interesse sono stati importati da Excel a R. L'importazione è avvenuta copiando la tabella desiderata da Excel (Ctrl+C) e digitando sulla console di R il comando read.delim('clipboard', header=TRUE).

Elaborazione e Costrutti in R

Le varie colonne sono state divise in matrici separate, ad esempio tramite il comando A <- mywork[2:2]. Sono state applicate operazioni aritmetiche e statistiche fondamentali:

  • Somma
  • Media
  • Varianza
  • Massimo e Minimo

Infine, sono stati creati dei grafici e sono stati applicati i costrutti di controllo switch e if.

Voci correlate: