Statistica Descrittiva: Concetti Fondamentali e Rappresentazione delle Distribuzioni di Frequenza
Classificato in Matematica
Scritto il in
italiano con una dimensione di 25,45 KB
Frequenza di Distribuzione: Concetti Base
1. Dati Grezzi (Dati non Organizzati)
I dati grezzi sono dati raccolti che non sono stati ancora organizzati numericamente. Ad esempio, l'altezza di maschi e femmine ottenuta da una raccolta dati, in ordine alfabetico.
2. Ordinamento dei Dati e Intervallo (Range)
Una serie ordinata è un insieme di dati numerici disposti in ordine crescente o decrescente di grandezza. La differenza tra il numero maggiore e il numero minore è chiamato intervallo dei dati (Range).
Esempio di Calcolo del Range:
Dati: 1, 2, 4, 6, 7, 8, 9, 10
- Valore Massimo: 10
- Valore Minimo: 1
- Intervallo (R): 10 - 1 = 9
3. Distribuzione di Frequenza
Quando si hanno a disposizione grandi quantità di dati grezzi, è utile organizzarli in classi o categorie e determinare il numero di individui appartenenti a ciascuna categoria. Questo numero è chiamato frequenza di classe.
Una rappresentazione tabellare dei dati per tipo o categoria, insieme alle rispettive frequenze di classe, è nota come distribuzione di frequenza o tabella di frequenza.
Esempio di Tabella di Frequenza Semplice:
| Categoria (Range) | Frequenza |
|---|---|
| Totale (N) | 14 |
| 1-5 | 1 |
| 6-10 | 5 |
| 11-15 | 8 |
Esempio di Distribuzione di Frequenza con Percentuali:
| Categoria o Classe | Frequenza (ni) | Percentuale (%) |
|---|---|---|
| Totale | 25 | 100% |
| 20-30 | 17 | 68% |
| 31-40 | 5 | 20% |
| 41-50 | 2 | 8% |
| 51-60 | 1 | 4% |
Questa tabella è una distribuzione di frequenza delle età di 25 studenti della carriera di prevenzione dei rischi dell'Istituto Professionale AIEP.
La prima classe o categoria comprende le età 20-30, ed è contrassegnata con l'intervallo 20-30. Poiché ci sono 17 studenti in questa classe, la frequenza di classe è 17.
Quando si organizzano e raccolgono dati in classi o categorie, ci si riferisce a essi come dati aggregati. Sebbene il processo di aggregazione dei dati elimini i dettagli originali, è molto vantaggioso perché fornisce una visione d'insieme chiara e concisa.
4. Intervallo di Classe e Limiti di Classe
Un intervallo di classe definisce l'ampiezza di una classe. Ad esempio, nell'intervallo 20-30, i numeri 20 e 30 sono chiamati limiti di classe.
- Il numero più piccolo (20) è il limite inferiore della classe.
- Il numero più grande (30) è il limite superiore della classe.
Una classe di intervalli che limita teoricamente solo l'estremo inferiore o superiore è chiamata classe ad intervalli aperti.
Esempio di Classe Aperta:
61 e più (o 61 - ?)
5. Confini Reali di Classe (True Class Boundaries)
Se misurata con precisione, la classe 60-62 comprende teoricamente tutte le misurazioni da 59,5 a 62,5. Questi numeri (59,5 e 62,5) sono chiamati confini reali di classe.
- Il numero 62,5 è il confine superiore della classe.
- Il numero 59,5 è il confine inferiore della classe.
6. Ampiezza (Dimensione) di un Intervallo di Classe
L'ampiezza di un intervallo di classe, designata dalla lettera C, è la differenza tra il confine superiore e il confine inferiore della classe.
$$C = \text{Confine Superiore} - \text{Confine Inferiore}$$
Esempio di Calcolo dell'Ampiezza (C):
Per la classe 60-62, i confini reali sono 62,5 e 59,5.
$$C = 62,5 - 59,5$$
$$C = 3$$
7. Marca di Classe (Punto Medio)
La Marca di Classe (o punto medio) è il punto centrale della classe. Si ottiene calcolando la media aritmetica tra il limite inferiore e il limite superiore della classe.
$$\text{Marca di Classe} = \frac{\text{Limite Inferiore} + \text{Limite Superiore}}{2}$$
Esempio:
Per la classe 60-62:
$$\text{Marca di Classe} = \frac{60 + 62}{2} = 61$$
8. Rappresentazioni Grafiche: Istogramma e Poligono di Frequenza
L'istogramma e il poligono di frequenza sono due metodi grafici utilizzati per visualizzare le distribuzioni di frequenza.
8.1. Istogramma di Frequenza
L'istogramma consiste in un insieme di rettangoli adiacenti, dove:
- Le basi si trovano sull'asse orizzontale, corrispondenti ai confini reali delle classi, e hanno una lunghezza pari all'ampiezza degli intervalli di classe.
- Le aree sono proporzionali alla frequenza della classe.
Se tutti gli intervalli di classe hanno la stessa ampiezza, le altezze dei rettangoli sono proporzionali alla frequenza di classe (e di solito si prendono numericamente uguali alla frequenza). Se gli intervalli di classe non sono tutti della stessa dimensione, è necessario adeguare le altezze (densità di frequenza).
8.2. Poligono di Frequenza
Il poligono di frequenza è un grafico lineare che rappresenta la frequenza di classe. Viene disegnato in relazione alla marca di classe e può essere ottenuto unendo i punti medi delle sommità dei rettangoli dell'istogramma.
9. Calcolo delle Frequenze
- ni: Frequenza assoluta.
- Nc (o Ne): Frequenza cumulativa. Esempio: 8 + 10 = 18; 18 + 16 = 34.
- fi: Frequenza relativa. Si calcola come $fi = \frac{ni}{N}$ (dove N è il totale delle osservazioni). Esempio: $\frac{8}{65} \approx 0,12$; $\frac{10}{65} \approx 0,15$.
- Fi: Frequenza relativa cumulativa. Esempio: $0,12 + 0,15 = 0,27$; $0,27 + 0,25 = 0,52$.
- fi x 100%: Frequenza percentuale. Esempio: $0,12 \times 100 = 12\%$; $0,15 \times 100 = 15\%$.
- Fi x 100%: Frequenza percentuale cumulativa. Esempio: $0,12 \times 100 = 12\%$; $0,27 \times 100 = 27\%$.