La mediana rappresenta una delle misure di tendenza centrale più comuni in statistica, affiancata dalla media e dalla moda, essa è il valore che divide in maniera equa un insieme di osservazioni ordinate. È un importante strumento per l’analisi dei dati in presenza di valori estremi o distribuzioni asimmetriche (outlier).
Cerco ripetizioni di matematica
Esempi di distribuzione simmetrica:
Una distribuzione simmetrica potrebbe essere la seguente: 7, 3, 11, 1, 15, 9, 5, 13
Se ordiniamo i valori in ordine crescente otteniamo la sequenza: 1,3,5,7,9,11,13,15. Se si osserva bene questa distribuzione è simmetrica poiché omogenea. In altre parole i valori ordinati sono tutti intervallati tra loro di due unità.
Differente è il caso per la serie:
110, 30, 790, 15, 70, 1, 1600, 5, 230, 90, 3, 7. Se proviamo come nell’esempio precedente ad ordinarla otteniamo: 1,3,5,7,15,30,70,90,110,230,790,1600. Si nota abbastanza facilmente che questa serie non è omogenea; quindi non è simmetrica.
Più in generale, si parla di mediana quando si fa riferimento al valore o valore centrale di un insieme di osservazioni. La sua formula varia in funzione delle caratteristiche legate alla numerosità del campione (di quanti numeri si compone una serie?). Chiamiamo questa numerosità n.
Ad esempio, prendiamo i numeri: 3, 1, 9, 4, 7.
Ordinandoli in ordine crescente otteniamo 1,3,4,7,9. Al centro di questa serie in terza posizione (quella che divide a metà i dati) troviamo il numero 4.
Se invece abbiamo un numero pari di dati come 8, 3, 7, 4, 6, 2.
Ordinandoli come nell’esempio precedente otteniamo la sequenza 2, 3, 4, 6, 7, 8. In questo caso la mediana, cioè il valore che occupa la posizione centrale passando dalla prima e all’ultima cifra della serie, sarà la media dei due valori che dividono a metà la serie. Nel nostro caso 4 e 6. Per mediarli basta dividere per due la somma, per cui nell’esempio la mediana è 5 (Media tra 4 e 6, la cui somma 10 va divisa per 2).
Se consideriamo la distribuzione degli stipendi su scala mondiale avremmo una serie di dati molto asimmetrica poiché c’è una grossa di sproporzione tra i molto ricchi ed i molto poveri. In questo caso, per avere una stima della tendenza del reddito annuo su scala mondiale, risulta molto più conveniente calcolare una mediana piuttosto che una media.
Per concludere, la mediana può essere considerata uno strumento essenziale nell’analisi statistica, poiché fornisce una buona misura della tendenza centrale e non è essenzialmente influenzata dai valori anomali come la media. In quanto tale, la mediana può essere utilizzata per rappresentare il centro di una distribuzione. Tale caratteristica la rende un’opzione desiderabile per una varietà di applicazioni in cui si ha a che fare con dati rarefatti o distribuiti lungo una serie di valori estremi con una concentrazione di valori distribuiti non in modo uniforme.