4.2 Mediana e quantile
Ricordiamo che il nostro obiettivo in questo capitolo è di definire delle quantità che riassumano la legge di una variabile \(X\) in modo semplice ma efficace. La \(\CDF_X\) da questo punto di vista contiene troppa informazione, essendo praticamente equivalente ad avere la densità di \(X\). Per ridurre tale informazione in modo efficace, ci si può tuttavia limitare ad alcuni valori (della variabile \(X\)) speciali determinati tramite la \(\CDF_X\), o meglio la sua inversa.
Il più semplice da definire è la mediana di \(X\), definita come un valore \(\bar{x} \in \R\), se esiste, tale che \[ \CDF_X(\bar{x}) = \frac 1 2.\] Ricordando la definizione di \(\CDF_X\), significa che \[ P(X\le \bar{x}) = P(X> \bar{x}) =\frac 1 2,\] ossia \(\bar{x}\) è scelta in modo che le due alternative \(\cur{X \le \bar{x}}\) e \(\cur{X > \bar{x}}\) abbiano la stessa probabilità. La mediana è quindi un buon indicatore di “centralità” per una variabile aleatoria \(X\), simile alla moda, ma in alcuni casi più utile.
Ad esempio, se la densità di \(X\) è uniforme (diciamo su un insieme \(E\) con un numero pari di valori), significa che metà dei valori possibili di \(X\) sono \(\le \bar{x}\), mentre i rimanenti sono \(>\bar{x}\). In questo caso invece una moda è uno qualsiasi dei valori di \(E\).
Esempio 4.5 Si consideri una variabile \(X\) uniforme sui \(10\) valori \(E = \cur{0, 0.1, 0.15, 0.3, 0.4, 0.7, 0.73, 0.9, 0.95, 1.1}\). Una mediana per \(X\) è \(\bar{x}=0.4\), ma anche un qualsiasi valore compreso tra \(0.4\) e \(0.7\) (escluso)
Esempio 4.6 Nel caso di una variabile esponenziale di parametro \(\lambda\), si trova che \[ 1- e^{-\lambda \bar{x}} = \frac 1 2\quad \leftrightarrow \quad \lambda \bar{x} = \log(2),\] ossia \[\bar{x} = \frac{\log(2)}{\lambda}.\] In questo caso la mediana è unica. Osserviamo che la dipendenza da \(\lambda\) (a denominatore) è in linea con le osservazioni fatte nel capitolo precedente sulla dipendenza da \(\lambda\) della densità.
La mediana tuttavia presenta alcuni problemi: non necessariamente esiste sempre, oppure può non essere unicamente determinata dall’equazione sopra, infine non è facile calcolarla (si tratta di risolvere un’equazione).
Per risolvere i primi due problemi, si introduce una inversa generalizzata della funzione \(\CDF_X\), detta funzione quantile di \(X\). In effetti, l’equazione che definisce la mediana, se \(\CDF_X\) è invertibile, darebbe \[ \bar{x} = \CDF_X^{-1}(1/2).\] Il fatto è che la \(\CDF_X\) non è invertibile (si pensi al caso di variabili discrete, in cui è costante a tratti): perciò si introduce la funzione quantile di \(X\) come la funzione \[ q_X : (0,1) \to \R\] che ad ogni possibile \(\alpha \in (0,1)\) (detto anche livello del quantile) associa il valore \[ q_X(\alpha) = \min\cur{ x \in \R \, : \, \CDF_X(x) \ge \alpha},\] detto appunto, quantile di \(X\) di livello \(\alpha\). Si può dimostrare (noi non lo faremo) che vale, per ogni \(\alpha \in (0,1)\). \[ \CDF_X( q_X(\alpha)) \ge \alpha\], mentre se \(X\) ha densità continua, allora \[ \CDF_X( q_X(\alpha)) = \alpha.\]
Esempio 4.7 La funzione quantile delle densità notevoli è già impostata in R, tramite il prefisso q
(in contrasto con p
della CDF e d
per la densità). Plottiamo ad esempio il quantile della densità binomiale (discreta) e quello della densità esponenziale (continua).
<- 10
n <- 2/3
p
<- 0:n
valori_X <- pbinom(valori_X, n, p)
CDF_X
<- 0.01
delta_alpha <- seq(0, 1, by = delta_alpha)
alpha <- qbinom(alpha, n, p)
quantile_X
# per visualizzare i due plot uno
# accanto all'altro usiamo la funzione
# par()
par(mfrow = c(1, 2))
plot(valori_X, CDF_X, type = "s", col = miei_colori[1],
xlab = "valore", ylab = "probabilità",
lwd = 3)
plot(alpha, quantile_X, type = "S", col = miei_colori[2],
xlab = "livello", ylab = "valore", lwd = 3)
Nel caso generale, si definisce quindi la mediana di \(X\) come il valore \(\bar{x} = q_X(1/2)\). Altri valori speciali della funzione quantile sono i quartili, corrispondenti ad \(\alpha \in \cur{ 1/4, 2/4, 3/4}\) (detti il primo, secondo e terzo quartile), i decili e i percentili, corrispondenti rispettivamente ai livelli \(\alpha = k/10\), oppure \(\alpha=k/100\). Affiancare alla mediana i quartili permette di descrivere la variabilità della \(X\) (ossia indicare quanto i valori siano tipicamente vicini alla mediana).
4.2.1 Esercizi
Esercizio 4.4 Calcolare e plottare la funzione quantile di una variabile \(X\) con densità uniforme (continua) su \((a,b)\) (si può eventualmente usare la funzione qunif()
).
Esercizio 4.5 Calcolare e plottare la funzione quantile di una variabile \(X\) con densità (Cauchy) \(p(X=x) \propto 1/(x^2+1)\) (si veda il comando qcauchy()
).
Esercizio 4.6 Sia \(X\) una variabile aleatoria a valori in \(\R\) e sia \(g: \R \to \R\) continua e strettamente crescente. Che legame c’è tra \(q_X\) e \(q_{g(X)}\)?