8.6 Cenni agli eventi estremi
Lo studio delle caratteristiche medie di una famiglia di variabili aleatorie (o di un processo) è molto rilevante ai fini pratici, ma altrettanto può esserlo quello delle caratteristiche estreme: se \((X_t)_{t \in \mathcal{T}}\) indica la temperatura di un dispositivo il cui funzionamento è garantito se è sempre compresa in un determinato intervallo di valori, è importante stimare la probabilità che la temperatura massima (o minima) raggiunta sia al di fuori di tale intervallo.
Si tratta quindi di sostituire l’operazione di media campionaria con il massimo tra \(n\) osservazioni \[ M_n = \max_{i=1, \ldots, n} X_i,\] o il minimo \[ m_n = \min_{i=1, \ldots, n} X_i.\] Supponendo che le variabili \((X_n)_{n=1}^\infty\) siano indipendenti e tutte con la stessa legge, si può investigare il limite al tendere di \(n \to \infty\) delle due variabili. Per brevità consideriamo solamente il caso del massimo (il caso del minimo è analogo).
Per comprendere \(M_n\) è utile considerarne la \(\CDF\): \[ \begin{split} \CDF_{M_n}(t) & = P( \max_{i=1, \ldots, n} X_i \le t) \\ & =P( X_1 \le t, X_2 \le t, \ldots, X_n \le t)\\ & = P(X_1 \le t) P(X_2 \le t) \ldots P(X_n \le t).\end{split}\] Nel caso di densità continue delle \(X_i\), derivando questa identità si trova la densità di \(M_n\).
Tuttavia, volendo limitarci a teoremi limite sotto ipotesi generali, supponiamo che tutte le \(X_i\) abbiano la stessa legge (e quindi la stessa \(\CDF\)) e mostriamo il seguente risultato, analogo per certi versi alla legge dei grandi numeri.
Teorema 8.6 Siano \((X_n)_{n =1 }^\infty\) variabili aleatorie a valori reali, indipendenti e tutte con la stessa legge. Se \(t \in \R\) è tale che \(\CDF_{X_1} (t)<1\), ossia \[ P(X_1 >t) >0,\] allora \[ \lim_{n \to \infty } P(M_n > t)= 1\] In particolare se \(X_1\) assume con probabilità positiva (anche piccola) valori arbitrariamente grandi, allora si ha la convergenza in probabilità di \(M_n\) verso \(+\infty\).
In termini più intuitivi, se non è impossibile che le variabili possano assumere valori arbitrariamente grandi, allora tali valori prima o poi si osserveranno. Si tratta di una versione del paradosso di Borel: se una scimmia scrive completamente a caso su una tastiera, prima o poi si vedranno apparire sullo schermo dei versi di Shakespeare. Ovviamente non è specificato in quanto tempo ci si aspetta che questo accada: in media esso è inversamente proporzionale alla probabilità che l’evento accada, il che può essere estremamente grande.
Proof. Dalla formula per la \(\CDF_{M_n}\), si ha \[ P(M_n \le t) = \CDF_{M_n}(t) = (\CDF_{X_n}(t))^n \to 0\] al tendere di \(n \to \infty\).
Il teorema sopra si può rendere più preciso mostrando una versione del teorema limite centrale nello studio degli eventi estremi. In questo caso la densità gaussiana è sostituita da altre densità, a seconda della “pesantezza” delle code delle \(X_i\), ossia dell’ordine di infinitesimo di \(P(X_i >t)\). Vediamo ad esempio il caso di variabili esponenziali. Esse si usano tipicamente per i tempi di vita di dispositivi, quindi il massimo tra \(n\) sarebbe il tempo in cui \(n\) dispositivi smettono tutti di funzionare.
Teorema 8.7 Siano \((X_n)_{n=1}^\infty\) variabili aleatorie indipendenti, tutte con densità esponenziale del medesimo parametro \(\lambda>0\). Allora si ha la convergenza in legge \[ \lim_{n \to \infty} M_n - \frac{ \log n}{\lambda} = G,\] dove \(G\) è una variabile con distribuzione di Gumbel, ossia con funzione di ripartizione, per \(t \in \R\), \[ \CDF_G(t) = \exp\bra{ - e^{-t}}.\]
La densità di \(G\) si ottiene derivando: \[ \frac{d}{dt} \CDF_G(t) = \exp\bra{-t-e^{-t} }.\]
Proof. Per semplicità supponiamo \(\lambda=1\), il caso generale è simile. Sia \(t \in \R\) e calcoliamo \[\CDF_{M_n - \log n}(t) =\CDF_{M_n}(t+\log n) = \bra{ \CDF_{X_1}(t+\log n)}^n.\] Ricordando che \(\CDF_{X_1}(s) = 1-e^{-s}\) per \(s>0\), e osservando che \(t+\log n> 0\) se \(n\) è abbastanza grande (anche se \(t\) è negativo), otteniamo \[ \bra{ \CDF_{X_1}(t+\log n)}^n = (1- e^{-t-\log n})^n = \bra{ 1 - \frac{e^{-t}}{n}}^n \to e^{-e^{-t}},\] per \(n \to \infty\).