Calcolo della funzione di ripartizione della distribuzione normale

La funzione di ripartizione della distribuzione normale è riconducibile alla forma

$$\int_{-\infty}^x e^{-t^2}dt$$

e non ammette forma chiusa. La principale applicazione di questo articolo è la giustificazione del risultato secondo cui per una distribuzione normale, il $68\%$ dei campioni si trova in una deviazione standard, il $96\%$ in due deviazioni standard, ecc.

Definiamo

$$\phi(x) = a \int_{\mu-x}^{\mu+x} e^{-\left(\frac{t-\mu}{k}\right)^2}dt$$

dove nel caso della gaussiana $a=1/\sqrt{2\pi \sigma^2}$ e $k = \sigma \sqrt{2}$. Ora per simmetria

$$\phi(x) = 2a \int_{\mu}^{\mu+x} e^{-\left(\frac{t-\mu}{k}\right)^2}dt = 2a \int_{0}^{x} e^{-\left(\frac{t}{k}\right)^2}dt$$

Possiamo sviluppare l’integranda in serie di Taylor,

$$e^{-\left(\frac{t}{k}\right)^2} = \sum_{n=0}^\infty \frac{(-1)^n}{n!} \left(\frac{t}{k}\right)^{2n}$$

Integrando termine a termine,

$$\phi(x) = 2a \sum_{n=0}^\infty \frac{(-1)^n}{n!} \left(\frac{1}{k}\right)^{2n} \int_{0}^{x} t^{2n} dt = 2a \sum_{n=0}^\infty \frac{(-1)^n}{n!(2n+1)} \frac{x^{2n+1}}{k^{2n}} $$

Sostituendo i valori di $a$ e $k$ per una gaussiana otteniamo:

$$\phi(x) = \sqrt{\frac{2}{\pi}} \sum_{n=0}^\infty \frac{(-1)^n}{n!(2n+1)} \frac{1}{ 2^n} \left(\frac{x}{\sigma}\right)^{2n+1}$$

Calcolando $\phi$ in un multiplo intero della deviazione standard otteniamo:

$$\phi(m\sigma) = \sqrt{\frac{2}{\pi}} \sum_{n=0}^\infty \frac{(-1)^n}{n!(2n+1)} \frac{1}{ 2^n} m^{2n+1}$$

che è indipendente dalla deviazione standard.

Per cui una deviazione standard ($m=1$) corrisponde a

$$\phi(\sigma) \approx \sqrt{\frac{2}{\pi}} \left(1-\frac{1}{6}+\frac{1}{40}\right)\approx 0,68$$

cioè il $68\%$ dei campioni si trova entro una deviazione standard.

Per due deviazioni standard ($m=2$) dobbiamo includere più termini:

$$\phi(2\sigma) \approx \sqrt{\frac{2}{\pi}} \left( 2-\frac{4}{3}+\frac{4}{5}-\frac{8}{21} +\frac{4}{27}-\frac{8}{165}+\frac{8}{585}\right)\approx 0,96$$

Per cui circa il $96\%$ dei campioni si trova entro due deviazioni standard.

Usando questo metodo e includendo più termini possiamo trovare il valore per qualsiasi multiplo della deviazione standard.

Questa voce è stata pubblicata in serie. Contrassegna il permalink.

Commenta

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.