La teoria della relatività ristretta si basa su due assiomi fondamentali:
- il principio di relatività, secondo cui le leggi della fisica sono le stesse in tutti i sistemi di riferimento inerziali.
- la costanza della velocità della luce, secondo cui la velocità della luce è la stessa in tutti i sistemi di riferimento inerziali.
Questi due assiomi sono sufficienti per ricavare le trasformazioni di Lorentz, e non possiamo fare a meno di uno dei due.
Dal principio di relatività possiamo ricavare le due conseguenze seguenti:
- Isotropia dello spaziotempo. Per isotropia intendiamo la libertà di ruotare gli assi delle coordinate in qualsiasi direzione. L’isotropia segue per il motivo seguente: se un corpo si muove a velocità costante nel sistema $S$, allora si muoverà di velocità costante anche nel sistema ruotato $S’$. Per cui se $S$ è inerziale, lo è anche $S’$. Ma le leggi della fisica sono le stesse in tutti i sistemi di riferimento inerziali, per cui $S$ e $S’$ sono equivalenti e lo spaziotempo è isotropo.
- Omogeneità dello spaziotempo. Per omogeneità intendiamo la libertà di traslare l’origine degli assi di coordinate. La dimostrazione è la stessa del caso precedente.
Va notato che queste due proprietà non hanno nulla a che fare con l’isotropia e l’omogeneità della materia, adoperate ad esempio in cosmologia: queste sono appunto proprietà della materia, che non hanno nulla a che fare con le proprietà dello spaziotempo.
Dati due sistemi di riferimento inerziali $S$ e $S’$, esisterà una funzione che relaziona $S$ ed $S’$, cioè una trasformazione. Possiamo dimostrare che l’omogeneità dello spaziotempo implica che le trasformazioni tra sistemi di riferimento inerziali sono affini (cioè lineari più una costante). La dimostrazione segue questa risposta su Phys.SE.
Supponiamo di avere una trasformazione $L : \mathbb{R}^4 \to \mathbb{R}^4$. Per l’omogeneità dello spazio, dobbiamo avere per ogni $x, y, h \in \mathbb{R}^4$
$$L(x+h)-L(y+h) = L(x)-L(y)$$
Dobbiamo supporre che $L$ sia derivabile, ma questa può essere considerata una supposizione tecnica. Per la definizione di derivabilità:
$$L(x+h) = L(x) + L'(x)h + o(h)$$
Ricordiamo che la derivata $L'(x)$ in questo caso è una mappa $\mathbb{R}^4 \to \mathbb{R}^4$. Sostituendo nella definizione di omogeneità:
$$L'(x)h = L'(y)h + o(h)$$
Ora scegliamo $h = |h| e_i$ dove $\{e_i\}$ è la base standard di $\mathbb{R}^4$. Moltiplicando per $e_j^T$ e dividendo per $|h|$ abbiamo:
$$e_j^T L'(x)e_i = e_j^T L'(y)e_i + \frac{o(h)}{|h|}$$
Prendendo il limite per $|h|\to 0$ l’ultimo termine sparisce per definizione di $o$ piccolo. Pertanto gli elementi delle due matrici $L'(x)$ e $L'(y)$ sono identici, ovvero $L'(x)=L'(y)$ e quindi $L'(x) = \Lambda$ costante. Integrando otteniamo $L(x) = \Lambda x + a$ dove $a \in \mathbb{R}^4$ costante. Per cui la trasformazione è affine.
Ora consideriamo la quantità
$$ds^2 \equiv -c^2 \Delta t^2+\Delta x^2+\Delta y^2+\Delta z^2$$
dove $c$ è la velocità della luce. Poiché la velocità della luce è costante in ogni sistema di riferimento, un raggio di luce che soddisfa $ds^2=0$ in un sistema $S$ soddisferà $ds’^2 = 0$ in un qualsiasi altro sistema inerziale $S’$.
Inoltre poiché le trasformazioni tra $S$ e $S’$ sono affini, le trasformazioni per le differenze $\Delta t$, $\Delta x$, $\Delta y$, $\Delta z$ sono lineari. Ciò implica che $ds’^2 = \lambda ds^2$ per una qualche costante $\lambda$, come spiegato in questa risposta su Phys.SE. Infatti possiamo vedere $ds^2$ e $ds’^2$ come forme quadratiche sui due spazi $S$ e $S’$. Per $w = (c\Delta t,\Delta x,\Delta y,\Delta z) \in S \cong \mathbb{R}^4$, $w’ = (c\Delta t’,\Delta x’,\Delta y’,\Delta z’) \in S \cong \mathbb{R}^4$:
$$
ds^2(w,w) = -c^2 \Delta t^2+\Delta x^2+\Delta y^2+\Delta z^2\\
ds’^2(w’,w’) = -c^2 \Delta t’^2+\Delta x’^2+\Delta y’^2+\Delta z’^2
$$
Ora poiché la trasformazione tra $S$ e $S’$ è lineare $w’ = \Lambda w$. Pertanto $ds’^2(w’,w’) = ds’^2(\Lambda w,\Lambda w)$. Come abbiamo visto, la costanza della velocità della luce implica che $ds’^2(\Lambda w,\Lambda w)=0$ se e solo se $ds^2(w,w)=0$ per cui le due forme quadratiche (entrambe su $S$) hanno gli stessi zeri. Ma due forme quadratiche con gli stessi zeri sono proporzionali, come è dimostrato nella domanda linkata. Per cui $ds’^2 = \lambda ds^2$.
Resta da dimostrare che $\lambda = 1$. L’argomentazione si può trovare nelle prime pagine di Landau, La teoria classica dei campi. L’argomentazione sopra implica che $\lambda$ è indipendente dalle coordinate. Fisicamente, una trasformazione tra due sistemi inerziali può dipendere solo dalla loro velocità relativa. Le altre trasformazioni (rotazioni) riguardano infatti solo la componente spaziale. Ora dati tre sistemi di riferimento $S$, $S_1$ e $S_2$, chiamiamo $\mathbf v_1$ e $\mathbf v_2$ le velocità di $S_1$ e $S_2$ rispetto ad $S$, e $\mathbf v_{12}$ la velocità relativa tra $S_1$ e $S_2$. Allora abbiamo:
$$
ds^2 = \lambda(\mathbf v_1) ds_1^2\\
ds^2 = \lambda(\mathbf v_2) ds_2^2\\
ds_1^2 = \lambda(\mathbf v_{12}) ds_2^2
$$
Ovvero:
$$\frac{\lambda(\mathbf v_2)}{\lambda(\mathbf v_1)} = \lambda(\mathbf v_{12})$$
ma $\mathbf v_{12}$ dipende non solo dai valori assoluti di $\mathbf v_1$ e $\mathbf v_2$, ma anche dall’angolo tra loro. Tuttavia per l’isotropia dello spazio $\lambda(\mathbf v)$ non può dipendere dalle coordinate angolari, ma solo dal valore assoluto della velocità relativa $\mathbf v$. Nell’ultima formula ottenuta, il membro sinistro non dipende dall’angolo tra le due velocità, mentre $\mathbf v_{12}$ dipende dall’angolo tra i due. Ciò è compatibile con l’isotropia dello spazio solo se $\lambda$ è una costante. Per la stessa formula, $\lambda = 1$ e quindi $ds^2 = ds’^2$.
Ciò dimostra l’invarianza dell’intervallo spaziotemporale. L’intervallo spaziotemporale dev’essere la metrica dello spaziotempo: infatti la metrica si deve annullare sui raggi di luce e per lo stesso teorema utilizzato in precedenza, dev’essere proporzionale all’intervallo invariante. Ciò fissa le trasformazioni di Lorentz: tutte le trasformazioni che preservano l’intervallo spaziotemporale.