La teoria della relatività ristretta si basa su due assiomi fondamentali:
- il principio di relatività, secondo cui le leggi della fisica sono le stesse in tutti i sistemi di riferimento inerziali.
- la costanza della velocità della luce, secondo cui la velocità della luce è la stessa in tutti i sistemi di riferimento inerziali.
Questi due assiomi sono sufficienti per ricavare le trasformazioni di Lorentz, e non possiamo fare a meno di uno dei due.
Dal principio di relatività possiamo ricavare le due conseguenze seguenti:
- Isotropia dello spaziotempo. Per isotropia intendiamo la libertà di ruotare gli assi delle coordinate in qualsiasi direzione. L’isotropia segue per il motivo seguente: se un corpo si muove a velocità costante nel sistema S, allora si muoverà di velocità costante anche nel sistema ruotato S′. Per cui se S è inerziale, lo è anche S′. Ma le leggi della fisica sono le stesse in tutti i sistemi di riferimento inerziali, per cui S e S′ sono equivalenti e lo spaziotempo è isotropo.
- Omogeneità dello spaziotempo. Per omogeneità intendiamo la libertà di traslare l’origine degli assi di coordinate. La dimostrazione è la stessa del caso precedente.
Va notato che queste due proprietà non hanno nulla a che fare con l’isotropia e l’omogeneità della materia, adoperate ad esempio in cosmologia: queste sono appunto proprietà della materia, che non hanno nulla a che fare con le proprietà dello spaziotempo.
Dati due sistemi di riferimento inerziali S e S′, esisterà una funzione che relaziona S ed S′, cioè una trasformazione. Possiamo dimostrare che l’omogeneità dello spaziotempo implica che le trasformazioni tra sistemi di riferimento inerziali sono affini (cioè lineari più una costante). La dimostrazione segue questa risposta su Phys.SE.
Supponiamo di avere una trasformazione L:R4→R4. Per l’omogeneità dello spazio, dobbiamo avere per ogni x,y,h∈R4
L(x+h)−L(y+h)=L(x)−L(y)
Dobbiamo supporre che L sia derivabile, ma questa può essere considerata una supposizione tecnica. Per la definizione di derivabilità:
L(x+h)=L(x)+L′(x)h+o(h)
Ricordiamo che la derivata L′(x) in questo caso è una mappa R4→R4. Sostituendo nella definizione di omogeneità:
L′(x)h=L′(y)h+o(h)
Ora scegliamo h=|h|ei dove {ei} è la base standard di R4. Moltiplicando per eTj e dividendo per |h| abbiamo:
eTjL′(x)ei=eTjL′(y)ei+o(h)|h|
Prendendo il limite per |h|→0 l’ultimo termine sparisce per definizione di o piccolo. Pertanto gli elementi delle due matrici L′(x) e L′(y) sono identici, ovvero L′(x)=L′(y) e quindi L′(x)=Λ costante. Integrando otteniamo L(x)=Λx+a dove a∈R4 costante. Per cui la trasformazione è affine.
Ora consideriamo la quantità
ds2≡−c2Δt2+Δx2+Δy2+Δz2
dove c è la velocità della luce. Poiché la velocità della luce è costante in ogni sistema di riferimento, un raggio di luce che soddisfa ds2=0 in un sistema S soddisferà ds′2=0 in un qualsiasi altro sistema inerziale S′.
Inoltre poiché le trasformazioni tra S e S′ sono affini, le trasformazioni per le differenze Δt, Δx, Δy, Δz sono lineari. Ciò implica che ds′2=λds2 per una qualche costante λ, come spiegato in questa risposta su Phys.SE. Infatti possiamo vedere ds2 e ds′2 come forme quadratiche sui due spazi S e S′. Per w=(cΔt,Δx,Δy,Δz)∈S≅R4, w′=(cΔt′,Δx′,Δy′,Δz′)∈S≅R4:
ds2(w,w)=−c2Δt2+Δx2+Δy2+Δz2ds′2(w′,w′)=−c2Δt′2+Δx′2+Δy′2+Δz′2
Ora poiché la trasformazione tra S e S′ è lineare w′=Λw. Pertanto ds′2(w′,w′)=ds′2(Λw,Λw). Come abbiamo visto, la costanza della velocità della luce implica che ds′2(Λw,Λw)=0 se e solo se ds2(w,w)=0 per cui le due forme quadratiche (entrambe su S) hanno gli stessi zeri. Ma due forme quadratiche con gli stessi zeri sono proporzionali, come è dimostrato nella domanda linkata. Per cui ds′2=λds2.
Resta da dimostrare che λ=1. L’argomentazione si può trovare nelle prime pagine di Landau, La teoria classica dei campi. L’argomentazione sopra implica che λ è indipendente dalle coordinate. Fisicamente, una trasformazione tra due sistemi inerziali può dipendere solo dalla loro velocità relativa. Le altre trasformazioni (rotazioni) riguardano infatti solo la componente spaziale. Ora dati tre sistemi di riferimento S, S1 e S2, chiamiamo v1 e v2 le velocità di S1 e S2 rispetto ad S, e v12 la velocità relativa tra S1 e S2. Allora abbiamo:
ds2=λ(v1)ds21ds2=λ(v2)ds22ds21=λ(v12)ds22
Ovvero:
λ(v2)λ(v1)=λ(v12)
ma v12 dipende non solo dai valori assoluti di v1 e v2, ma anche dall’angolo tra loro. Tuttavia per l’isotropia dello spazio λ(v) non può dipendere dalle coordinate angolari, ma solo dal valore assoluto della velocità relativa v. Nell’ultima formula ottenuta, il membro sinistro non dipende dall’angolo tra le due velocità, mentre v12 dipende dall’angolo tra i due. Ciò è compatibile con l’isotropia dello spazio solo se λ è una costante. Per la stessa formula, λ=1 e quindi ds2=ds′2.
Ciò dimostra l’invarianza dell’intervallo spaziotemporale. L’intervallo spaziotemporale dev’essere la metrica dello spaziotempo: infatti la metrica si deve annullare sui raggi di luce e per lo stesso teorema utilizzato in precedenza, dev’essere proporzionale all’intervallo invariante. Ciò fissa le trasformazioni di Lorentz: tutte le trasformazioni che preservano l’intervallo spaziotemporale.