Introduzione ai quadrivettori in relatività #1: cos’è un quadrivettore

In questa serie di articoli presentiamo il formalismo dei quadrivettori, utile in relatività. Si presuppone una conoscenza basilare della relatività ristretta e dell’algebra lineare.

Abbiamo lo spaziotempo con coordinate (t,x,y,z). Nelle trasformazioni Galileiane, il tempo t è immutabile e non si mescola con lo spazio; al contrario nelle trasformazioni di Lorentz spazio e tempo si mescolano tra loro. Perciò non ha più senso tenerli separati e invece di usare un vettore solo spaziale, x=(x,y,z), torna utile includere una coordinata temporale, e definiamo:

xμ=(ctxyz)=(ctx)

dove μ è un’indice che va da 0 a 3, così x0=ct, x1=x, ecc. Il c nel tempo serve solo perché tutti gli elementi abbiano le stesse dimensioni, cioè di lunghezza. L’oggetto xμ è chiamato quadrivettore.

A questo punto possiamo introdurre anche un altro oggetto, la derivata parziale:

μ=xμ=(1ctxyz)=(1ct)

Ora, xμ ha l’indice sopra, mentre μ ha l’indice sotto. C’è una differenza tra i due: xμ è detto (quadri)vettoreμ è detto un covettore. Sono solo nomi diversi per dire “indici sopra” o “indici sotto”. (Qualcuno li chiama controvarianti e covarianti, ma è solo terminologia vecchia che non serve a niente). L’unica cosa che dovete ricordare è che c’è una differenza tra un oggetto con indici sopra e con indici sotto.

Una cosa fondamentale da apprendere subito è la convenzione di Einstein. Ogni volta che ci sono due indici ripetuti, uno sopra e uno sotto, c’è una sommatoria sottintesa, in questo senso:

AμBμ=3μ=0AμBμ=A0B0+A1B1+A2B2+A3B3

La convenzione di Einstein ha due regole fondamentali:

  • Se ci sono più di due indici uguali ripetuti la formula è sbagliata.
  • Se gli indici sono tutti e due sotto o tutti e due sopra, la formula è sbagliata.

Possiamo sommare anche più indici in una sola espressione, o averne alcuni non sommati. Ad esempio:

AμνBμγCν=3ν=03μ=0AμνBμγCν=A00B0γC0+A01B0γC1+A10B1γC0+

Capite perché questa notazione salva parecchio spazio. In questo caso A e B sono oggetti con due indici, ovvero “matrici”.

La matrice più semplice è la matrice identità, che chiamiamo δμν:

δμν=(1000010000100001)

In termini di indici δμν=1 se μ=ν e 0 se μν. È anche chiamata “delta di Kronecker“. Ha lo stesso effetto della matrice identità:

xμ=δμνxν=xμ

In quest’ultima formula, la somma è sottintesa, come abbiamo appena visto. In termini più espliciti,

x0=δ0νxν=δ00=1x0+δ01=0x1+δ02=0x2+δ03=0x3=x0

e così via per gli altri componenti. Si può pensare a questa operazione come una moltiplicazione tra una matrice e un vettore espressa in termini di indici. Nel secondo passaggio stiamo sommando lungo l’indice ν; poiché δμν=0 se μν l’unico indice che si salva nella somma è μ.

Un’altra matrice importante è un oggetto particolare che chiamiamo metrica:

ημν=(1000010000100001)

La metrica è importante perché possiamo usarla per alzare e abbassare gli indici nella maniera seguente:

xμ=ημνxν=(ctx)

come potete verificare esplicitamente. Questo vale come definizione di xμ, cioè di x con gli indici sotto. Niente di speciale, solo moltiplicazione tra una matrice e un vettore. Per fortuna la metrica è diagonale quindi è facile farci i conti.

Sappiamo quindi passare da indici sopra a indici sotto, cioè sappiamo abbassare gli indici. Per fare il contrario, cioè per alzare gli indici, usiamo la metrica con gli indici sopra, cioè ημν. Poiché ημν e ημν hanno indici in posizioni diverse sono oggetti in linea di principio diversi. Possiamo provare ad alzare e abbassare gli indici in successione:

xμ=ημνxν=ημνηνγxγ

Notiamo che dobbiamo usare un indice γ: se avessi messo di nuovo μ avrei sottinteso un’altra sommatoria che non dovrebbe esserci. Quindi vediamo che il prodotto (matriciale) tra η con gli indici sotto e η con gli indici sopra agisce come la delta di Kronecker, ovvero come l’identità:

ημνηνγ=δμγ

Ovvero in termini di moltiplicazione tra matrici, ημν moltiplicata con ημν da l’identità, cioè ημν è l’inversa di ημν. Per fortuna stiamo trattando matrici diagonali, quindi:

ημν=(1000010000100001)

che è la stessa matrice che rappresentava ημν.

Attenzione: si potrebbe essere tentati di dire che ημνημν siano uguali. Ciò è sbagliato. I due oggetti sono rappresentati dalla stessa matrice, ma hanno uno gli indici sotto e l’altro gli indici sopra e quindi sono concettualmente distinti.  Quando scriviamo “=” nelle formule sopra, ciò che intendiamo veramente è “rappresentato da”, ma per semplicità scriviamo solo “=”. Non tenere a mente questa distinzione è causa di errori.

Adesso possiamo ad esempio ottenere la derivata parziale con l’indice sopra:

μ=ημν ν=(1ct)

Da notare che tutti questi segni negativi sono difficili da ricordare e poco utili. In termini concreti ciò significa che x è “naturalmente” un vettore (indici sopra), mentre è “naturalmente” un covettore (indici sotto), ed è così che dobbiamo ricordarli. Tutte le altre forme sono forme derivate.

Possiamo anche calcolare la “lunghezza” di un vettore:

xμxμ=ηνμxνxμ=c2t2+x2+y2+z2

Questo è nient’altro che l’intervallo invariante in relatività ristretta. È per questo motivo che scegliamo la metrica in questa maniera.

Appunto laterale: Perché è questa la “lunghezza” del vettore? In R3 la lunghezza del vettore è il prodotto con se stesso, xx. In relatività dobbiamo poter esprimere questo prodotto in termini di indici; poiché abbiamo solo x, l’unico modo di combinarlo con se stesso è di fare il prodotto di x con indice sopra e x con indice sotto, poiché nessun altro è ammesso dalle regole.

Secondo appunto laterale: La differenza tra spazio euclideo e spazio relativistico (di Minkowski) sta in quel 1 che troviamo nella metrica. Nello spazio euclideo la metrica sarebbe identica alla matrice identità, e quindi non comparirebbero i 1 quando alziamo e abbassiamo vettori e covettori, e quindi non ci preoccupiamo di distinguerli. Pertanto anche la lunghezza di un vettore diventerebbe il solito teorema di Pitagora: xμxμ=c2t2+x2+y2+z2.

Nel secondo articolo dell’introduzione spiegheremo come rappresentare le trasformazioni di Lorentz e come cambiano i concetti di velocità ed accelerazione, oltre a dare una prospettiva più generale su tutta questa faccenda.

Questa voce è stata pubblicata in relatività ristretta. Contrassegna il permalink.

Una risposta a Introduzione ai quadrivettori in relatività #1: cos’è un quadrivettore

  1. Enrico scrive:

    grazie! Sto leggendo l “Fondamenti” di Einstein e, francamente, bisogna proprio capire riga per riga.

Rispondi a EnricoAnnulla risposta

Questo sito utilizza Akismet per ridurre lo spam. Scopri come vengono elaborati i dati derivati dai commenti.