1. 전자기 방정식 유도
먼저 퍼텐셜을 생각해 보자. 전자기학에는 전기 스칼라 퍼텐셜 [math(\phi)]와[1] 벡터 퍼텐셜 [math(\vec{A})]이 존재한다. 물론 이들은 뉴턴 역학의 관점에서 볼 때에만 스칼라니 벡터이니 하는 것이고 상대성 이론에서는 그렇지 않다. 만약 [math(A^0)]를 [math(\dfrac{\phi}{c})]로, [math(A^i)] ([math(i = 1, 2, 3)])을 [math((\vec{A})_i)]로 하여 [math(A^\mu)]를 정한다면, 맥스웰 방정식을 적용시켜서 [math(A^\mu)]가 4차원 벡터임을 보일 수 있다.이제부터 우리는 맥스웰 방정식과 관련된 관계식을 잊어버릴 것이다. 즉, 전자기학 자체를 완전히 까먹어버릴 것이다. 다만 한 가지 남겨 둘 것은 어떤 4차원 벡터 퍼텐셜 [math(A^\mu)]가 있어 이 퍼텐셜로부터 얻어지는 장이 상대성 이론에 잘 부합한다는 것이다. 몇 가지 더 필요한 것이 있는데 그것은 나중에 설명하기로 하고 여기서부터 출발하여 [math(A^\mu)]가 어떻게 행동해야 하는가를 살펴보도록 하겠다.
이하 설명은 Landau, Lifshitz의 The Classical theory of Fields를 따랐다. 본문하고 약간 다를 텐데, 4차원 속도 벡터의 정의라든가 단위(특히 c가 들어가는가 아닌가) 같은 것 때문이다.
1.1. 로런츠 힘
먼저 우리는 어떤 입자의 운동이 이 퍼텐셜에 의하여 변하기를 기대한다. 위에서 우리는 자유 입자의 액션을 다뤘었다. 이번엔 대신에 퍼텐셜 [math(A^\mu)]의 영향을 받는 입자의 액션을 다뤄 보겠다. 일단 그 액션에는 자유 입자의 퍼텐셜이 들어가긴 해야 할 것이다. 그 다음에 들어가야 할 것은 입자와 퍼텐셜이 엮여 있는(coupling) 스칼라인데, 가장 간단한 꼴은 다음과 같을 것이다.[math(\displaystyle \int (-q A_\mu \, dx^\mu))]
위 식이 로런츠 변환에 대해 불변하다는 것은 쉽게 확인할 수 있다. 언뜻 보면 퍼텐셜만 들어가 있는 것으로 보이는데, 비록 좌표의 정보만 주어져 있지만 [math(dx^\mu)]가 들어가 있는 것으로도 이미 퍼텐셜은 입자의 위치 정보와 엮여 있는 것으로 볼 수 있다. 맨 앞에 붙은 [math(q)]는 (coupling) 상수인데, 위에서 질량이 그랬던 것처럼 이 값도 나중에 그 의미가 밝혀질 것이다. 이제 입자의 총 액션은 다음과 같을 것이다.
[math(S = \displaystyle \int (-mc^2 \, d\tau - q A_\mu \, dx^\mu))]
이제 이 식에서 변분법이라든가 오일러-라그랑주 방정식을 취한다든가 하는 방식[2]으로 방정식을 뽑아내면 다음과 같은 입자의 운동 방정식을 얻는다.
[math(m \dfrac{du_\mu}{d\tau} = q (\partial_\mu A_\nu - \partial_\nu A_\mu) u^\nu)]
여기서 [math(u_\mu = \eta_{\mu \nu} u^\nu)]로, [math(u^\nu)]는 위에서 정의된 상대론적 속도 [math(dx^\nu / d\tau)]이다. 또한 각 [math(\mu)]에 대해 [math(\partial_\mu)]는 [math(\partial / \partial x^\mu)]로 정의된다. 이제
[math(F_{\mu \nu} = \partial_\mu A_\nu - \partial_\nu A_\mu)]
라고 정하면 위 운동 방정식은 다음과 같이 쓸 수 있다.
[math(m \dfrac{du_\mu}{d\tau} = q F_{\mu \nu} u^\nu)]
이제
[math(E_i = cF_{0i}, B_1 = -F_{23}, B_2 = F_{13}, B_3 = -F_{12})]
라고 표기하자. 사실 이 표기대로라면 [math(F_{\mu \nu})]의 정의와 [math(A^\mu = (\phi / c, (\vec{A})_1, (\vec{A})_2, (\vec{A})_3))](그래서 [math(A_\mu = (\phi / c, -(\vec{A})_1, -(\vec{A})_2, -(\vec{A})_3))])의 정의에 따라 다음을 얻는다.
[math(E_i = c(\partial_0 A_i - \partial_i A_0) = c\left( \dfrac{1}{c} \dfrac{\partial}{\partial t} (-\vec{A}_i) - \dfrac{\partial}{\partial x^i} \dfrac{\phi}{c} \right) = \left( -\dfrac{\partial \vec{A}}{\partial t} - \vec{\nabla} \phi \right)_i)]
[math(B_1 = -\left( \dfrac{\partial (-(\vec{A})_3)}{\partial x^2} - \dfrac{\partial (-(\vec{A})_2)}{\partial x^3} \right) = (\vec{\nabla} \times \vec{A})_1)]
[math(B_2 = +\left( \dfrac{\partial (-(\vec{A})_1)}{\partial x^3} - \dfrac{\partial (-(\vec{A})_3)}{\partial x^1} \right) = (\vec{\nabla} \times \vec{A})_2)]
[math(B_3 = -\left( \dfrac{\partial (-(\vec{A})_1)}{\partial x^2} - \dfrac{\partial (-(\vec{A})_2)}{\partial x^1} \right) = (\vec{\nabla} \times \vec{A})_3)]
이것은 전자기학에서 퍼텐셜들로 우리가 알고 있는 전기장과 자기장을 표현한 것들이다. 우리는 전자기학 자체를 잊어버리고 있었는데, 이것들이 갑툭튀했다. 뭔가 희한하지만 이걸로 희한해 하기에는 이르다. 아무튼, 이 사실들로부터 [math(\mu = i = 1, 2, 3)]에 대하여 위 운동 방정식은 다음과 같이 써진다. (정의로부터 [math(F_{\nu \mu} = -F_{\mu \nu})]임을 보자.)
[math(m \dfrac{du_i}{d\tau} = -\gamma \dfrac{d( \gamma m \vec{v})_i}{dt} = q (-\gamma (\vec{E})_i - \gamma \sum_{j, k = 1, 2, 3} \epsilon_{ijk} v_j B_k) = -\gamma q (\vec{E} + \vec{v} \times \vec{B})_i)]
([math(\epsilon_{ijk})]는 레비치비타 기호. 자세한 내용은 항목을 참조하자. 간단히 말해서 세 변수 중 두 개 이상이 같으면 0, 전부 다를 경우 그 배열이 1, 2, 3에 호환을 홀수 개를 곱해서 끌어낼 수 있는 순서라면 -1, 짝수 개의 곱으로 끌어내는 순서라면 1이다.)
이제 식을 정리하면 다음과 같음을 알 수 있다.
[math(\dfrac{d \vec{p}}{dt} = q(\vec{E} + \vec{v} \times \vec{B}))]
여기서 [math(\vec{p})]는 (상대론적) 3차원 운동량이다. 이것은 정확하게 로렌츠 힘 방정식이다. 앞에서 우리는 맥스웰 방정식, 즉 전자기학 전부를 잊어버리기로 했었다. 그러면 당연히 로렌츠 힘 방정식도 같이 모르는 것이 되어야 한다. 그런데 단지 상대성 이론에 맞도록, 즉 로렌츠 불변성이도록 벡터 퍼텐셜과 상호작용하는 입자의 운동을 기술한 것만으로도 기존의 운동 방정식이 툭 튀어 나온 것이다!
1.2. 맥스웰 방정식
더 나아가 보자. 위에서 얻은 액션은 '입자 만의 항'과 '입자-퍼텐셜 간의 coupling 항' 이렇게 두 개가 있었다. 그런데 제대로 된 액션이라면 사실 '장 만의 항'도 필요하다. 일단 '입자 만의 항'이 있으니 이것은 당연해 보인다. 즉, 액션에는 다른 것 없이 장(퍼텐셜)의 정보만 담고 있는 항이 있어야 한다는 것이다. 이것을 제대로 쓰기 위해 보면 사실 적분 [math(\displaystyle \int d\tau)]는 부적합하다. 이미 입자의 정보([math(\tau)])가 들어가 있기 때문이다. 따라서 입자의 정보가 없을 법한 적분을 써야 하는데, 가장 적합한 적분이 바로 [math(\displaystyle \int d^4 x = \int d(ct) \, dx \, dy \, dz)]이다. 겉보기엔 좌표가 써져 있어서 좌표에 의존인 것 같이 보이지만 실제로 로렌츠 변환을 취해 보면 저 적분은 전혀 변하지 않는다는 것을 확인할 수 있다.적분을 찾았으니 이번엔 적분할 대상, 즉 라그랑지언[3]을 찾아야 한다. 이 라그랑지안은 물론 스칼라이어야 할 것이며 퍼텐셜, 그리고 그 도함수만으로 구성되어 있어야 한다. 그런데 문제가 있다. 사실 퍼텐셜 [math(A^\mu)]는 유일하게 정해지지 않는다. 무슨 말이냐면 어떤 [math(A^\mu)]로 운동 방정식 [math(m \dfrac{du_\mu}{dt} = qF_{\mu \nu} u^\nu)]을 결정했을 때, 이 운동 방정식이 전혀 바뀌지 않으면서 정작 [math(A^\mu)]는 바뀌도록 퍼텐셜에 변화를 줄 수 있다는 것이다. 정확하게는 임의의 (모든 점에서 2차 미분이 연속인) 함수 [math(\Lambda)]에 대하여
[math(A^\mu \to A^\mu + \dfrac{q}{c} \partial^\mu \Lambda)][4]
인 변환은 [math(F_{\mu \nu})]를 전혀 바꾸지 않으며 따라서 입자의 운동 방정식은 바뀌지 않는다. 이러한 변환을 게이지 변환이라고 부르는데, 정작 운동 방정식은 게이지 변환을 가해도 변하지 않는다. 이러한 것을 게이지 대칭 혹은 게이지 불변이 있다고 말한다. 비록 액션의 입자-장 coupling 항에는 [math(A^\mu)]가 직접 들어가나, 사실 별 상관이 없는 게, 실제로 나타나는 현상은 액션보다도 운동 방정식에서 드러나기 때문이다.
하지만 장만을 위한 액션 항에는 [math(A^\mu)]와 그 도함수가 단독으로 직접 들어갈 수 없는데, 만약 들어가면 결국 게이지 대칭성이 깨지기 때문이다.[5] 따라서 (게이지 대칭성을 유지하면서) 장의 액션에 들어갈 라그랑지안을 만들 유일한 방법은 [math(A^\mu)]와 그 도함수를 직접 넣지 않고 대신 [math(F_{\mu \nu})]만으로 구성하는 것뿐이다. 물론 라그랑지안은 스칼라이어야 하고, 예를 들어 [math(\eta^{\mu \alpha} \eta^{\nu \beta} F_{\mu \nu} F_{\alpha \beta} = F_{\mu \nu} F^{\mu \nu})] 같은 것이 있다. ([math(\eta^{\mu \nu})]는 [math(\eta_{\mu \nu})]의 '역행렬'로 이해하는 것이 좋다. 사실 [math(\eta_{\mu \nu} \eta^{\nu \lambda} = \delta_\mu^\lambda)]로 정의되기 때문이다.)
그런데 나중에 보겠지만 이보다 더 복잡한 것이 들어가면 장의 방정식이 선형성을 가지지 못 하게 된다. 그렇게 되면 중첩원리(superposition principle)가 만족되지 못하게 된다. 따라서 라그랑지안에 들어갈 수 있는 스칼라는 결국 [math(F_{\mu \nu} F^{\mu \nu})] 뿐이라는 것을 알 수 있다. 여기에 어떤 상수가 곱해질 수 있을텐데, 만약 그 상수가 양수라면 액션이 최대가 될 수는 있어도 최소는 되지 못한다는 것을 금방 볼 수가 있다. 결국 이런 것을 종합하면 장을 위한 액션은 다음과 같아짐을 알 수 있다.
[math(\displaystyle \int \left( -\dfrac{1}{4\mu_0} \right) F_{\mu \nu} F^{\mu \nu} \, d^4 x)]
여기서 [math(1/4\mu_0)]는 최종 결과를 우리가 알고 있던 결과와 맞추기 위해 쓰인 값인데, 사실 단위에 의존하는 값이라 별로 중요한 것은 아니다.[6] 아무튼 최종적으로 입자와 벡터 퍼턴셜에 의한 장을 포함하는 액션은 다음과 같아야 한다.
[math(S = \displaystyle \int \left( -mc^2 \, d\tau - q A_\mu \, dx^\mu - \frac{1}{4\mu_0} F_{\mu \nu} F^{\mu \nu} \, d^4 x \right))]
이 결과는 로렌츠 불변성과 추가로 게이지 대칭성, 그리고 중첩원리를 요구하였을 때 얻어진 액션이다.
한편, [math(q = \displaystyle \int \rho \, d^3 x)]로 쓰면 입자-장 항을 좀 다르게 써 볼 수 있다. 지금은 입자 하나만 다루고 있으므로 사실 [math(\rho)]는 델타 함수 꼴로 써질 수 있다. 이 점을 감안하면 [math(qA_\mu dx^\mu)]는 [math(\displaystyle \int \rho A_\mu \, dx^\mu \, d^3 x)]와 같이 써질 수 있는데, 이를 이용하면 다음과 같이 입자-장 액션항을 쓸 수 있다.
[math(\displaystyle \int qA_\mu \, dx^\mu = \iint \rho A_\mu \, dx^\mu \, d^3 x = \iint \rho A_\mu \frac{dx^\mu}{d\tau} \, d\tau \, d^3 x = \int A_\mu \left( \gamma^{-1} \rho \frac{dx^\mu}{d\tau} \right) \, dt \, d^3 x = \int A_\mu j^\mu \, d^4 x)]
여기서 [math(j^\mu = \gamma^{-1} \rho \dfrac{dx^\mu}{d\tau} = (c\rho, \rho \vec{v}) = (c\rho, \vec{j}))]이다. 물론 이 식은 입자 하나의 경우에면 따진 것이지만, 입자가 여러 개인 경우라도 이 입자-장 액션 항은 입자 각각에 대해 따질 수 있고, 위와 같은 변형이 각각에 대해 가능하다. 그리고 최종적으로 변형된 결과는 입자-장 액션항이 [math(j^\mu)]에 대해 선형이므로 ([math(A^\mu)]는 하나이므로 이 액션 항에서 [math(j^\mu)]를 제외한 모든 것은 각 입자에 대해 다 똑같다.) 결국 액션항 [math(\displaystyle \int A_\mu j^\mu \, d^4 x)]는 입자의 수에 상관 없이 항상 맞는 식이라고 볼 수 있다. 이 문서에서는 단순함을 위해 입자 하나만 있는 경우를 생각할 뿐이지만, 이렇게 일반화시킬 수 있다.
어쨌든 이 결과를 최종 액션에 대입하면 다음을 얻는다.
[math(S = \displaystyle \int \left( -mc^2 \, d\tau - A_\mu j^\mu \, d^4 x - \frac{1}{4\mu_0} F_{\mu \nu} F^{\mu \nu} \, d^4 x \right) = \int \left( -mc^2 \, d\tau - \left( A_\mu j^\mu + \frac{1}{4\mu_0} F_{\mu \nu} F^{\mu \nu} \right) \, d^4 x \right))]
이제 할 일은 장 만을 위한 방정식을 구하는 것이다. [math(A^\mu)]에 대한 변분을 취해 주면 결국 다음 방정식을 얻게 된다.
[math(\partial_\mu F^{\mu \nu} = \mu_0 j^\nu)]
위에서 정의한 [math(\vec{E})], [math(\vec{B})]로 위 방정식을 표기해 [math(\nu)] 별로 정리하면 다음 방정식을 얻는다. (여기서 먼저 [math(E_i = -cF^{0i})], [math(B_1 = -F^{23})], [math(B_2 = F^{13})], [math(B_3 = -F^{12})]임을 보고 가자.)
[math(\nu = 0)]일 때
[math(c \partial_\mu F^{\mu 0} = c \left( \dfrac{\partial (E_1/c)}{\partial x^1} + \dfrac{\partial (E_2/c)}{\partial x^2} + \dfrac{\partial (E_3/c)}{\partial x^3} \right) = \vec{\nabla} \cdot \vec{E} = c \mu_0 (c\rho) = c^2 \mu_0 \rho)]
[math(\nu = 1)]일 때[math(\partial_\mu F^{\mu 1} = \dfrac{\partial (-E_1/c)}{\partial x^0} + \dfrac{\partial (+B_3)}{\partial x^2} + \dfrac{\partial (-B_2)}{\partial x^3} = -\dfrac{1}{c^2} \dfrac{\partial E_1}{\partial t} + (\vec{\nabla} \times \vec{B})_1 = \left( \vec{\nabla} \times \vec{B} - \dfrac{1}{c^2} \dfrac{\partial \vec{E}}{\partial t} \right)_1 = \mu_0 (\vec{j})_1)]
나머지 [math(\nu = 2, 3)]인 경우는 [math(\nu = 1)]인 경우에서와 비슷한 방법으로 전개시킬 수 있고, 그 결과도 비슷하다. 이제 [math(\varepsilon_0 = 1/c^2 \mu_0)]로 표기하면, 결국 다음 두 방정식을 얻는다.
[math(\vec{\nabla} \cdot \vec{E} = \dfrac{\rho}{\varepsilon_0})]
[math(\vec{\nabla} \times \vec{B} - \dfrac{1}{c^2} \dfrac{\partial \vec{E}}{\partial t} = \mu_0 \vec{j})]
이것은 정확하게 가우스 법칙과 앙페르-맥스웰 법칙과 일치한다. 한편, [math(F_{\mu \nu} = \partial_\mu A_\nu - \partial_\nu A_\mu)]로부터 다음을 얻을 수 있다.
[math(\partial_\mu F_{\nu \lambda} + \partial_\nu F_{\lambda \mu} + \partial_\lambda F_{\mu \nu} = 0)]
이걸 정리하든가, 아니면 위에서 구했던 [math(\vec{E} = -\dfrac{\partial \vec{A}}{\partial t} - \vec{\nabla} \phi)]와 [math(\vec{B} = \vec{\nabla} \times \vec{A})]를 잘 정리해서 다음 두 방정식을 얻을 수 있다.
[math(\vec{\nabla} \times \vec{E} + \dfrac{\partial \vec{B}}{\partial t} = 0)]
[math(\vec{\nabla} \cdot \vec{B} = 0)]
이것들은 정확하게 패러데이의 법칙과 자기장에 대한 가우스 법칙이다. 이렇게 해서 우리가 잊어버렸던 맥스웰 방정식들이 모조리 다시 나타난 것이다! 즉, 로렌츠 불변성(과 게이지 불변성, 중첩원리[7])을 가정한 것만으로도 4차원 벡터 퍼텐셜이 만드는 장은 반드시 맥스웰 방정식을 만족해야 하며 결국 우리가 아는 전자기장이 모두 튀어나온 것이다. 이런 식으로 상대성 이론은 우리가 아는 자연 법칙이 왜 그런 것이어야 하는지를 답해 주는 데 있어서 결정적인 역할을 해 준다.[8]
[1] 많은 책에서 V로도 표기하는데, 좀 더 높은 레벨의 물리학으로 가면 [math(\phi)]로 흔히 표기한다. 당장 그리피스만 봐도... 여기서도 그렇게 표기한다.[2] [math(u^\mu u_\nu = c^2)]와 [math(dx^\mu = u^\mu d\tau)]을 이용한다.[3] 사실 적분이 시간에 대한 적분에서 시간 x 3차원 부피에 대한 적분으로 바뀌었으니 라그랑지안을 다르게 부르는 것이 맞는다. 3차원 부피가 적분으로 들어갔으니 그 이름을 라그랑지안 밀도로 흔히 부르는데, 이마저도 귀찮아서 라그랑지안 밀도를 그냥 라그랑지안으로 부르는 경우가 많다. 이 문서에서도 그럴 것이다.[4] 앞의 상수는 전통적으로 붙이는 것인데, 양자역학에서 페르미온 파동함수(혹은 장)에 가해지는 변형을 고려하면 저런 상수가 붙는 것이 자연스러워진다.[5] 이 사실은 중요한 결과 중 하나를 가져 온다. 만약 라그랑지안에 [math(A_\mu A^\mu)] 같은 항이 들어간다면, 이 항은 장을 '양자화'했을 때 얻어지는 입자의 질량을 결정해 준다는 것을 양자장론에서 알 수 있다. 즉, 저 항이 들어가 있으면, 혹은 저 항의 계수가 0이 아니면 ([math(m^2)]로 주어진다면) 장의 양자, 그러니까 매개 입자(전자기장의 경우엔 광자)는 질량 [math(m)]를 갖게 된다. 그래서 저런 항을 질량항(mass term)이라고 부른다. 하지만 본문에서는 게이지 대칭성 때문에 저런 질량항이 라그랑지안에 포함되지 못한다는 것을 말하고 있다. 결국 게이지 대칭성은 광자의 질량이 0이기를 요구한다는 것이다. 그런데 이것은 모든 양-밀스 장 이론에 해당하는 것이지만 정작 약력의 매개 입자들(W+, W-, Z0)는 질량을 가진다는 게 문제였다. 이것을 해결해 준 것이 바로 그 유명한 힉스 매커니즘. 간단하게 말해서 힉스 장이 게이지 대칭성을 깨서 양-밀스 장이 질량항을 가질 수 있도록 한 것이다.[6] 설명 그대로 단위 시스템을 무엇으로 잡느냐에 따라 다른 값이다. SI 단위계에서는 [math(4\pi \times 10^{-7} N \cdot A^{-2})]로 정의되는데, 이게 귀찮았던 건지(...) 다른 여러 좌표계에선 더 단순해진다. Landau, Lifshitz에서는 아예 뒤에 붙은 단위와 order까지 다 떼고 [math(4\pi)]라고만 쓴다. Peskin 같은 양자장론에서는 더 심한데, 이 책들에서는 [math(\mu_0)]를 아예 1로 놔 버린다.(...) c도 1로 놓는 마당에 이게 말이 되는 이유는 사실 전하 혹은 전류의 단위를 쿨롱(Q)이나 암페어(A)가 아닌 다른 단위로 쓸 수 있기 때문이다.[7] 사실 중첩원리는 조금 곁다리 같다. 어떤 불변성은 아니기 때문에 그렇다. 고전적으로는 '단순함' 혹은 선형성을 기대할 수 있기에 중첩원리는 필요해 보이지만 그 이상의 설명은 곤란하다. 게다가 더 복잡한 게이지 대칭성을 요구하게 되면 [math(F_{\mu \nu} F^{\mu \nu})]만 라그랑지안에 들어가도 이미 장방정식은 비선형이 되기 때문에 중첩원리를 적용시키기는 곤란해진다. 하지만 양자장론으로 가면 이야기가 달라진다. 이때에는 이론의 재규격화 가능성(renormalizability)이 필요해지는데, 그러면 중첩원리 없이도 가능한 스칼라가 [math(F_{\mu \nu} F^{\mu \nu})] 하나뿐이라는 것을 밝힐 수 있게 된다! 자세한 내용은 게이지 장을 공부해 볼 것.[8] 물론 물리학은 자연과학이고 따라서 실험에 의해 모든 것이 검증되어야 하는 것이다. 비록 정말 몇 개 안 되는 자연스러운 가정들만으로 맥스웰 방정식이 '유도'되었지만 그 출발은 어디까지나 '가정'이었고 모두 검증받아야 할 것들이다. 사실 이렇게 그럴싸한 원리들을 가정하는 식으로 수많은 이론들이 세상에 등장했지만 결국 검증에 의해 많은 이론들이 틀린 것으로 밝혀졌다. 이런 것들을 주의하면서 이 내용을 읽어야 할 것이다. 이런 주의사항은 맨 처음에 써야 하는 거 아닌가