선형대수학 Linear Algebra | |||
{{{#!wiki style="margin: 0 -10px -5px; min-height: calc(1.5em + 5px)" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -5px -1px -11px" | <colbgcolor=#006ab8> 기본 대상 | 일차함수 · 벡터 · 행렬 · 선형 변환 | |
대수적 구조 | 가군(모듈) · 벡터 공간 · 내적 공간 · 노름 공간 | ||
선형 연산자 | <colbgcolor=#006ab8> 기본 개념 | 연립방정식(1차 · 2차) · 행렬곱 · 단위행렬 · 역행렬과 크라메르 공식 · 가역행렬 · 전치행렬 · 행렬식(라플라스 전개) · 주대각합 | |
선형 시스템 | 기본행연산과 기본행렬 · 가우스-조르당 소거법 · 행사다리꼴 · 행렬표현 · 라그랑주 보간법 | ||
주요 정리 | 선형대수학의 기본정리 · 차원 정리 · 가역행렬의 기본정리 · 스펙트럼 정리 | ||
기타 | 제곱근행렬 · 멱등행렬 · 멱영행렬 · 에르미트 행렬 · 야코비 행렬 · 방데르몽드 행렬 · 아다마르 행렬 변환 · 노름(수학) | ||
벡터공간의 분해 | 상사 · 고유치 문제 · 케일리-해밀턴 정리 · 대각화(대각행렬) · 삼각화 · 조르당 분해 | ||
벡터의 연산 | 노름 · 거리함수 · 내적 · 외적(신발끈 공식) · 다중선형형식 · ∇ · 크로네커 델타 | ||
내적공간 | 그람-슈미트 과정 · 수반 연산자(에르미트 내적) | ||
다중선형대수 | 텐서 · 텐서곱 · 레비치비타 기호 | }}}}}}}}} |
1. 개요
전치행렬(轉置行列, transpose, 기호는 [math( \square^{T} )][1] )이란 행렬 내의 원소를 대각선축(주대각성분)을 기준으로 서로 위치를 바꾼 것을 말한다. 즉, [math( m\times n )] 행렬의 전치행렬은 [math( n\times m )] 행렬이 된다. 이때 기호는 전치를 뜻하는 영단어 transpose의 머리글자를 위첨자로 사용하여 [math(A^{T} )]로 나타낸다.임의의 한 행렬 [math( A )]에 대하여 다음이 성립한다.[math(\displaystyle {A^{T}}_{ij}=A_{ji} )]
2. 성질
그 곱이 정의되는 임의의 두 행렬 [math(A, B)]과 임의의 실수 [math(a, b, k)]에 대하여 다음이 성립한다.- [math(A)]가 [math(m\times n)] 행렬이면 [math(A^T)]는 [math(n\times m)] 행렬이다.
- [math((A^T)^T=A)]
- [math(kA^T=(kA)^T)]
- [math((A+B)^T=A^T+B^T)]
- [math((aA+bB)^T=aA^T+bB^T)]
- 증명 : [math((aA+bB)^T=(aA)^T+(bB)^T=aA^T+bB^T)]
- [math((AB)^T=B^TA^T)]
- 증명 : [math(A, B)]가 각각 [math(m\times n, n\times r)] 행렬일 때,
[math(A=\begin{bmatrix}a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn}\end{bmatrix}, B=\begin{bmatrix}b_{11} & b_{12} & \cdots & b_{1r} \\ b_{21} & b_{22} & \cdots & b_{2r} \\ \vdots & \vdots & \ddots & \vdots \\ b_{n1} & b_{n2} & \cdots & b_{nr}\end{bmatrix})] 일 때, [math(AB=\begin{bmatrix}\sum_k a_{1k}b_{k1} & \sum_k a_{1k}b_{k2} & \cdots & \sum_k a_{1k}b_{kr} \\ \sum_k a_{2k}b_{k1} & \sum_k a_{2k}b_{k2} & \cdots & \sum_k a_{2k}b_{kr} \\ \vdots & \vdots & \ddots & \vdots \\ \sum_k a_{mk}b_{k1} & \sum_k a_{mk}b_{k2} & \cdots & \sum_k a_{mk}b_{kr}\end{bmatrix})] 이고 이것은 [math(m\times r)] 행렬이다. 따라서 다음과 같다.[math((AB)^T=\begin{bmatrix}\sum_k a_{1k}b_{k1} & \sum_k a_{2k}b_{k1} & \cdots & \sum_k a_{mk}b_{k1} \\ \sum_k a_{1k}b_{k2} & \sum_k a_{2k}b_{k2} & \cdots & \sum_k a_{mk}b_{k2} \\ \vdots & \vdots & \ddots & \vdots \\ \sum_k a_{1k}b_{kr} & \sum_k a_{2k}b_{kr} & \cdots & \sum_k a_{mk}b_{kr}\end{bmatrix})] 한편, [math(A^T, B^T)]는 각각 [math(n\times m, r\times n)] 행렬이고 다음과 같다. [math(A^T=\begin{bmatrix}a_{11} & a_{21} & \cdots & a_{m1} \\ a_{12} & a_{22} & \cdots & a_{m2} \\ \vdots & \vdots & \ddots & \vdots \\ a_{1n} & a_{2n} & \cdots & a_{mn}\end{bmatrix}, B^T=\begin{bmatrix}b_{11} & b_{21} & \cdots & b_{n1} \\ b_{12} & b_{22} & \cdots & b_{n2} \\ \vdots & \vdots & \ddots & \vdots \\ b_{1r} & b_{2r} & \cdots & b_{nr}\end{bmatrix})] 이므로 [math(B^TA^T=(AB)^T)]가 성립한다. 이때 [math(B^TA^T)]는 [math(r\times m)] 행렬이다. |
참고로 위 증명에서 [math(A^TB^T)]는 행렬의 크기가 맞지 않으므로 정의되지 않는다.
* 행렬의 곱 [math(ABC)]가 정의되는 행렬 [math(C)]에 대하여, [math((ABC)^T=C^TB^TA^T)]
다음은 일반적으로 성립하지 않는 것이다.* 행렬의 곱 [math(ABC)]가 정의되는 행렬 [math(C)]에 대하여, [math((ABC)^T=C^TB^TA^T)]
* 증명 : [math((ABC)^T=C^T(AB)^T=C^TB^TA^T)]
* 같은 방법으로 [math((A_1A_2...A_n)^T=A_n^T...A_2^TA_1^T)]임을 알 수 있다.
* 같은 방법으로 [math((A_1A_2...A_n)^T=A_n^T...A_2^TA_1^T)]임을 알 수 있다.
- [math(A^TA=AA^T)]
- 반례: [math(A=\begin{bmatrix}1 & 2 \\ 3 & 4\end{bmatrix})]일 때, [math(A^T=\begin{bmatrix}1 & 3 \\ 2 & 4\end{bmatrix})]이고 [math(AA^T=\begin{bmatrix}5 & 11 \\ 11 & 25\end{bmatrix}, A^TA=\begin{bmatrix}10 & 14 \\ 14 & 20\end{bmatrix})]이다.
- [math(A)]가 정사각행렬이 아니면 계산 결과 행렬의 크기 자체가 달라지기 때문에 오히려 항상 성립하지 않는다. 예를 들어 [math(A=\begin{bmatrix}1 & 2 & 3\end{bmatrix})]이면 [math(AA^T=\begin{bmatrix}14\end{bmatrix}, A^TA=\begin{bmatrix}1 & 2 & 3 \\ 2 & 4 & 6 \\ 3 & 6 & 9\end{bmatrix})]이다.
2.1. 정사각행렬에서
[math(A, B, C)]가 거듭제곱이 가능한 행렬, 즉 n차 정사각행렬일 때 다음이 성립한다.- 원 행렬과 전치행렬의 행렬식의 값은 서로 같다. 즉 [math(\det A=\det A^T)]이다.
- [math(A)]의 역행렬 [math(A^{-1})]가 존재할 때, [math((A^{-1})^T=(A^T)^{-1})]
- 증명 : [math((AB)^T=B^TA^T)]에서 [math(B=A^{-1})]이면 [math((AA^{-1})^T=(A^{-1})^TA^T)]이다. 이때 [math((AA^{-1})^T=I^T=I)]이므로 [math(I=(A^{-1})^TA^T)]이다. 이 식의 양변의 오른쪽에 [math((A^T)^{-1})]을 곱하면 [math((A^T)^{-1}=(A^{-1})^T)]이다.
- [math(A^T)]의 역행렬 [math((A^T)^{-1})]가 존재하기 위한 필요충분조건은 [math(A)]의 역행렬 [math(A^{-1})]가 존재한다는 것이다.
- [math(\det A=\det A^T)]이고, 임의의 행렬 [math(X)]에 대하여 그 역행렬 [math(X^{-1})]가 존재하기 위한 필요충분조건은 [math(\det X\ne 0)]이다. 따라서 [math(\det A\ne0, \det A^T\ne0)], [math(A^{-1})]과 [math((A^T)^{-1})]이 존재한다는 것은 모두 서로 동치이다.
- [math(A, B)]의 역행렬 [math(A^{-1}, B^{-1})]가 각각 존재할 때, [math(((AB)^T)^{-1} = (A^{-1})^T(B^{-1})^T)]
- 증명 : [math(((AB)^T)^{-1} = (B^TA^T)^{-1} = (A^T)^{-1}(B^T)^{-1} = (A^{-1})^T(B^{-1})^T)]
- [math(A, B, C)]의 역행렬 [math(A^{-1}, B^{-1}, C^{-1})]가 각각 존재할 때, [math(((ABC)^T)^{-1} = (A^{-1})^T(B^{-1})^T(C^{-1})^T)]
- 증명 : [math(((ABC)^T)^{-1} = (C^TB^TA^T)^{-1} = (A^T)^{-1}(B^T)^{-1}(C^T)^{-1} = (A^{-1})^T(B^{-1})^T(C^{-1})^T)]
- 1 이상의 모든 정수 [math(k)]에 대하여 [math((A^k)^T=(A^T)^k)]
- 증명 : 수학적 귀납법을 이용한다.
- 먼저 [math((A^k)^T=(A^T)^k)]는 [math(k=1)]일 때 자명하게 성립한다.
- 또한 이것이 1 이상의 임의의 정수 [math(k)]에 대해 성립할 때 [math((AB)^T=B^TA^T)]에 의해 [math((A^{k+1})^T=(AA^k)^T=(A^k)^TA^T=(A^T)^kA^T=(A^T)^{k+1})]가 성립한다. 즉 [math(k+1)]에 대해서도 성립한다.
- 따라서 [math((A^k)^T=(A^T)^k)]는 1 이상의 모든 정수 [math(k)]에 대해 성립한다.
- 또는 [math((A_1A_2...A_n)^T=A_n^T...A_2^TA_1^T)]을 이용하여 [math((A^k)^T=(AA...A)^T=A^T...A^TA^T=(A^T)^k)]로 증명할 수도 있다.
- [math(k=2)]일 때, [math((A^2)^T=(AA)^T=A^TA^T=(A^T)^2)]로 증명할 수 있다.
3. 대칭행렬과 반대칭행렬
대칭(symmetric)행렬이란 n차 정사각행렬[2] 중 [math(A^T=A)]인 행렬, 즉 주대각선을 기준으로 서로 대칭되는 성분들의 값이 모두 서로 같은 행렬을 의미한다. 즉 n차 정사각행렬 [math(A)]에 대해 [math(A_{ij}=A_{ji})] ([math(i,j=1,2,...,n)])가 항상 성립하는 행렬이다. 한편, [math(A^T=-A)]인 행렬 [math(A)]를 반대칭(skew symmetric)이라고 하고, 역시 n차 정사각행렬이다.1차 정사각행렬의 경우에는 모든 행렬이 대칭행렬이며, 반대칭행렬은 영행렬뿐이다.3.1. 표현
n차 정사각행렬인 대칭행렬은 대칭되는 성분들끼리 서로 값이 같으므로 다음과 같이 표현할 수 있다.[math(\begin{bmatrix}a_{11} & a_{12} & \cdots & a_{1n} \\ a_{12} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{1n} & a_{2n} & \cdots & a_{nn}\end{bmatrix})]
또한 n차 정사각행렬인 반대칭행렬은[math(A=\begin{bmatrix}a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn}\end{bmatrix})]
일 때[math(A^T=\begin{bmatrix}a_{11} & a_{21} & \cdots & a_{n1} \\ a_{12} & a_{22} & \cdots & a_{n2} \\ \vdots & \vdots & \ddots & \vdots \\ a_{1n} & a_{2n} & \cdots & a_{nn}\end{bmatrix}, -A=\begin{bmatrix}-a_{11} & -a_{12} & \cdots & -a_{1n} \\ -a_{21} & -a_{22} & \cdots & -a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ -a_{n1} & -a_{n2} & \cdots & -a_{nn}\end{bmatrix}, A^T=-A)]
이므로 다음이 성립해야 한다.- 주대각선의 각 성분 [math(a_{kk}, k=1,2,...,n)]이 모두 0이다.
- [math(a_{ij}, i,j=1,2,...,n, i\ne j)]에 해당하는 모든 성분에 대해 [math(a_{ij}=-a_{ji})]가 성립한다.
[math(A=\begin{bmatrix}0 & a_{12} & \cdots & a_{1n} \\ -a_{12} & 0 & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ -a_{1n} & -a_{2n} & \cdots & 0\end{bmatrix})]
3.2. 성질
임의의 n차 정사각행렬 [math(A, B)]와 임의의 실수 [math(a, b)], 임의의 1 이상의 정수 [math(k)]에 대하여 다음이 성립한다.- [math(A+A^T)]는 항상 대칭행렬이고, [math(A-A^T)]는 항상 반대칭행렬이다.
- 증명1 : [math((A+A^T)^T = A^T+(A^T)^T = A^T+A)]
- 증명2 : [math((A-A^T)^T = A^T-(A^T)^T = A^T-A = -(A-A^T))]
- 예시 : 전치행렬의 곱의 성질에 의하여 [math((AB)^T=B^TA^T)]이므로, [math(AB+B^TA^T)]는 항상 대칭행렬이고 [math(AB-B^TA^T)]는 항상 반대칭행렬이다.
- [math(A^{-1}+(A^T)^{-1})]는 항상 대칭행렬이고, [math(A^{-1}-(A^T)^{-1})]는 항상 반대칭행렬이다.
- 증명1 : [math((A^{-1}+(A^T)^{-1})^T = (A^{-1})^T+((A^T)^{-1})^T = (A^{-1})^T+((A^{-1})^T)^T = (A^T)^{-1}+A^{-1} = A^{-1}+(A^T)^{-1})]
- 증명2 : [math((A^{-1}-(A^T)^{-1})^T = (A^{-1})^T-((A^T)^{-1})^T = (A^{-1})^T-((A^{-1})^T)^T = (A^T)^{-1}-A^{-1} = -(A^{-1}-(A^T)^{-1}))]
- [math(AA^T, A^TA)]는 각각 대칭행렬이다. 즉 [math((AA^T)^T=AA^T, (A^TA)^T=A^TA)]이다.
- 증명1 : [math((AA^T)^T=(A^T)^TA^T=AA^T)]
- 증명2 : [math((A^TA)^T=A^T(A^T)^T=A^TA)]
- [math(A^TA+AA^T, A^TA-AA^T)]는 항상 대칭행렬이다.
- 증명1 : [math((A^TA+AA^T)^T=(A^TA)^T+(AA^T)^T=A^TA+AA^T)]
- 증명2 : [math((A^TA-AA^T)^T=(A^TA)^T-(AA^T)^T=A^TA-AA^T)]
- [math(AA^T, A^TA)]가 각각 대칭행렬이고 대칭행렬끼리 더하거나 뺀 것도 대칭행렬이라는 것으로부터 증명할 수도 있다.
- [math(A+B)]는 대칭행렬이다.
- 증명 : [math(A^T=A, B^T=B)]이므로, [math((A+B)^T=A^T+B^T=A+B)]이다.
- [math(kA)]는 대칭행렬이다.
- 증명 : [math(A^T=A)]이므로, [math((kA)^T=kA^T=kA)]이다.
- [math(aA+bB)]는 대칭행렬이다.
- 증명 : [math(A^T=A, B^T=B)]이므로, [math((aA+bB)^T=(aA)^T+(bB)^T=aA^T+bB^T=aA+bB)]이다.
- [math(A)]의 거듭제곱 [math(A^k)]는 [math(k=1,2,...)]일 때 대칭행렬이다.
- 증명 : [math(A^T=A)]이므로, [math((A^k)^T=(A^T)^k=A^k)]이다.
- [math(k=2)]일 때는 [math((A^2)^T=(AA)^T=A^TA^T=AA=A^2)]로 증명할 수 있다.
- [math(A)]의 역행렬 [math(A^{-1})]가 존재할 때, 이것은 대칭행렬이다.
- 증명 : [math(A^T=A)]이므로, [math((A^{-1})^T=(A^T)^{-1}=A^{-1})]이다.
- [math(AB+BA)]는 항상 대칭행렬이고, [math(AB-BA)]는 항상 반대칭행렬이다.
- 증명1 : [math((AB+BA)^T=(AB)^T+(BA)^T=B^TA^T+A^TB^T=BA+AB=AB+BA)]
- 증명2 : [math((AB-BA)^T=(AB)^T-(BA)^T=B^TA^T-A^TB^T=BA-AB=-(AB-BA))]
- 위 성질 중 대칭행렬의 선형 결합 [math(aA+bB)]과 거듭제곱 [math(A^k)]가 각각 대칭행렬이라는 것으로부터 임의의 실수 [math(a_1, a_2, ..., a_n)], 임의의 1 이상의 정수 [math(k_1, k_2, ..., k_n)]과 임의의 대칭행렬 [math(A_1, A_2, ..., A_n)]에 대해 [math(a_1A_1^{k_1}+a_2A_2^{k_2}+...+a_nA_n^{k_n})] 꼴의 행렬이 대칭행렬이라는 것을 알 수 있다.
- 위 성질 중 대칭행렬의 합 [math(A+B)]와 거듭제곱 [math(A^k)]가 각각 대칭행렬이라는 것으로부터 임의의 1 이상의 정수 [math(k)]와 대칭행렬 [math(A_1, A_2, ..., A_n)]에 대해 [math((A_1+A_2+...+A_n)^k)] 꼴의 행렬이 대칭행렬이라는 것을 알 수 있다.
- [math(A_1A_2...A_{n-1}A_nA_{n-1}...A_2A_1)]는 대칭행렬이다.[3] 즉 예를 들어 [math(ABA, BA^2B)]는 각각 대칭행렬이다.
- 증명 : [math((A_1A_2...A_n)^T=A_n^T...A_2^TA_1^T)]에 의하여 [math((A_1A_2...A_{n-1}A_nA_{n-1}...A_2A_1)^T=A_1^TA_2^T...A_{n-1}^TA_n^TA_{n-1}^T...A_2^TA_1^T=A_1A_2...A_{n-1}A_nA_{n-1}...A_2A_1)]이 성립한다.
- [math(A_1A_2...A_n+A_n...A_2A_1)]는 대칭행렬이다. 즉 예를 들어 [math(ABA^2+A^2BA, A^2B^2+B^2A^2)]는 각각 대칭행렬이다.
- 증명 : [math((A_1A_2...A_n+A_n...A_2A_1)^T=(A_1A_2...A_n)^T+(A_n...A_2A_1)^T=A_n^T...A_2^TA_1^T+A_1^TA_2^T...A_n^T=A_n...A_2A_1+A_1A_2...A_n=A_1A_2...A_n+A_n...A_2A_1)]
- [math(A_1A_2...A_n-A_n...A_2A_1)]는 반대칭행렬이다. 즉 예를 들어 [math(ABA^2-A^2BA, A^2B^2-B^2A^2)]는 각각 반대칭행렬이다.
- 증명 : [math((A_1A_2...A_n-A_n...A_2A_1)^T=(A_1A_2...A_n)^T-(A_n...A_2A_1)^T=A_n^T...A_2^TA_1^T-A_1^TA_2^T...A_n^T=A_n...A_2A_1-A_1A_2...A_n=-(A_1A_2...A_n-A_n...A_2A_1))]
- [math(A+B, kA, aA+bB)]는 모두 반대칭행렬이다. 증명 방법은 [math(A, B)]가 각각 대칭행렬일 때 이들 행렬이 대칭행렬임을 증명했던 방법과 같다.
- [math(A)]의 거듭제곱 [math(A^k)]는 [math(k=2,4,...)]일 때 대칭행렬이다.
- 증명 : [math(A^2)]는 [math((A^2)^T=(AA)^T=A^TA^T=(-A)(-A)=A^2)]이므로 대칭행렬이고, 상술했듯이 대칭행렬의 거듭제곱은 대칭행렬이므로 반대칭행렬의 짝수 번 거듭제곱 역시 대칭행렬이다.
- [math(A)]의 거듭제곱 [math(A^k)]는 [math(k=1,3,...)]일 때 반대칭행렬이다.
- 증명 : [math(n)]이 홀수일 때, [math(A^n)]은 [math((A^n)^T=(A^T)^n=(-A)^n=-A^n)]
- [math(A, B)]가 각각 대칭행렬일 때, [math(AB)] 역시 대칭행렬이다.
- [math(A, B)]가 각각 대칭행렬일 때, [math(AB=BA)]이다. 즉 교환법칙이 성립한다.
- 위 두 명제에 대한 반례는 [math(A=\begin{bmatrix}1 & 2 \\ 2 & 3\end{bmatrix}, B=\begin{bmatrix}4 & 5 \\ 5 & 6\end{bmatrix})]이다. 이때 [math(AB=\begin{bmatrix}14 & 17 \\ 23 & 28\end{bmatrix}, BA=\begin{bmatrix}14 & 23 \\ 17 & 28\end{bmatrix})]이다.
- 대칭행렬과 반대칭행렬의 정의에 의해 임의의 행렬 [math(A)]이 대칭행렬이면서 반대칭행렬이려면 [math(A^T=-A=A)]이어야 하는데, 이때 [math(-A=A)]에 의해 [math(A=O)]가 성립한다.
3.2.1. 대칭행렬의 제곱
n차 정사각행렬 [math(A)]가 대칭행렬일 경우 상술했듯이 다음과 같이 표현할 수 있다.[math(A=\begin{bmatrix}a_{11} & a_{12} & \cdots & a_{1n} \\ a_{12} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{1n} & a_{2n} & \cdots & a_{nn}\end{bmatrix})]
이때 [math(A^2)]를 계산하면 다음과 같다.[math(A^2=\begin{bmatrix}\sum_k a_{1k}a_{k1} & \sum_k a_{1k}a_{k2} & \cdots & \sum_k a_{1k}a_{kn} \\ \sum_k a_{2k}a_{k1} & \sum_k a_{2k}a_{k2} & \cdots & \sum_k a_{2k}a_{kn} \\ \vdots & \vdots & \ddots & \vdots \\ \sum_k a_{nk}a_{k1} & \sum_k a_{nk}a_{k2} & \cdots & \sum_k a_{nk}a_{kn}\end{bmatrix}=\begin{bmatrix}\sum_k a_{1k}^2 & \sum_k a_{1k}a_{2k} & \cdots & \sum_k a_{1k}a_{nk} \\ \sum_k a_{2k}a_{1k} & \sum_k a_{2k}^2 & \cdots & \sum_k a_{2k}a_{nk} \\ \vdots & \vdots & \ddots & \vdots \\ \sum_k a_{nk}a_{1k} & \sum_k a_{nk}a_{2k} & \cdots & \sum_k a_{nk}^2\end{bmatrix}=\begin{bmatrix}\sum_k a_{1k}^2 & \sum_k a_{1k}a_{2k} & \cdots & \sum_k a_{1k}a_{nk} \\ \sum_k a_{1k}a_{2k} & \sum_k a_{2k}^2 & \cdots & \sum_k a_{2k}a_{nk} \\ \vdots & \vdots & \ddots & \vdots \\ \sum_k a_{1k}a_{nk} & \sum_k a_{2k}a_{nk} & \cdots & \sum_k a_{nk}^2\end{bmatrix})]
따라서 [math(A^2)] 역시 대칭행렬이며, 주대각선의 원소는 항상 음이 아니다.이때 [math(A^2=O)]이 성립하는 경우 [math(A^2)]의 주대각선을 보면 [math(\sum_k a_{1k}^2=\sum_k a_{2k}^2=...=\sum_k a_{nk}^2=0)]이 성립해야 한다는 것을 알 수 있다. 따라서 이때 [math(a_{11}^2+a_{12}^2+...+a_{1n}^2=a_{21}^2+a_{22}^2+...+a_{2n}^2=...=a_{n1}^2+a_{n2}^2+...+a_{nn}^2=0)]이 성립해야 하므로, 실수 범위 내에서는 [math(a_{11}=a_{12}=...=a_{1n}=a_{21}=...=a_{nn}=0)], 즉 [math(A)]의 모든 성분의 값이 0이 되어야 한다. 즉 [math(A^2=O)]이면 [math(A=O)]이어야 한다는 것을 알 수 있다.3.2.2. 반대칭행렬의 제곱
n차 정사각행렬 [math(A)]가 반대칭행렬일 경우 상술했듯이 다음과 같이 표현할 수 있다.[math(A=\begin{bmatrix}0 & a_{12} & \cdots & a_{1n} \\ -a_{12} & 0 & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ -a_{1n} & -a_{2n} & \cdots & 0\end{bmatrix})]
이때 [math(A^2)]를 계산하면 다음과 같다.[math(A^2=\begin{bmatrix}\sum_k a_{1k}a_{k1} & \sum_k a_{1k}a_{k2} & \cdots & \sum_k a_{1k}a_{kn} \\ \sum_k a_{2k}a_{k1} & \sum_k a_{2k}a_{k2} & \cdots & \sum_k a_{2k}a_{kn} \\ \vdots & \vdots & \ddots & \vdots \\ \sum_k a_{nk}a_{k1} & \sum_k a_{nk}a_{k2} & \cdots & \sum_k a_{nk}a_{kn}\end{bmatrix}=\begin{bmatrix}-\sum_k a_{1k}^2 & -\sum_k a_{1k}a_{2k} & \cdots & -\sum_k a_{1k}a_{nk} \\ -\sum_k a_{2k}a_{1k} & -\sum_k a_{2k}^2 & \cdots & -\sum_k a_{2k}a_{nk} \\ \vdots & \vdots & \ddots & \vdots \\ -\sum_k a_{nk}a_{1k} & -\sum_k a_{nk}a_{2k} & \cdots & -\sum_k a_{nk}^2\end{bmatrix}=\begin{bmatrix}-\sum_k a_{1k}^2 & -\sum_k a_{1k}a_{2k} & \cdots & -\sum_k a_{1k}a_{nk} \\ -\sum_k a_{1k}a_{2k} & -\sum_k a_{2k}^2 & \cdots & -\sum_k a_{2k}a_{nk} \\ \vdots & \vdots & \ddots & \vdots \\ -\sum_k a_{1k}a_{nk} & -\sum_k a_{2k}a_{nk} & \cdots & -\sum_k a_{nk}^2\end{bmatrix})]
따라서 [math(A^2)]은 대칭행렬이며, 주대각선의 원소는 항상 양이 아니다. 자세히 보면 대칭행렬의 제곱에 -1을 곱한 꼴임을 알 수 있다.이때 [math(A^2=O)]이 성립하는 경우 대칭행렬에서와 마찬가지로 [math(A=O)]이어야 한다는 것을 알 수 있다.3.2.3. 대칭행렬과 반대칭행렬의 곱
대칭행렬이나 반대칭행렬의 제곱과 달리, 대칭행렬과 반대칭행렬의 곱은 대칭행렬이나 반대칭행렬이 아닐 수 있다. 예를 들어[math(A=\begin{bmatrix}a & b \\ b & c\end{bmatrix}, B=\begin{bmatrix}0 & d \\ -d & 0\end{bmatrix})]
일 때 다음과 같다.[math(AB=\begin{bmatrix}-bd & -ad \\ -cd & bd\end{bmatrix}, BA=\begin{bmatrix}bd & cd \\ -ad & -bd\end{bmatrix})]
3.3. 예시
- 선형 변환의 행렬표현 중 항등변환 및 대부분의 대칭변환의 행렬표현은 대칭행렬이다. 자세한 것은 행렬표현 문서 참고.
- n의 값에 관계없이 n차 정사각행렬 중 항등행렬 [math(I)]와 영행렬 [math(O)]은 대칭행렬이다.
- 이 중에서 영행렬 [math(O)]은 항상 반대칭행렬이므로, 영행렬은 항상 대칭행렬이면서 동시에 반대칭행렬이다.
- 2차원 평면에서의 회전변환의 행렬표현 [math(R=\begin{bmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{bmatrix})]이 대칭행렬이나 반대칭행렬이 되는 경우는 다음과 같다.
- [math(-\sin\theta=\sin\theta)], 즉 [math(\sin\theta=0, \theta=n\pi)] (단, n은 정수)일 때 대칭행렬이 된다.
- [math(R^T=-R)], 즉 [math(\begin{bmatrix} \cos\theta & \sin\theta \\ -\sin\theta & \cos\theta \end{bmatrix}=\begin{bmatrix} -\cos\theta & \sin\theta \\ -\sin\theta & -\cos\theta \end{bmatrix})]일 때 반대칭행렬이 되므로, [math(-\cos\theta=\cos\theta)], 즉 [math(\cos\theta=0, \theta=\displaystyle\frac{n+1}{2}\pi)] (단, n은 정수)일 때 반대칭행렬이 된다.
4. 직교행렬
n차 정사각행렬 [math(A)]에 대해서 [math(A^{-1}=A^T)], 즉 [math(AA^T=A^TA=I)]일 때, 이 행렬을 직교행렬(orthogonal matrix)이라고 한다.직교행렬 [math(A)]가[math(A=\begin{bmatrix}a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn}\end{bmatrix})]
일 때,[math(A^TA=\begin{bmatrix}a_{11} & a_{21} & \cdots & a_{n1} \\ a_{12} & a_{22} & \cdots & a_{n2} \\ \vdots & \vdots & \ddots & \vdots \\ a_{1n} & a_{2n} & \cdots & a_{nn}\end{bmatrix}\begin{bmatrix}a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn}\end{bmatrix}=\begin{bmatrix}\sum_k a_{k1}^2 & \sum_k a_{k1}a_{k2} & \cdots & \sum_k a_{k1}a_{kn} \\ \sum_k a_{k2}a_{k1} & \sum_k a_{k2}^2 & \cdots & \sum_k a_{k2}a_{kn} \\ \vdots & \vdots & \ddots & \vdots \\ \sum_k a_{kn}a_{k1} & \sum_k a_{kn}a_{k2} & \cdots & \sum_k a_{kn}^2\end{bmatrix}=\begin{bmatrix}\sum_k a_{k1}^2 & \sum_k a_{k1}a_{k2} & \cdots & \sum_k a_{k1}a_{kn} \\ \sum_k a_{k1}a_{k2} & \sum_k a_{k2}^2 & \cdots & \sum_k a_{k2}a_{kn} \\ \vdots & \vdots & \ddots & \vdots \\ \sum_k a_{k1}a_{kn} & \sum_k a_{k2}a_{kn} & \cdots & \sum_k a_{kn}^2\end{bmatrix}=\begin{bmatrix}1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 1\end{bmatrix})]
이고, 또한[math(AA^T=\begin{bmatrix}a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn}\end{bmatrix}\begin{bmatrix}a_{11} & a_{21} & \cdots & a_{n1} \\ a_{12} & a_{22} & \cdots & a_{n2} \\ \vdots & \vdots & \ddots & \vdots \\ a_{1n} & a_{2n} & \cdots & a_{nn}\end{bmatrix}=\begin{bmatrix}\sum_k a_{1k}^2 & \sum_k a_{1k}a_{2k} & \cdots & \sum_k a_{1k}a_{nk} \\ \sum_k a_{2k}a_{1k} & \sum_k a_{2k}^2 & \cdots & \sum_k a_{2k}a_{nk} \\ \vdots & \vdots & \ddots & \vdots \\ \sum_k a_{nk}a_{1k} & \sum_k a_{nk}a_{2k} & \cdots & \sum_k a_{nk}^2\end{bmatrix}=\begin{bmatrix}\sum_k a_{1k}^2 & \sum_k a_{1k}a_{2k} & \cdots & \sum_k a_{1k}a_{nk} \\ \sum_k a_{1k}a_{2k} & \sum_k a_{2k}^2 & \cdots & \sum_k a_{2k}a_{nk} \\ \vdots & \vdots & \ddots & \vdots \\ \sum_k a_{1k}a_{nk} & \sum_k a_{2k}a_{nk} & \cdots & \sum_k a_{nk}^2\end{bmatrix}=\begin{bmatrix}1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 1\end{bmatrix})]
이므로 다음이 성립한다.- [math(\sum_k a_{k1}^2=\sum_k a_{k2}^2=...=\sum_k a_{kn}^2=1)]
- [math(\sum_k a_{ki}a_{kj}=0)] (단, [math(i\ne j)])
- [math(\sum_k a_{1k}^2=\sum_k a_{2k}^2=...=\sum_k a_{nk}^2=1)]
- [math(\sum_k a_{ik}a_{jk}=0)] (단, [math(i\ne j)])
4.1. 이차정사각행렬에서
이차정사각행렬[math(A=\begin{bmatrix}a & b \\ c & d\end{bmatrix})]
가 직교행렬이려면 [math(A^TA=I, AA^T=I)]에 의하여 다음이 각각 성립한다.[math(A^TA=\begin{bmatrix}a & c \\ b & d\end{bmatrix}\begin{bmatrix}a & b \\ c & d\end{bmatrix}=\begin{bmatrix}a^2+c^2 & ab+cd \\ ab+cd & b^2+d^2\end{bmatrix}=\begin{bmatrix}1 & 0 \\ 0 & 1\end{bmatrix})]
[math(AA^T=\begin{bmatrix}a & b \\ c & d\end{bmatrix}\begin{bmatrix}a & c \\ b & d\end{bmatrix}=\begin{bmatrix}a^2+b^2 & ac+bd \\ ac+bd & c^2+d^2\end{bmatrix}=\begin{bmatrix}1 & 0 \\ 0 & 1\end{bmatrix})]
따라서 다음을 만족시켜야 한다.[math(AA^T=\begin{bmatrix}a & b \\ c & d\end{bmatrix}\begin{bmatrix}a & c \\ b & d\end{bmatrix}=\begin{bmatrix}a^2+b^2 & ac+bd \\ ac+bd & c^2+d^2\end{bmatrix}=\begin{bmatrix}1 & 0 \\ 0 & 1\end{bmatrix})]
- [math(a^2+b^2=a^2+c^2=b^2+d^2=c^2+d^2=1)]
- [math(ab+cd=ac+bd=0)]
- [math(b^2=c^2=1-a^2, d^2=1-c^2=a^2)]
[math(A=\begin{bmatrix}a & \pm\sqrt{1-a^2} \\ \pm\sqrt{1-a^2} & \pm a\end{bmatrix})]
여기서 경우의 수를 나누고 각 경우에 대해 [math(ab+cd=ac+bd=0)]인 경우를 찾아보면 다음과 같다.- [math(a=0)]인 경우
[math(d^2=a^2=0)]이므로 [math(d=0)]이 성립한다. 따라서 [math(ab+cd=ac+bd=0)]이 항상 성립한다. 이때 [math(b, c)]의 부호는 아무 것이든 상관없다.
[math(A=\begin{bmatrix}0 & \pm1 \\ \pm1 & 0\end{bmatrix})] - [math(a\ne0)]인 경우
[math(ab+cd=ac+bd=0)]이므로 다음과 같이 총 4가지 경우로 나누어 보면 다음과 같다. - [math(b>0, c>0)]인 경우 : [math(d=-a)]이어야 하므로 [math(b>0, c>0, d=-a)]이어야 한다.
- [math(b>0, c<0)]인 경우 : [math(d=a)]이어야 하므로 [math(b>0, c<0, d=a)]이어야 한다.
- [math(b<0, c>0)]인 경우 : [math(d=a)]이어야 하므로 [math(b<0, c>0, d=a)]이어야 한다.
- [math(b<0, c<0)]인 경우 : [math(d=-a)]이어야 하므로 [math(b<0, c<0, d=-a)]이어야 한다.
- [math(A=\begin{bmatrix}a & \sqrt{1-a^2} \\ \sqrt{1-a^2} & -a\end{bmatrix})]
- [math(A=\begin{bmatrix}a & \sqrt{1-a^2} \\ -\sqrt{1-a^2} & a\end{bmatrix})]
- [math(A=\begin{bmatrix}a & -\sqrt{1-a^2} \\ \sqrt{1-a^2} & a\end{bmatrix})]
- [math(A=\begin{bmatrix}a & -\sqrt{1-a^2} \\ -\sqrt{1-a^2} & -a\end{bmatrix})]
이상에서 행렬 [math(A)]는 다음 중 한 가지에 해당한다.
- [math(a=\cos\theta)]라고 하면 [math(\sqrt{1-a^2}=\pm\sin\theta)]가 되므로 [math(ab+cd=ac+bd=0)]을 만족시키는 경우는 다음과 같다.
- [math(A=\begin{bmatrix}\cos\theta & \sin\theta \\ \sin\theta & -\cos\theta\end{bmatrix})]
- [math(A=\begin{bmatrix}\cos\theta & \sin\theta \\ -\sin\theta & \cos\theta\end{bmatrix}=\begin{bmatrix}\cos(-\theta) & -\sin(-\theta) \\ \sin(-\theta) & \cos(-\theta)\end{bmatrix})]
- [math(A=\begin{bmatrix}\cos\theta & -\sin\theta \\ \sin\theta & \cos\theta\end{bmatrix})]
- [math(A=\begin{bmatrix}\cos\theta & -\sin\theta \\ -\sin\theta & -\cos\theta\end{bmatrix})]
- [math(a=\sin\theta)]라고 하면 [math(\sqrt{1-a^2}=\pm\cos\theta)]가 되므로 [math(ab+cd=ac+bd=0)]을 만족시키는 경우는 위 4가지 경우에서 [math(\sin)]과 [math(\cos)]를 맞바꾼 경우와 같다.
5. 활용
여러 개의 행렬의 곱이 서로 정의되지 않을 때, 전치행렬을 통해서 곱이 정의되게 만들 수 있다.예를 들어 행렬 [math(A, B, C)]가 각각 [math(5\times 3, 5\times 10, 10\times 7)] 행렬일 때, 이 세 행렬을 모두 곱하는 것은 크기가 맞지 않기 때문에 불가능하다. 이때 다음과 같은 방법으로 이 세 행렬의 곱셈이 가능하게 할 수 있다.- 행렬 [math(A)] 대신 크기가 [math(3\times 5)]인 전치행렬 [math(A^T)]를 사용한다. 이렇게 하면 행렬의 곱 [math(A^TBC)]가 정의되며 그 결과는 [math(5\times 7)] 행렬이다.
- 행렬 [math(B, C)] 대신 크기가 각각 [math(10\times 5, 7\times 10)]인 전치행렬 [math(B^T, C^T)]를 사용한다. 이렇게 하면 행렬의 곱 [math(C^TB^TA)]가 정의되며 그 결과는 [math(7\times 3)] 행렬이다.
[math(A=\begin{bmatrix}1 \\ 2 \\ 3\end{bmatrix}, B=\begin{bmatrix}4 & 5 & 6\end{bmatrix})]
에 대해서, [math(A+B)]는 정의되지 않으므로 [math(A^T+B=\begin{bmatrix}5 & 7 & 9\end{bmatrix})] 또는 [math(A+B^T=\begin{bmatrix}5 & 7 & 9\end{bmatrix}^T)]를 대신 계산할 수 있다.행렬을 나타낼 때[math(\begin{bmatrix}1 \\ 2 \\ 3\end{bmatrix})]
와 같이 열의 수보다 행의 수가 훨씬 많아서 표시할 때 세로로 많은 공간을 할애해야 하는 경우, 그 대신 열의 수가 더 많은 전치행렬을 이용하여 [math(\begin{bmatrix}1 & 2 & 3\end{bmatrix}^T)]와 같이 표시하면 그렇게 하지 않아도 된다.벡터의 내적을 구할 때에도 전치행렬을 사용할 수 있다. [math(1\times n)] 행렬로 나타내어지는 두 벡터 [math(v, w)]에 대해서 그 내적은 [math(1\times 1)] 행렬의 entry[5] [math(\det (v^Tw))]와 같이 나타낼 수 있다.6. 컴퓨터에서
- Microsoft Excel에서는 TRANSPOSE 함수를 이용하여 전치행렬을 구할 수 있다. 자세한 것은 Microsoft Excel/함수 목록 문서 참고.
- Python의 NumPy 라이브러리에서는 배열 a에 대해서 그 전치행렬은 a.T와 같이 나타낸다.
7. 여담
이 전치 연산은 텐서곱 연산의 필수요소이며, 이 연산을 복소수 범위 내에서 생각한 것이 에르미트 행렬이다.[1] [math( \square^{t} )], [math( \square^{\sf T} )] 등 저자에 따라 표기가 중구난방인 경향이 있다.[2] n차 정사각행렬이 아니면 [math(A)]와 [math(A^T)]의 형태가 서로 다르므로 [math(A^T=A)]를 만족시킬 수 없다.[3] [math(A_1A_2...A_{n-1}A_{n-1}...A_2A_1)] 꼴 역시 [math(A_n=I)]를 가정하면 대칭행렬임을 알 수 있다.[4] 모든 원소의 제곱의 합이 1이므로 벡터의 크기에 해당하는 그 제곱근도 1이다. 즉 직교행렬의 각각의 행벡터와 열벡터의 크기는 모두 1임을 알 수 있다.[5] [math(1\times 1)]에서는 entry나 행렬식이나 그게 그거다.