1. 개요
逆函數 定理 / inverse function theorem역함수의 미분법에 관련된 정리이다. 일급 함수(한 번 미분 가능하고, 그 미분한 것이 연속인 함수)가 국소적으로 역함수를 가질 조건과 역함수의 미분계수를 구하는 법을 제공한다.
고교과정에서 배우는 역함수의 미분법을 정당화해주는 정리이지만, 보통 대학 과정에 상응하기 때문에 고교 교과과정에선 생략된다. 고교과정에서는 역함수의 미분계수가 단순히 원함수 미분계수의 역수라고 배웠지만,[1] 사실 엄밀히 따진다면 역함수가 미분 가능한지부터 따져보는 것이 먼저가 되어야 하는데, 이것을 보장해주는 정리인 것이다. 역함수 정리는 음함수(implicit function)의 미분법을 비슷하게 보장해주는 음함수 정리의 증명에서도 필수적인 역할을 한다.
역함수의 미분법은 연쇄법칙의 한 예로 볼 수 있다. 원함수와 역함수의 합성함수는 항등함수이다. 즉, 원함수 [math(y=f(x))]의 역함수 [math(y=g(x))]에 대해 [math(f(g(x))=x)]이므로 양변을 미분하면 [math(f'(g(x))g'(x)=1)]이 되어 역함수의 도함수는 [math(\displaystyle g'(x)={1 \over f'(g(x))})]이다.
2. 진술
2.1. 일변수 함수
일급 함수 [math(f:A \rightarrow \mathbb{R} )]가 있을 때, ([math(A)]는 실수의 열린 부분집합)[math(A)]의 한 점 [math(a)]에 대하여 [math(f'(a) \neq 0)]이면
[math(a)]와 [math(f\left(a\right))]를 각각 포함하는 적당한 열린구간 [math(I)], [math(J)]에 대하여, [math(f)]를 제한한 함수
[math(g: I \rightarrow J, x \longmapsto f\left(x\right))]
가 일대일 대응이고, [math(g^{-1})]이 일급이다. 또한 [math(\displaystyle \left(g^{-1}\right)' \left(f\left(a\right)\right)=\frac{1}{f'\left(a\right)})] 가 성립한다.2.2. 다변수 벡터함수
일급 함수 [math(F:\mathcal{U} \rightarrow \mathbb{R}^n )]가 있을 때, ( [math(\mathcal{U} \subset \mathbb{R}^n)]는 열린집합)[math(\mathcal{U})]의 한 점 [math(P)]에 대하여 [math( \det J_F \left(P\right) \neq 0 )] 이면
[math(P)]와 [math(F\left(P\right))]를 각각 포함하는 적당한 열린집합 [math(U)], [math(V)]에 대하여, [math(F)]를 제한한 함수
[math(G: U \rightarrow V, X \longmapsto F\left(X\right))]
가 일대일 대응이고, [math(G^{-1})]이 일급이다. 또한 [math(\displaystyle J_{G^{-1}} \left(F\left(P\right)\right)=\left(J_F\left(P\right)\right)^{-1})]가 성립한다.3. 증명
3.1. 일변수 함수
WLOG [math(f'\left(a \right) >0)]라고 하자. [math(f')]이 연속함수이므로 [math(a)]의 충분히 작은 근방에서 [math(f')]의 값은 여전히 양수가 된다.그러한 근방을 열린구간 [math(I)]라고 하자. 그러면 [math(I)]의 모든 원소 [math(x)]에 대해 [math(f'\left(x \right) >0)]이다. 따라서 평균값 정리에 의하여 [math(f)]는 [math(I)]에서 순증가한다. 또한 사이값 정리에 의해 [math(I)]의 상 [math(f\left(I\right))]도 구간이다. 특히 [math(f)]가 순증가하므로 [math(f\left(I\right))]도 [math(I)]와 같이 열린구간이 된다. 이때 [math(J = f\left(I\right))]라 하면 [math(f)]를 제한한 함수
[math(g: I \rightarrow J, x \longmapsto f\left(x\right))]
가 일대일 대응이다. 그러므로 역함수 [math(g^{-1})]가 존재한다.이제 범위가 [math(I)]인 두 변수 [math(x_1, x_2)]와 범위가 [math(J)]인 두 변수 [math(y_1, y_2)]가 다음과 같은 관계로 연관되어 있다고 하자.
[math(y_1=g\left(x_1\right), y_2= g\left(x_2\right))]
그러면 함수 [math(g)]가 연속이므로 [math(x_2 \rightarrow x_1)]일 때 [math(y_2 \rightarrow y_1)]이다. 그런데 [math(g)]가 일대일 대응이므로 [math(y_2 \rightarrow y_1)]일 때 [math(x_2 \rightarrow x_1)]도 된다. 따라서[math(\displaystyle \left(g^{-1}\right)' \left(y_1\right) =\lim_{y_2 \to y_1} \frac{g^{-1}\left(y_2\right) - g^{-1}\left(y_1\right)}{y_2 - y_1} =\lim_{x_2 \to x_1} \frac{x_2 - x_1}{g\left(x_2\right) - g\left(x_1\right)} =\frac{1}{g'\left(x_1\right)})]
이다. [math(g')]의 값은 0이 아니므로 [math(\left(g^{-1}\right)')]은 연속이다. 즉, [math(g^{-1})]는 일급이다. 그리고 위의 [math(x_1)]에 [math(a)]를 대입하면 [math(\displaystyle \left(g^{-1}\right)' \left(f\left(a\right)\right)=\frac{1}{f'\left(a\right)})]를 얻는다.3.2. 다변수 벡터함수
3.2.1. 가역 선형사상의 성질
[math( \det J_F \left(P\right) \neq 0 )]이면 [math(J_F \left(P\right))]이 가역행렬이다. 이때 다음과 같이 선형사상 [math( L )]을 정의하자.
[math( L: \mathbb {R}^n \rightarrow \mathbb{R}^n, X \longmapsto J_F \left(P\right)X )]
그러면 [math( L )]은 가역인 선형사상이다.[math( L )]에 의한 단위구면 [math( S=\left\{ X \in \mathbb{R}^n | \ \left| X \right| = 1 \right\} )]의 상 [math( L\left(S\right) )]을 생각하자. [math( L )]이 가역인 선형사상이므로 [math( \mathbf{0} \notin L\left(S\right) )]이다. 또한 [math( L )]은 연속이므로 [math( \mathbf{0})]에서 거리가 [math(\varepsilon)]이하인 영역
[math( B= \left\{ X \in \mathbb{R}^n | \ \left|X \right| \leq \varepsilon \right\} )]
는 [math(\varepsilon)]이 충분히 작으면 [math( L\left(S\right) )]와 서로소가 된다. 따라서 [math(\displaystyle \inf_{X \in S} \left| L\left(X \right) \right| )]는 양수이다.3.2.2. 국소적 일대일에 대한 증명
이제 일급 함수 [math( F )]가 점 [math( P )] 근방에서 국소적으로 일대일함수가 됨을 증명한다. [math( F )]는 미분가능한 함수이므로 다음이 성립한다.
[math(\displaystyle \lim_{Y \to X} \frac{F\left(Y\right) - F\left(X\right) - J_F \left(X\right) \left(Y-X\right)}{\left|Y-X\right|} = \mathbf{0} )]
여기서 [math(\displaystyle \varepsilon \left(X, Y\right) = \frac{F\left(Y\right) - F\left(X\right) - J_F \left(X\right) \left(Y-X\right)}{\left|Y-X\right|} )]라고 하자. 그러면[math(\displaystyle \frac{F\left(Y\right) - F\left(X\right)}{\left|Y-X\right|} = J_F \left(X\right) \frac{Y-X}{\left|Y-X\right|} + \varepsilon \left(X, Y\right))]
이다.한편 [math( F )]가 일급이므로 [math(\displaystyle \lim_{X \to P} J_F \left(X\right) = J_F \left(P\right) )]이다. 여기서 행렬함수
[math( A_X = J_F \left(X\right) - J_F \left(P\right) )]
를 정의하면[math(\displaystyle \frac{F\left(Y\right) - F\left(X\right)}{\left|Y-X\right|} = J_F \left(P\right) \frac{Y-X}{\left|Y-X\right|} +A_X \frac{Y-X}{\left|Y-X\right|}+ \varepsilon \left(X, Y\right))]
이다. 따라서 다음의 부등식이 성립한다.[math(\displaystyle \frac{\left|F\left(Y\right) - F\left(X\right)\right|}{\left|Y-X\right|} \geq \left| \ \left|J_F \left(P\right) \frac{Y-X}{\left|Y-X\right|} \right| - \left| A_X \frac{Y-X}{\left|Y-X\right|}+\varepsilon \left(X, Y\right) \right| \ \right|)]
[math(X, Y)]를 [math( P )]의 근방 [math(D)]에 있는 서로 다른 두 점이라 하자. 그러면 [math(D)]가 [math( \{P\} )]로 수축할 때 [math(\displaystyle \left|J_F \left(P\right) \frac{Y-X}{\left|Y-X\right|} \right| )]의 하한은 어떤 양수로 수렴한다. 그에 반해 [math(\displaystyle \left| A_X \frac{Y-X}{\left|Y-X\right|}+\varepsilon \left(X, Y\right) \right|)]의 상한은 0으로 수렴한다. 따라서 [math(D)]가 충분히 작은 [math( P )]의 근방일 때, 고정된 양수 [math(\varepsilon_0)]에 대하여[math(\displaystyle \left|F\left(Y\right) - F\left(X\right)\right| \geq \varepsilon_0 \left|Y-X\right| )]
가 성립하게 된다. 따라서 [math( F )]는 [math(D)]에서 일대일이다.3.2.3. 함수를 제한할 열린집합 찾기
위에서 잡은 [math(D)]는 유계가 되도록 하는 것이 가능하다. 이때 [math(\partial D)]는 유계인 닫힌집합이 되므로 최대 최소의 정리에 의하여 [math(\displaystyle \min_{X \in \partial D} \left| F\left(X\right) - F\left(P\right)\right|)]가 존재한다. 이 값을 [math(d)]라 하자. 그리고 다음과 같이 집합 [math(V)]를 정의한다.
[math(V= \left\{ Y\in \mathbb{R}^n | \ \left|F\left(P\right) - Y \right| < d \right\})]
이때 [math(V)]의 임의의 한 원소 [math(Y)]에 대하여, [math(D)]의 폐포 [math(\bar{D})]에서 정의된 함수[math(f: \bar{D} \to \mathbb{R}, X \longmapsto \left|F\left(X\right) - Y \right|^2)]
를 생각하면 [math(f)]는 유계인 닫힌집합에서 정의된 연속함수이므로 최솟값을 갖는다. 그런데 [math(X \in \partial D)]라면 [math(f\left(P\right) < f\left(X\right) )]이므로 [math(\partial D)]에서는 최솟값을 갖지 않는다. 따라서 [math(f)]는 [math(D)]의 내부 [math(\mathrm{int} D)]에서 최솟값을 갖는다.[math(\mathrm{int} D)]는 열린집합이므로 최소점에서 [math(\nabla f \left(X\right) = \mathbf{0})]이다. 즉, [math(2 \left(F\left(X\right) - Y \right)^T J_F \left(X\right) = \mathbf{0})]이 성립하고, 여기서 [math( J_F \left(X\right))]는 가역행렬이므로 [math(F\left(X\right) - Y = \mathbf{0})]이다. 이로부터 [math(V)]의 임의의 원소 [math(Y)]에 대해 [math(F\left(X\right) = Y)]인 [math(X \in D)]가 존재함을 알 수 있다.
그러면 [math(V)]의 역상 [math(F^{-1}\left(V\right))]와 [math(D)]의 교집합을 [math(U)]라고 하면 [math(F)]가 연속함수이므로 [math(U)]는 열린집합이다. 따라서 [math(F)]를 다음과 같이 제한하면
[math(G: U \rightarrow V, X \longmapsto F\left(X\right))]
[math(G)]는 일대일 대응이다.3.2.4. 역함수의 미분계수
동점 [math(X_1, X_2)]의 범위가 [math(U)]이고, 동점 [math(Y_1, Y_2)]의 범위가 [math(V)]일 때 동점들이 다음과 같이 연관되어 있다고 하자.[math(Y_1=G\left(X_1\right), Y_2=G\left(X_2\right))]
그러면 [math(G)]가 연속이고 일대일 대응이므로 [math(Y_2 \to Y_1)]일 때 [math(X_2 \to X_1)]이다. 따라서[math(\displaystyle \lim_{Y_2 \to Y_1} \frac{G^{-1}\left(Y_2\right) - G^{-1}\left(Y_1\right) - \left(J_F \left(X_1\right) \right)^{-1} \left(Y_2-Y_1\right)}{\left|Y_2-Y_1\right|} = \lim_{X_2 \to X_1} \frac{X_2 - X_1 - \left(J_F \left(X_1\right) \right)^{-1} \left(F(X_2)-F(X_1)\right)}{\left|F(X_2)-F(X_1)\right|} = \mathbf{0})]
이다. 즉, [math(\displaystyle J_{G^{-1}} \left(F\left(P\right)\right)=\left(J_F\left(P\right)\right)^{-1})]이 성립한다.4. 활용
어떤 함수가 실수 전체의 집합에서 미분가능하다고 해서 그 함수의 역함수도 그러하다는 보장은 없다. 직관적으로는 역함수의 그래프가 직선 [math(y=x)]에 대하여 대칭일 뿐 그래프의 형상 자체는 첨점이 없이 '부드러우므로' 역함수 역시 미분불가능한 점이 없으리라고 짐작하기 쉬우나, 다음과 같이 원래 함수에서 미분계수가 [math(0)]인 점이 있으면 역함수에서는 미분계수가 발산하여 제대로 정의되지 않는 현상이 발생한다.따라서 미분가능한 함수의 역함수 역시 미분가능하려면 원래 함수에서 미분계수가 [math(0)]인 점이 존재하지 않아야 한다. 역함수의 미분가능성에 대한 함정을 간접적으로 알게 해 주는 문제가 전국연합학력평가에 출제된 바 있다.
2021학년도 7월 미적분 29번 |
[1] 합성함수의 미분법과, 역함수와 원함수를 합성하면 일차식 x가 되는 성질을 이용해 증명한다.