1. 개요
생성 문법(生成文法, Generative Grammar)은 오늘날 이론 언어학의 지배적 사조 중 하나이다. 1950년대 말에 시작되어 1980년대까지 언어학계에서 가장 지배적인 패러다임으로 자리하였고, 이후 대립 패러다임의 등장에도 불구하고 오늘날까지 내부 변혁을 통해 정상 과학으로 작동하고 있다. 놈 촘스키가 그 비조로 인정된다.생성 문법에서 말하는 언어는, '두 인식 단위가 주어졌을 때 그것을 결합하여 새로운 인식 단위를 만드는' 기제이다. 이 기제는 인간만이 가지고 있는 것으로 알려져 있으며[1], 생성 문법의 목적은 이 기제를 연구하는 것이다. 비록 이 연구 프로그램은 언어 간의 비교를 통해 시작되었으나, 현대에 들어와 특히 생명 과학 분야의 뇌 과학 연구 방법론이나 진화 생물학 연구 방법론을 이용해서 연구가 이루어진다. 이러한 이유로 생물학적 방법론을 취하는 연구 분야를 특별히 '생물 언어학(biolinguistics)'이라고도 부른다.
이전의 나무위키 서술에서는 생성 문법이 인문학보다는 수학이나 논리학에 가깝다며 형식 과학의 한 분야로 분류하는 서술이 있었다. 하지만 형식 과학이 현실 세계나 경험적 증거와는 무관하게 사전에 설정된 공리를 기반으로 논리적으로 구성 가능한 임의의 대상을 연역적 증명으로만 연구하는 반면, 생성 문법은 사전에 설정된 공리를 기반으로 논리적으로 상상 가능한 임의의 언어가 아니라 한국어나 영어, 구구이미티르어 등과 같이 현실에 실존하는 인간의 언어들을 연구하며, 예문에 대한 모어 화자의 직관이라는 경험적 데이터를 바탕으로 검증하거나 반증하는 과정을 통해 연구가 진행되기 때문에 경험 과학에 속하며 형식 과학이 아니다.
생성 문법의 창시자인 촘스키는 형식 언어론 연구에도 기여했는데 형식 언어론은 형식 과학이며 생성 문법의 수학적 기초를 제공했다.[2] 하지만 미적분학이 물리학의 수학적 기초를 제공했다는 이유로 물리학이 형식 과학이 되는 것이 아닌 것처럼, 형식 언어론이 생성 문법과 관련이 있다는 이유로 생성 문법이 곧 형식 과학이 되는 것은 아니다.
2. 상세
생성 문법의 초창기 연구가 나오고 나니, 여태껏 많이 연구됐다고 생각된 언어에서조차 '언어의 기본 속성'이 간과되었다는 점이 금세 드러났다. 그러니까, 매우 포괄적이라고 하던 전통 문법이나 사전들조차 그저 언어의 겉만 핥고 있었다는 게 판명 난 것이다. 처음부터 끝까지 언어의 기본 속성에 대해서는 파악하려고도, 기술해 보려고도 하지 않고, 단지 그것들을 이미 주어진 걸로 전제했을 따름이었다. 만약 목표가 그저 외국어 학습이나 돕거나 단어의 일반적 의미나 발음을 조사하거나 혹은 언어 간 차이가 어떤지 전반적으로 모색하자는 것이라면, 그 정도로도 충분할지 모른다. 그러나 우리의 목표가 언어 기관(language faculty)을 이해하고 그것이 상정하는 (초기) 상태를 이해하려는 것이라면, 우리는 소위 '독자의 지능'을 당연히 전제해서는 안 된다. 오히려, '독자의 지능'이 우리 연구의 목표여야 하는 것이다.
New Horizons in the Study of Language and Mind, p. 6
New Horizons in the Study of Language and Mind, p. 6
생성 문법 이전에도 언어학은 있었다. 19세기 소쉬르 이후 근대적 '언어학'이 정립되었고,[3] 20세기 중반에 오기까지 심리학의 행동주의, 철학의 구조주의 패러다임이 언어학 내에서 정상 과학으로 작동하였다.
1950년대에 이르러 구조주의 언어학자들은 언어에 대해 '거의 모든 것을 다 밝혔다'고 자부하고 있었다. 이때까지 언어학에서 다루는 '언어'는 사회적 습관으로 정의되었다. 마치 한국에서 밥을 먹고 미국에선 빵을 먹는 게 과학적인 이유가 아니라 '문화'에 따른 것임과 마찬가지로, '언어'역시 특정 사회 내에서 그냥 그렇게 쓰기 때문에 그 '습관'을 학습 및 사용하는 것이라고 생각했다. 이런 관점에서 언어학자의 연구 과제는 그 '습관'을 기록하고 정리하며 '문화'별로 비교하는 것이 전부였다.[4] 1950년대에 등장한 촘스키의 생성 문법은 이러한 구조주의 언어학의 핵심적 가정들에 대해 문제 제기 하였다는 점에서 차별점을 지닌다. 위에 언급된 인용구에서 나와있듯이, 구조주의 언어학은 언어의 기본적인 속성조차 간과되어 온 것이었다.
촘스키의 이러한 생각은 많은 학자들에게 반향을 일으켜 50년대에서 80년대에 걸쳐 결국 이론 언어학에서는 구조주의에서 생성 문법으로, 또한 인지 과학으로 패러다임 시프트가 진행되었다. 구조주의와 달리 생성 문법은 언어를 '형식적 조합'으로 이해하였고, 조립의 단위[5]와 조립의 방식을 형식화하는 것으로 초점을 옮긴다. 특히 한정된 뇌[6]에서 무한한 언어 표현이 나올 수 있는 이유를 설명하고자 하는 것이 생성 문법에서 스스로에게 부여한 언어학의 과제이다. 자연과학에서 '한정된 장치(뇌)의 무한한 산출(언표)'이 가능한 과정은 생성 과정(generative process)이다. 따라서 생성 문법(generative grammar)이라 명명하였다.
생성 문법은 초기 컴퓨터 과학과 같은 사상적 뿌리를 가졌기 때문에 많은 개념을 공유한다. '메모리 한정성', '연산 효율성' 그리고 '생성' 등이 대표적이다.[7] 1950년대 촘스키가 고안한 언어 기계로서의 초기 언어 기관(Language Faculty)은 튜링 머신에 해당한다. 규칙 또한 '2번째 단어와 3번째 단어를 교체한다' 등의 다시 쓰기 형식이었다. 목표는, 인간 언어의 어순을 기계어로 변환하는 것이었고, UG의 초기 개념도 모든 언어들이 공통 문법을 가진다는 가정으로서 외국어(특히 소련에서 쓰던 러시아어)의 기계 번역을 도모한다는 논리였다.[8]
촘스키가 생성 문법과 이전의 언어학을 생물학에 빗대어 표현한 말이 있다. 생성 문법은 '벌의 비행을 연구하기 위해 벌 한 마리의 해부학적 구조를 보는 것'이고, 이전까지의 구조주의는 마치 '벌을 연구하는 생물학자가 벌의 비행을 비디오로 많이 녹화한 다음 그 영상 자료만 계속 돌려 보면서 "나 이제 벌에 관한 한 박사요." 하는 것'이나 다름없다는 것이다. 생물학에서 '벌의 비행'은 실증적으로 주어진 것이니 '벌이 날 수 있다'는 사실을 계속 반복해서 확인하기는 의미가 없다. 생물학의 일은 벌의 비행을 설명하기 위해 형식적 가설을 세우고 그것으로부터 연역적으로 연구하는 것이다. 언어학 역시 '물리적으로 한정된 뇌에서 무한한 수의 언어 표현이 생성된다'는 실증적 사실을 설명하기 위해서는 언어를 형식화하고, 그것을 연역적 접근법으로 연구해야 한다고 촘스키는 생각했다.
의미론 중심 언어 이론인 생성 의미론(generative semantics)과는 다르다. 의미론의 입장에서 본다면 생성 문법은 해석 의미론이며 따라서 생성 의미론은 생성 문법과는 언어관 자체가 아예 다른, 경쟁 관계에 있는 언어 이론이다. 자세한 것은 통사론 항목 및 본 문서 하단의 의미론 단락 참조.
생성 문법만을 다루는 대표적인 저널로는 매사추세츠 공과대학교에서 발행되는 Linguistic Inquiry(링크)가 있다. [9] 한국 저널 중에는 생성문법학회에서 발행하는 '생성문법연구'(링크)가 생성 문법의 최신 연구를 다룬다.
3. 생성 문법의 언어관
3.1. 선천적 언어 습득 능력
인간의 언어 습득과 관련하여 실증적으로 확실한 사실은 다음과 같다.- 사실 1: (사회적 존재로서)[10]인간은 불충분한 자극이 주어졌을 때도 의식적 교육 없이도 2년 내에 어떤 하나의 언어를 구사할 수 있다. 그리고 이것은 종 특이적(species-specific)적인 인간의 특징이다.[11]
- 사실 1-1: 그 이후 시기가 지날수록 언어를 새로 배우는 것이 어렵다.
- 사실 2: 언어 능력은 가지되 다른 지능이 떨어지는 경우나, 다른 지능이 뛰어나나 언어 능력이 떨어지는 사례가 존재한다.
사실 1을 자극 부족의 가정(poverty of stimulus hypothesis)이라고 하는데, 이것이 인간의 언어 습득이 선천적이라는 가설의 결정적 증거이다. 사실 1을 다시 말하자면, 인간은 언어 데이터가 충분히 주어지지 않은 상황에서도 언어 능력을 습득할 수 있다는 관찰이다. [12] 이를 바탕으로 생성 문법은 모든 인간이 언어 습득을 할 때, 선천적으로 주어진 언어 습득 장치(Language Acquisition Device)를 사용하고, 이 장치는 나이가 들어감에 따라 퇴화한다(사실 1-1)고 주장한다. 해당 언어 습득 장치는 언어를 관장하는 뇌 부위를 언급하는 것이 아니고 기능적인 지시어이다. 촘스키의 말을 빌리자면, '소화 기관'이라고 부르는 것에 다양한 신체 기관이 포함되고, 각 신체 기관이 오롯이 소화만을 하는 것이 아니듯이, 뇌의 구조체 집합이 언어 처리를 위해 독립적인 장치로 존재한다고 보는 것이다. 이 기제가 특정 언어 환경에 놓였을 때, 이 환경에서의 부족한 자극에 기반하여 완전한 언어체를 구성한다는 것이 생성 문법의 언어 습득관이다.[13][14]
이것과 상반되는 가설은 인간이 일반 심리 기제를 통해 언어를 습득한다는 '언어 학습 이론'이다. 행동주의 심리학과 이를 계승한 인지 언어학에서 주장하는 가설로서, 인간이 가지고 있는 일반화, 패턴 파악, 기억 등의 일반적인 심리 기제들을 활용하여 언어를 습득한다는 것이다. 그러나 생성 문법에서는 이러한 심리 기제들과는 별개의 언어만을 담당하는 기제가 선천적으로 존재한다고 말한다. 이것이 선천적일 수밖에 없는 이유는, 언어 능력이 인간만의 특징이고, 인간들 사이에서는 인종이나 문화에 상관없이 동일하기 때문이다. 무엇이 특정 종만의 특징이고 종 내에서 편차가 미미하다면 그것은 생물학적으로 선천적 자질로 설명되어야 한다.
정리하자면, 인간이 어떠한 행동이나 기술을 배우는 과정과 언어를 배우는 과정은 서로 전혀 다르게 이루어진다. 이에 따라 언어는 습득(Acquisition)되는 것이고, 그 이외의 모든 행동[15]들은 학습(Learning)되는 것으로 이해한다. 인지 언어학을 지지하는 언어학자들과는 정반대되는 이론이다.[16]
또한, 인간은 한 번도 보지 않은 문장이라도 그 의미를 해석할 수 있다. 또한 인간에게는 한 번도 들어보지 않은 문장을 만들어내는 것이 기존에 들어본 문장을 토씨 하나까지 똑같이 반복하는 것보다 훨씬 쉽다. 이를 통해 인간은 언어 자극을 정리하는 방식으로, 즉, 학습을 하는 것이 아니라, 언어 생성 장치에 메모리 효율적으로 패러미터를 저장하고 그것으로부터 생성하는 방식으로 언어를 사용한다는 사실을 알 수 있다.
이것을 보여주는 아주 단편적인 예가 전치사/후치사의 선택과 어순의 문제다. 전치사를 사용하는 언어는 VO(동사-목적어) 어순이다. 영어나 여러 인도유럽어가 해당한다. 후치사를 사용하는 언어는 OV(목적어-동사) 어순이다. 한국어 터키어 등이 해당한다. 전치사/후치사와 어순은 겉으로 보기에는 별개의 언어적 정보이고, 선천적인 생성 기제를 상정하지 않는다면 서로 독립적이어야 할 것으로 보인다.
그러나 생성 문법의 '언어 장치'에서 이 두 가지는 하나의 스위치에 해당한다. 스위치의 비유는 촘스키의 1980년대 지배 결속 이론에서 사용하는 것인데, 마치 스위치를 켜거나 끄듯이, 혹은 프로그래밍 언어로 말하자면 특정 class의 attribute값을 지정하듯이, 하나의 모듈에 값이 부여되면 그것의 파생으로 여러 언어 현상이 결정된다는 것을 말한다. 어쨌든, 어순과 전/후치사는 하나의 값이 결정되면 다른 값도 결정되는 경우에 해당한다. 따라서 언어를 습득하는 아기는 어순과 전/후치사를 독립적으로 일반화하여 학습하지 않고 하나의 사건을 습득하면 다른 경우도 자동으로 습득된다.
다시 컴퓨터를 비유하여 생성 문법의 언어 습득관을 표현하자면, 언어는 인간의 일반 사고 영역을 관장하는 CPU와는 별개로 그래픽 카드 같은 외부 장치가 삽입되어 있다고 가정하는 것이다. [17][18] 이 가정이 무슨 의미를 가지느냐 하냐면 기존 언어학이나 논리학에서 언어가 다른 모든 인식 관계와 동일하게 형성되었다면 기계어와 마찬가지로 언어는 완전히 논리적이며 따라서 언어학은 언어의 구조를 완전하게 분석하는 것이 임무이며 충분한 일이지만 별도로 그래픽 카드가 존재한다면 언어가 그 자체만으로 CPU에 로딩된 OS로 처리하기에는 오류로 가득 찬 신호로 이루어져있어도 그래픽 카드에 내재하는 별도의 드라이버로 구동될 수 있기에 언어만 가지고 따져봐야 의미가 없다. 진짜 의미는 그래픽 카드의 기능을 알아야 해석 가능하며 이 처리 과정을 이해함으로써야 일상 언어와 고차원적 언어를 완전히 이해할 수 있다.
그래서 그래픽 카드의 기능을 CPU인 인간의 사고 기능으로 시뮬레이션해 보는 것이 궁극적 목표다. 구시대 그래픽 카드나 오디오 카드를 충분한 고성능의 CPU로 충분한 시간 동안 적절한 방법으로 돌리면 소프트웨어적으로 하드웨어인 그래픽 카드 및 그 드라어버를 OS 안에서 시뮬레이션할 수 있듯이 말이다. [19]
이 이론의 의의는 가정이 맞다면 이 방법으로 일상 언어와 논리학적 도식 간의 차이를 이해할 수 있다는 것. 방법론적으로 전혀 상관없어 보이는 여러 언어를 비교하여 공통된 규칙을 찾아내는 방식으로 시작하였고 그를 뒷받침하는 많은 증거로 현대 언어학계에 영향을 많이 끼쳤다.
4. 생성 문법의 이론관
자세한 내용은 이론 언어학 문서의 이론의 타당성 부분을
참고하십시오.생성 문법은 하나의 패러다임으로서 언어학 이론이 어떻게 구성되어야 하는지에 대한 지향점이 있고, 이에 따라 연구 프로그램이 구성된다. 연구자들이나 언어학도들이 흔히 '3대 타당성 논제'로 알고 있는 것이 이것이다. 생성 문법의 이론관에 따르면 언어학 이론은 타당성의 충족 여부에 따라 우열을 가릴 수 있다. 관찰-기술-설명의 순으로 고차원의 타당성이라고 본다. 언어학 이론에 대한 튜링 테스트라고 할 수 있다. 촘스키의 초기 이론에서 제창되었다[20]
- 관찰적 타당성(observational adequacy): 언어 이론은 언어 데이터를 빠짐없이 설명할 수 있어야 한다. 어떤 언어 데이터가 주어졌을 때 그것을 위한 이론이 있어야 한다.
- 학교 문법은 관찰적 타당성만 충족한다. 기술주의 문법은 존재하지 않는 언어 표현이 왜 존재하지 않는지는 설명하지 못하지만 존재하는 언어 데이터에 대해서는 모두 설명할 수 있기 때문에 관찰적 타당성만 충족한다. 일부 유사 언어학들은 관찰적 타당성도 충족하지 못한다.
- 기술적 타당성(descriptive adaquacy): 언어 이론은 관찰적 타당성을 충족하는 것에 더하여, 언어 데이터에 대한 유의미한 일반화와 형식적 원칙을 구성해야 한다. 언어 이론은 오직 언어 데이터만을 기술해야 한다.('all and only' clause)[21]
- 촘스키의 이론을 기준으로 하였을 때, 1960년대 및 1970년대까지의 확대 표준 이론이 기술적 타당성까지만 충족한다. 2020년대 기준 통용되는 형식주의 언어학 이론들은 모두 기술적 타당성을 충족한다.
- 설명적 타당성(explanatory adequacy): 언어 이론은 관찰적, 기술적 타당성을 충족하는 것은 물론 다양한 설명 방식 중 가장 단순한 설명이어야 한다.(오컴의 면도날을 말한다.) 또한 언어 이론은 반증 가능한 예측을 할 수 있어야 한다. 80년대 90년대부터 생성 문법 문헌에서 언급되기 시작한 '플라톤의 문제'가 설명적 타당성과 관련된다. 플라톤의 문제는 불충분한 자극으로 어떻게 완전한 언어 능력이 습득될 수 있는지에 대한 문제이다. 설명적 타당성을 충족한 이론은 플라톤의 문제에 대한 해답을 가지고 있다.
- 이때, '단순한 설명'이라고 함은 개별 언어의 차원이 아니라 모든 존재하는 것으로 보고된 언어 및 보고되지 않았으나 존재할 수 있는 언어적 조합 모두를 가장 단순하게 설명하는 것을 말한다. 따라서 당위적으로 추상적 '보편 언어'가 상정된다.
- 촘스키의 이론을 기준으로 하였을 때, 1980년대 이후의 원리 매개 변인 이론(지배 결속 이론 및 최소주의)이 설명적 타당성을 갖추었다고 본다. 예컨대, 보편 문법(UG)의 측면에서 가능한 매개 변인 조합을 통해 존재하는 비록 관찰되지 않았더라도 어떤 언어가 존재할 수 있는지, 어떤 언어가 존재할 수 없는지 예측하는 것이 가능하다. '생득적인 보편 문법이 존재하기 때문에 적은 자극에도 완벽한 언어 능력이 습득된다'는 것이 플라톤의 문제에 대한 원리 매개 변인 이론의 해답이다.
- 최적성 이론 역시 음운론으로 한정하였을 때 설명적 타당성을 갖추었다고 본다. 제약의 조합 방식은 제약의 개수의 팩토리얼이기 때문에 한정된 수의 언어 조합만이 예측된다. 제약의 조합에 따라 어떤 언어가 존재할 수 없는지도 예측된다. 플라톤의 문제에 대해서는 제약 자체가 창출적이라는 견해와 제약이 UG의 일부를 구성한다는 견해가 상충하고 있으나 대체로 '언어 습득자(신생아를 말한다.)는 주어진 두 제약 간의 위계만 학습하면 되기 때문에 습득에는 많은 데이터가 필요하지 않다'고 답변한다.
그리고 촘스키는 2000년대 중반 이후 설명적 타당성을 넘어서 '진화 가능성(앞으로 진화할 가능성이 아니라 '현 상태'에 이르게 한 과정을 진화 생물학적으로 설명할 수 있느냐)에 대한 설명'을 새로운 논제로 제시하였다. 이를 다윈의 문제라고 한다.
- 설명적 타당성 너머(Beyond explanatory adaquacy): 언어 이론은 인간 언어의 진화 가능성을 설명할 수 있어야 한다.
- 2022년 현재까지 이 단계에 도달한 언어 이론은 존재하지 않는 것으로 보인다. 사실 촘스키언을 제외하고는 관심을 가지는 연구자들도 거의 없다. 참고로 촘스키언 통사론이 병합과 대병합으로 정리되었고, 이 두 가지 작용은 더 이상 환원 불가능한 것으로 보이기 때문에, 촘스키는 자신의 이론이 '...타당성 너머'를 충족했다고 자평한다.
4.1. 문법 모형
5. 생성 통사론
5.1. 변형 생성 문법
5.1.1. 촘스키주의 모형(표준 이론에서 최소주의까지)
자세한 내용은 통사론 문서의 형식주의 부분을
참고하십시오.생성 언어학 전통 내에서도 특히 촘스키를 중심으로 하는 일파가 따르는 모형을 일컫는다. 최근 촘스키가 제안한 이론에 비춰볼 때에는 적절한 명칭이라고 할 수 없지만 대체로 통칭할 때는 변형 생성 문법이라고 불리며 촘스키적 접근(Chomskyan approach)과 같은 식으로 에둘러서 표현하는 경우도 있다. 그러나 촘스키주의 모형이 좋게 말하면 끊임없이 자기 혁신을 거쳐왔고 나쁘게 말하면 일관되지 못한 몇 번의 단속적인 변화를 겪었기 때문에 한 단어로 촘스키가 제시한 모든 이론적 도구나 방법론, 메타 이론들을 포괄하기엔 무리가 따른다. 대신 촘스키주의 모형은 대체로 다음의 몇 가지 단계로 나눠지며 학계에서도 이러한 시대 구분을 따라 분류하는 편이다.
- 고전적 촘스키주의(Classical Theory, Syntactic Structure 1957)
- 표준 이론(Standard Theory, Aspects of the Theory of Syntax 1965)
- 확대 표준 이론(Extended Standard Theory, 1968)
- 수정 확대 표준 이론(Revised Extended Standard Theory, 1972)
- 지배 결속 이론(Goverment and Binding Theory, 1981)
- 최소주의 프로그램(Minimalist Program, 1995)
5.1.2. 나노 통사론(nanosyntax)
2005년을 기점으로 탄생한 새로운 모형으로 최소주의 프로그램의 등장 이후 변형 생성 문법 주류와는 다소 다른 방향을 취하며 갈라졌다. 그러나 비변형 생성 문법 이론에서 제안하는 모형들과 비교했을 때 최소주의 프로그램과 공통분모가 많으며 넓게는 촘스키주의 모형에 포함시킬 수 있을 것이다.
5.2. 비변형 생성 문법
5.2.1. 구 구조 문법 모형(GPSG, HPSG, IPSG)
변형 및 통사적 이동을 인정하지 않는 단층위적 생성 통사론 모형. 제럴드 개즈다의 일반화 구 구조 문법(GPSG), 폴라드와 사그의 핵 중심 구 구조 문법(HPSG), 지표 구 구조 문법(IPSG) 등이 있다.GPSG는 자연 언어를 문맥 자유 문법(context-free grammar)으로 기술하려는 기획이었으나 현재는 실패한 것으로 평가되고 있다. HPSG를 실질적 후신으로 볼 수 있다. HPSG는 구문 문법(Consturction Grammar)과 결합하여 기호 기반 구문 문법(SBCG)을 탄생시키는 등 변화를 모색하고 있다.
5.2.2. 어휘 기능 문법 모형(LFG)
구 구조 문법과 마찬가지로 변형을 인정하지 않는 단층위적 생성 통사론 모형. 핵심적인 아이디어는 문장의 성분 구조(C-structure)와 기능 구조(F-structure)를 별개의 것으로 보는 것이다. LFG에서 하나의 통사적 단위는 성분 구조상의 역할과 기능 구조상의 역할을 별개로 갖고 있다고 보기 때문에, 촘스키주의 모형에서처럼 통사적 단위가 위치를 "이동하여" 여러 역할을 얻거나 잃게 된다는 식으로 설명하지 않게 된다.어휘 기능 문법은 생성 통사론으로서는 특이하게도 코퍼스 언어학 및 데이터 지향 파싱(DOP)에도 많은 관심을 기울이며 전산 언어학자들과 교류하고 있다.
5.2.3. 모형 이론적 통사론(RG, APG)
관계 문법(Relation Grammar), 그리고 사실상 동일한 이론의 다른 이름인 호쌍 문법(Arc Pair Grammar). 모형 이론적 통사론은 문법 관계(주어, 목적어 등...)가 구 구조보다 더 핵심적인 문법적 단위라는 주장을 기초로 발전한 생성 통사론 모형이다. 이 이론은 1980년대 이후로 지지자를 얻지 못하고 사실상 사멸하였다.6. 생성 음운론
6.1. 단선 음운론
6.1.1. 영어의 음성 체계(SPE)
- 자질 이론
- 음운 규칙
- 규칙순
6.2. 비단선 음운론
6.2.1. 자립 분절 음운론(ASP)
- floating tone
- feature geometry
- 원거리 작용(모음 조화)
6.2.2. 지배 음운론(GP)
6.3. 자연 생성 음운론(NGP)
6.4. 제약 기반 이론
- 제약
- 유표성 제약
- 충실성 제약
6.4.1. 최적성 이론(OT)
최적성 이론 항목으로.- 공모 작용(conspiracy)
- 제약 서열
- 재서열화
6.4.2. 조화 문법(HG)
- Harmonic Grammar
- Weighted constraints
- 조화 점수
7. 생성 형태론
생성 언어학에서 형태론은 음운론이나 통사론과 같이 독립적인 영역을 이루지 못한다. 따라서 '생성 형태론'이라는 조어는 어불성설이다. 그러나 생성 문법에서 형태론의 지위에 대한 고민은 60년대 이후 줄곧 있어왔다. 오늘날 생성 문법의 표준적 입장에서 말하자면, 통사론을 기준으로 형태론은 생성된 구조가 문자화(spell-out)되는 PF로 치부되며, 음운론을 기준으로는 음운 규칙의 적용 대상이 되는 기저형(underlying form)을 만들어내는 부분이 형태론에 해당한다. 즉, 가장 나이브한 교과서적인 관점에서 말하자면, 형태론은 통사론의 입장에서는 '음운론의 일부'요, 음운론의 입장에서는 '렉시콘의 일부'라고 말할 수 있다.한편, 2000년대 이후 젊은 생성 문법학자들을 기준으로 각광받고 있는 분산 형태론(distributed morphology)에서는 말 그대로 통사 구조의 각 부분에 분산되어 있는 형태론 모델을 상정한다. 분산되어 있다는 말을 구체적으로 풀어 쓰자면, 기존에 형태론의 일이었던 '형태소 결합'이, 통사부의 확대와 지연된 어휘 삽입 이렇게 두 가지로 분산되었다고 말할 수 있다. 렉시콘에 저장된 것은 어휘가 아닌 형태소들이며, 아직 소릿값을 갖지 않는 이 형태소들이 통사론적 결합을 한다. 즉, 전통적 통사론에서의 하위 구조를 더 밑으로 내려버리는 것이다. 또한 음성값이 주어지지 않은 구조체에 대한 어휘 삽입(vocabulary insertion)을 상당히 지연시켜서 구조가 국면에 다다라서 문자화할 때 어휘 삽입이 이루어지는 것으로 본다.
분산 형태론은 GB 시절 박사 학위를 딴 보수적 기성 학자들이 보기에는 실패한 이론(생성 의미론)의 재탕이 아니냐는 견해가 있지만, Morris Halle라는 대학자의 권위에 힘입어 젊은 연구자들을 중심으로는 사실상 표준으로 자리 잡은 상황이다. 2020년 이후 강단에 새로 들어오는 통사론 연구자는 거의 분산 형태론을 형태론 모델로 가지고 있다고 할 수 있다. 음운론의 경우, 기계 학습이나 최적성 이론을 하지 않는 전통적 의미의 생성 음운론자의 대부분이 분산 형태론을 상정한다. 반면 음운론에서의 최적성 이론은 연구 주제에 따라 형태론 자체가 불필요한 모델들을 상정하기도 한다.
정리하자면, 과거(90년대 이전)까지 생성 문법에서 형태론은 렉시콘의 일부로서 '그것에 대해 말하지 않겠다'라는 견해가 강하였고, 분산 형태론이 나온 이후에는 사실상 통사론에 포섭되어 통사론의 일부가 되어가고 있는 실정이다.[22] 여러모로, 형태론이 독립된 모듈로서 자리하기는 어려운 상황.
8. 생성 문법에서의 의미론
생성 문법에서 의미 관계는 둘 중 하나이다. 통사부에 들어오는 기본 형태(syntactic unit)로서 주어진 자질 혹은 구조 생성 이후에 이루어지는 해석. 의미가 오직 두 가지로만 인간 언어에 관계한다는 것은 생성 문법의 구체적인 틀이 바뀌어 오는 와중에도 이론 초기 이후 지금까지 변하지 않고 있다. 즉, 여전히 Chomsky(1972) 체제하에 있는 셈이다. 따라서 매우 역설적이게도 의미론은 생성 문법의 모듈러한 문법관에 따른 각 모듈이 패러다임 변화를 겪어오는 과정 속에서도 여전히 매우 안정적이다.[23] 생성 문법에서의 의미론은, 구조가 선행하고 이것이 해석됨으로써 의미가 파악된다고 하여 '해석 의미론'이라고 부른다.따라서 생성 언어학에서의 의미론은 결코 생성 의미론이 될 수 없다. 의미부는 생성의 대상이 아니기 때문이다. 더군다나 생성 의미론(generative semantics)이라는 이름으로 불리웠던 언어학 사조가 별도로 존재하며 엄밀한 의미에서 생성 문법의 해석 의미론과 정반대의 위치에 서있다. 생성 의미론 진영에서는 의미가 선행하고 특정 의미를 띠기 위한 수단으로 구조가 형성된다고 말하기 때문이다. 참고로 '의미가 생성된다'는 게 무엇인지 초심자들은 쉽게 개념화하기 어려울 수 있는데, 간단히 말하자면 다음과 같다.
한국어에는 '모르다'라는 술어를 예로 들어보자.[24] 이것은 '알다'의 반의어이다. 반면 영어에는 '모르다'에 직접 대응되는 단일어가 존재하지 않는다. 따라서 영어를 통해 '모르다'의 의미를 창출해 내려면 know의 부정을 함으로써 '모르다'라는 의미를 생성해야 한다. 바로 이 지점에서 생성 의미론은 모르다는 의미가 생성되고 거기에 맞추어서 언어별로 다른 구조가 뒤따른다고 주장한 것이다.
생성 의미론은 1970년대 상당히 많은 연구자들에게 어필하였으며, 실제로 생성 언어학 진영 내에서 언어학 전쟁이라고 불릴 정도의 이론 논쟁이 있었다. (언어학의 4대 기수 문서 참조) 그러나 여러 결정적 증거는 생성 의미론이 틀렸고 의미는 해석된다는 관점을 지지했다. 그러한 증거 중 하나가 한국어의 사동문이다. 한국어의 사동문에는 긴 사동과 짧은 사동이 있는데, '민준이가 철수에게 명령을 하여서 철수가 밥을 먹었다'라는 사건을 표상하기 위해 '민준이가 철수가 밥을 먹게 했다'(긴 사동)와 '민준이가 철수에게 밥을 먹였다'(짧은 사동)가 병존한다. 생성 의미론에 따르면, 두 구문은 정확히 동일한 의미를 가져야 한다. 동일한 의미 관계를 위해 구조가 병립하는 것으로 해석되기 때문이다. 그러나, 실제로 두 구문은 다른 의미를 가진다. 긴 사동에서 민준이는 철수가 밥 먹는 사건에 대해 간접적으로 영향을 미칠 뿐이고, 짧은 사동에서는 중의적이다. 바로 이 중의성이 생성 의미론에서 설명하지 못하는 부분이다. 왜냐하면, 이 중의성은 구조가 해석될 때 발생하기 때문이고, 바로 이것이 구조가 선행하고 이 구조가 (구조 생성이 모두 완료된 후) 인식-의지(cognitive-intensional\[sic\]) 접면에서 처리될 때 의미가 해석'된다는 결정적 증거이기 때문이다.
다시 생성 문법으로 돌아와서, 생성 언어학계 내에서만 배타적으로 통용되는 독자적인 의미 이론과 같은 것은 논리적으로 존재할 수가 없다. Cartography 이후 현대 생성 문법에서 거대 통사를 3분할하는데, VP부에서 논항 술어 관계의 의미 (주체:선생, 장소:교실, 이벤트:강의)를 다루고 IP에서 문법 관계, 그리고 CP부에서 화용 및 인지부와의 접면을 다룬다 (주체+존경:선생, 장소+현 위치와의 관계:교실, 이벤트+현재 시각과의 관계:교실) 즉, 화용이나 인지부에 상관되는 존경이나 여기, 저기, 거기 등의 공간 지시, 이벤트 시점과 현 시각과의 차이 계산인 시제 등을 CP부에서 받아 문법적 실현을 IP부에서 시키는 것으로 이해한다.
'의미'가 무엇이냐에 따라 다르겠지만, 사건의 관계에 해당하는 논항 술어 관계를 담당하는 의미 자질들은 죄다 VP 이하로 통사부에 삽입되어 들어오는 External merge(혹은 MERGE)로 설명된다. 한편, CP부 이상에서의 화용-인지 접면에서는, 행위주 존경 여부, 화자 존경 여부, 사건의 시간과 발화 시점 사이의 차이 계산, 사건의 장소와 발화 장소 사이의 차이 계산이 통사부로 삽입되어 들어온다. 그리고 IP부에서는 CP부와는 Agree(혹은 이론에 따라 Concord로 보기도 한다.)하여 화용-인지 의미를 가져오고 VP부와는 기능 핵에 의한 internal merge를 통해 사건 관계를 가져와서 이것을 언어 표현으로 표상한다. IP-CP 접면은 예컨대 사건이 현재보다 과거면 과거 시제로 표상(\[Tense\]값의 valuation)하고, 장소나 존칭 관계 또한 그렇게 문법 자질의 값을 부여하는 방식으로 구성된다. IP-VP 접면은 예컨대, 이벤트가 stative한지 여부에 따라 논항 자리에 이미 주어진 행위자 논항을 해석하여 넣는 것을 예로 들 수 있다.
다시 말해서, 생성 문법에서 이해하는 '의미'는 대화 맥락, 시공간 등의 고차원적인 부분(통사부에는 CP부에 해당) 아니면 술어 논리적인 저차원적 부분(통사부로는 VP부에 해당)일 따름이고, 의미는 생성될 수 없다.
9. 인접 학문과의 관계
10. 비판 및 평가
본 문서의 서론에서 언급한 것과 같이 생성 문법은 오늘날 인간 언어에 관하여서는 정상 과학으로 작동하는 표준 패러다임이다. 생성 문법 이전의 주류 언어학은 언어를 문화나 생활 방식(life style)의 일부로서 이해했고 따라서 이전까지는 언어를 심리학이나 역사, 문화 심지어는 문학과 같은 궤에 놓고 연구했다. 그러나 생성 문법의 형식주의적 설명 기제는 언어를 생물학적으로 진화 가능하며 유전 가능한 형질의 발현체(phenotype)로서 재정립했고, 문화나 여타 과학적으로 설명될 수 없는 인간의 종족 특성(species-specific)으로서 언어의 보편성을 연구할 수 있는 장을 열었다.이론 언어학 내에서 인지 언어학을 포함한 비생성 문법 진영에서는 생성 문법의 지나친 형식화와 '언어 현상'에 대한 설명력 부족을 들어 생성 문법에 대해 비판적 입장을 가지고 있다. 이들의 입장에서 볼 때 비언어적 인지/인식 능력이나 문화와 역사를 포함해서 실제로 언어가 사용되는 데에는 다양한 외부 요인이 작용하고, 따라서 언어를 이러한 요인들로부터 분리하려는 시도는 불가능하거나 무의미하다. 따라서 이들은 생성 문법이 '비언어 인지적, 문화적' 요인에 영향을 받은 언어 현상을 설명하지 못한다고 주장하며 생성 문법 이론 자체가 언어에 대한 설명력이 부족하다고 본다. 현재 생성 문법 진영과 인지 언어학 진영에서는 생산적인 대화가 거의 이루어지지 않고 있다. '언어'의 정의와 과학적 방법론에 대한 입장이 너무 다르기 때문이다.
언어학사에서 볼 수 있듯이 생성 문법 진영은 내외부 진영과의 활발한 이론 전쟁을 통해 발전했다. 촘스키 본인조차도 스키너의 행동주의 언어학을 비판하며 커리어를 시작하였고, 이후 60년대까지의 변형의 심리적 실체 논쟁, 7-80년대의 생성 의미론-해석 의미론 논쟁, 구조에 대한 이동과 변형의 영향력 논쟁, 또한 오늘날까지 이어져오는 표상-도출 논쟁(최소주의자 대 최적성 이론가들)과 MERGE의 언어 보편성 논쟁(에반스# 대 생성 문법론자들##) 등 생성 문법은 결코 방구석에서 눈 가리고 아웅 하는 책상 발림 이론이 아니다. 과학적 실증적 데이터를 통한 논쟁에 생성 문법은 언제나 열려있고, 또한 논쟁을 통해 생성 문법 자신이 혹은 논쟁의 반대편에 선 이론이(즉, 인지 심리학, 생성 의미론, 비변형 생성 문법, 최적성 이론 등) 발전하기도 하였다. 그러나 인지 언어학이나 프랑스발 소위 '문화 언어학'과는 논쟁을 하지 않는 이유는, 아예 기본적 전제부터 논지 구성 방식까지 다르기 때문이다.
오늘날의 생성 문법은 촘스키가 제창하기는 했지만, 촘스키 개인의 언어 이론과는 상당히 다른 궤도에 올라있다. 그러나 언어에 대한 자연과학적 접근이라는 촘스키의 방법론은 오늘날에도 유효하다. 이는 촘스키가 천재이거나 우월해서가 아니라 촘스키 본인의 말대로 많은 연구자들이 생성 문법의 논리적 설명적 당위성에 동조하기 때문이다.
촘스키를 중심으로 한 생성 문법을 (현상학적) 언어 철학에 기반하여 비평한 강명윤 교수의 논문(링크)을 참고하기에 좋다.
11. 관련문서
[1] 대중의 상식과는 달리 도구를 사용하거나 두 물건을 결합해서 사용하는 것은 다양한 동물종에서 이미 관찰되었다. 그러나 여전히 결합된 상태의 두 물체를 개별 단위로 인식한다. 반면 Merge라고 불리는 이 인간 고유의 기제에 의해 인간은 자신이 창출한 단위를 결합 단위가 아닌 단일 단위로 인식하고 그것을 다시 다른 단위와 결합할 수 있는 것이다. 예컨대, 프로그래밍에서 고수준 프로그래밍 언어의 출현 이후 컴파일할 따름이지 더 이상 어셈블리어로 직접 개발하지 않는 것을 생각해 보자. 혹은 바퀴를 발명한 이후 그것을 하나의 단위로 가져다 이용할 뿐이지 매번 바퀴를 새로 발명하지 않는다는 것을 생각해 보자. 한편 까마귀나 유인원이 우연한 단일 사건으로 나뭇가지와 돌멩이를 결합해 도구를 만들어 사용했다고 하더라도 그것은 여전히 "나뭇가지" + "돌멩이"일 뿐 "돌도끼"가 아니다.[2] 형식 언어론은 인간의 언어를 묘사하는 데도 이론적 배경으로 쓰일 수 있지만, 형식 언어론이 말하는 '언어'는 인간의 언어에 한정되는 것이 아니기 때문에 프로그래밍 언어나 컴퓨터의 보안 구조, 순수 수학의 대수 구조 등을 연구하는 등 인간의 언어와 전혀 무관하게도 적용되며, 예문에 대한 모어 화자의 직관이 아닌 수학적 증명을 통해서만 연구된다.[3] 참고로 'grammatica'라는 명칭이 영어에서 문법을 말하는 'grammar'와 유사하다는 이유만으로 중세 자유 학예 분과의 grammatica를 언어학의 맹아로 생각할 수도 있는데, 이는 사실이 아니다. 그라마티카는 수사학과 함께 문학과 서지학으로 계보가 이어졌다. 소쉬르 이전에 언어학의 맹아를 찾으려면 파니니 문법에서 찾는 것이 더 타당하다.[4] 언어학에 대해 알지 못하는 일반인과 수능 영어 강사 등은 오늘날에도 여전히 언어를 이런 식으로 생각한다.[5] 화학의 분자 개념이 원자로 세분화되는 것과 마찬가지로 언어학에서의 조합의 단위 역시 형태소, 자질로 세분한다. 분자가 화학적 특성을 가지는 최소 단위인 것처럼 형태소는 문법적 기능을 가진 최소 단위이며, 분자가 원자로 세분되는 것처럼 형태소도 특정 성질을 가진 자질로 쪼개진다.[6] 한정된 뇌라는 개념은 뇌의 부피는 물론 인간의 인지 능력이 한정되어 있다는 뜻이기도 하다.[7] 수학적 과정으로 형식화된 '알고리즘' 역시 컴퓨터 과학과 현대 언어학이 공유하는 개념이다. 사실 이것은 단순히 생성 문법에 한정되는 것이 아니라 대부분의 현대 언어학에 해당한다.[8] 촘스키의 변형 문법의 펀딩 서포터 중에 CIA가 있는 이유도 이 때문이다. 70년대 당시 CIA는 첩보 활동의 결과로 다량의 러시아어 문헌을 취득했으나 사람이 번역하는 속도에 한계가 있고 비용이 비싸기 때문에 병목 현상이 발생하던 차였는데, 일개 공대 교수가 기계 번역의 이론적 모델을 연구한다기에 쌍수를 들고 과감한 지원을 한 것.[9] 많은 사람들이 착각하는 것과는 달리 Linguistic Inquiry는 통사론 저널이 아니다. 생성 문법의 틀 안에서 이루어지는 연구라면 통사-형태론뿐만 아니라 음운론이나 의미론 논문도 수록된다. 대표적으로 Morris Halle의 feature spreading 논문이 LI에 게재된 논문이다.#[10] 결정적 시기 가설이나 언어습득장치 참고[11] '종 특이성/종 특이적'이라는 용어는 생물학의 일부나 생성 언어학에서, 다른 생물종에서 일반적으로 발견되지 않는 특정 생물종의 특이한 자질을 나타내는 전문 용어로 사용된다. 예를 들어, 새의 비행 능력(당연히 '조류 전체'를 두루뭉술하게 일컫는 것은 아니다. 펭귄이나 박쥐 같은 반례가 있기 때문이다)이나 인간의 언어 능력 등. 간혹 종족 특성이라고 번역하기도 하나, 인터넷이나 비디오 게임에서 사용되는 해당 개념과는 약간의 차이가 있다.[12] 실제로 딥 러닝이 상용화된 오늘날에 더욱 지지받는다. 기계 학습을 할 때 파라미터를 엄청나게 설정하는데, 뇌가 완전히 발달하지 않은 인간이 수천 가지 파라미터를 설정해서 언어를 습득한다는 것은 논리적 설명이 아니다.[13] 오해하기 쉬운 부분이, 생성 문법에서는 언어 자극을 무시한다는 오해인데, 그렇지 않다. 다양한 언어가 존재하는 실증적 사실 자체가 언어 자극에 따라 다른 언어가 습득된다는 결정적 증거이다. 단, 그 자극이 한 언어를 특정할 정도로 풍부하지 않다는 것이 사실이고, 이러한 상황에서도 완전한 언어가 습득될 수 있는 이유가 바로 '타고났다.'는 설명이 필요한 이유다.[14] 2000년대 초반까지, FOXP2 유전자가 촘스키의 생득주의 언어 능력을 지지하는 증거로 제시되어 왔다. 또한 일본어 위키백과에서는 아직도 이러한 논지로 적었다.# 그러나 이것은 사실이 아닌 것으로 판명되었다. FOXP2는 언어의 표출, 즉 구조가 모두 생성된 다음 그것이 발음되는 능력을 설명하는 유전자이다. 실제로 FOXP2가 결여된 경우 인간에게는 언어 능력은 가능하되, 그것이 표출되지 않는 장애로 나타난다. 또한 FOXP2는 조류에게서도 발견되는데, 오직 특정 songbird들에서만 발견되는 것으로 보아, 울음소리의 구조화를 담당하는 것으로 여긴다.[15] 외국어 학습 포함.[16] 행동, 기술을 배우는 것은 몸으로 익혀서 '자연스럽게' 배우는 것이지만 언어는 그렇지 않고 언어 습득 장치를 통해 '습득된다'라는 주장이다.[17] 거듭 말하지만 이 장치가 물리적으로 독립된 영역에 존재하지 않을 수 있고 반대로 독립되어 있을 수도 있다. 거기 관심을 가지는 신경 통사론 같은 학문도 있지만 일단은 생성 문법에서는 알 바가 아니며 알 수도 없다.[18] 베르니케 영역에서 넘어온 추상적인 개념을 구체적인 단어와 문장의 조합으로 직렬화(serialization) 하는 것은 브로카 영역이라는 부위에서 주로 담당한다고 알려져 있다.[19] 최신 기종의 가정용 컴퓨터라면 20년 전 OS와 하드웨어로 이루어진 윈 98과 380 그래픽 카드 정도로 부팅된 컴퓨터 화면을 동시에 20개는 시뮬레이션할 수 있다. 그걸로 거상이나 대항해시대 온라인 같은 같은 구시대 온라인 게임 다중 클라나 돌리겠지만....[20] 3대 타당성에 대한 구체적인 설명은 Chomsky, Noam (1964). Current Issues in Linguistic Theory. In The Structure of Language, eds. by Fodor, J., & Katz, J., 50-118. Prentice Hall.에서 처음 언급되었고 이 단락의 서술도 Chomsky (1964)에서 크게 벗어나지 않는다.[21] 이것을 부연해서 설명하자면, 자연 언어에서 의미가 없는 문자열 혹은 단어 배열을 언어 이론을 가지고서 '이것은 언어가 아니다'라고 판단할 수 있어야 한다. 혹은 이를 '화자의 (문법성에 대한) 직관을 설명하여야 한다'고 이해하는 학자도 있다.(고희정, 2018)[22] 개론 교과서를 기준으로 말하자면, 아직 Carnie나 Radford 등 보수적 개론서에서는 분산 형태론을 적극 지지하지는 않고 단지 '넌지시 뉘앙스를 풍기는' 정도에서 그치고 있으며, Sportiche, Koopman & Stabler 등 진보적 관점에서 쓰여진 교과서에서는 대놓고 분산 형태론의 양상으로 형태론을 통사론의 일부로서 취급하고 있다.[23] 이를 달리 말하면 촘스키의 70년대 이론이 상당히 선구안적이었다고도 말할 수 있다. Chomsky 1972 Studies on Semantics in Generative Grammar는 그 유명한 Remarks on nominalization 등 3편의 논문이 묶인 논문집이다. 생성 문법 연구자 혹은 연구자가 되기를 희망하는 학부생이나 대학원생이라면, 기초를 다지는 것은 물론 새로운 인사이트를 얻기 위해서도 독서가 추천된다.[24] 형식적으로 말했을 때, 이것은 '모르-'라는 어근과 '-다'가 결합된 형태이고, 이것은 문법적 결합이기 때문에 의미의 생성 여부와는 별개의 문제이다. 따라서 이 단락에서 '모르다'는 기실 '모르-' 부분만을 지칭하는 것이다. 그러나 편의상 '모르다'로 통칭하기로 한다.