學術, 敎育

세계의 언어는 모두 몇개인가?

이강기 2015. 10. 13. 22:42
세계의 언어는 모두 몇개인가?

【언어와 문자의 세계】


                                        

 

박기용<서울고전문화연구소장>

신동아 1997년 6월호

《세계의 개별언어는 현생언어와 기록언어를 포함해 5천5백종이 넘는 것으로 판단된다. 세계 언어는 지구 전체에 발생한 천재지변으로 말미암아 아주계(阿州系)와 구아계(歐亞系)로 이분화되었을 가능성이 높다.》

 

    언어의 기원 못지 않게 인류의 궁금증을 부추기는 의문은 언어가 왜 서로 다르며 그 수가 얼마나 되느냐는 것이다. 무인도에 칩거하지 않는 이상 오늘날 지구촌 어디에서나 우리는 하루에도 몇 가지 언어와 만나게 되어 있으므로, 이 두 가지 의문은 동전의 앞뒤와 같다. 첫번째 의문은 언어의 속성과 결부되어 있는 본질적인 문제이며, 두번째 의문은 언어의 분류에 대한 통계적인 문제이다.

언어과학이 성립된 이래 언어의 상이점은 여러 언어학자가 집요하게 파고 들어 수긍할 수 있을 정도로 연구되었다. 그러나 언어의 분류는, 불세출의 언어학자라도 기록언어 (사어)와 현생언어(현대어)를 망라한 모든 언어에 대한 어학능력을 갖출 수 없으므로 근원적으로 정확을 기할 수 없다. 기록언어는 인구(人口)에 회자(膾炙)되는 문헌과 문법서를 갖추었거나 도서관이 몽땅 발굴된 경우도 있지만, 지명이나 어휘 몇 개로 전해지는 경우가 허다하다. 또한 언어의 수는 그 분류기준을 어떻게 설정하느냐에 따라 다를 수밖에 없다.

언어는 음성기호이다. 사람의 조음기관에서 산출될 수 있는 음성기호는 많아야 50종에 불과하지만, 이에서 생성될 수 있는 어휘를 비롯한 문법범주의 수효는 기하급수적인 조합이 가능하므로 무한대에 이른다.

3만5천년 전으로 추정되는 언어기원의 연대 이전에 「슬기사람(Homo sapiens)」은 지구의 거의 모든 지역에 흩어져 살았으므로, 그들의 생활공동체는 별개의 언어공동체 나 언주(言主)집단으로 성립되었다. 언주집단은 음성기호를 임의적으로 선택할 수 있으므로, 문법범주는 해당 언주집단에서 통용되는 배타적인 약속으로서 실현된다. 에스 페란토와 같은 인공언어도 자연언어를 토대로 성립되었으므로, 인간언어는 모두 최초의 언주집단에 그 시원을 둔다. 내가 낳은 아들 딸의 이름을 짓는 것도 언주집단의 음성 기호가 지니는 문법범주를 벗어날 수 없듯이, 현생(現生)언어의 문법범주 일체는 생명체와 같이 단절되지 않은 1개 언어의 역사성을 반영한다.

음성기호는 지시대상을 전제로 한다. 음성기호는 그릇(형식)으로, 지시대상은 그 안에 담긴 물건(질료)으로 비유될 수 있다. 따라서 지시대상이 없는 음성기호란 말장난, 즉 공(空)집합에 불과하다. 지시대상은 인류보편적인 사항이지만 언주집단에 따라 별개의 음성기호로 표출될 수 있고 음성기호와 지시대상 간의 대응은 임의적이므로, 특정 지 시대상에 대한 음성기호의 수효는 언주집단이 있는 만큼 많게 마련이다.

지시대상은 개념으로 존재하지만, 이는 음성기호에 의하여 어휘로 구성된 명제(문장)로 표현된다. 어휘나 문장도 시간의 진행축에서 볼 때 선상적(線狀的)인 것인데, 문장은 어순에 따라 진행된다. 어휘는 무한하며 어순은 유한하다. 유한하지만 어순 역시 어휘의 경우와 마찬가지로 언주집단에 따라 임의적으로 선택된다. 따라서 어순의 유형은 언 어에 따라 서로 다르다. 어순의 유형도 비록 가장 보수적이지만 바뀔 수 있는 문법범주이다.

언어는 문법체계로 구성되며 문법체계는 음운체계(발음), 형태체계(어휘), 통사체계(어순)로 대별된다. 이들 세 가지 체계는 계통 여부에 따라 서로 비슷하거나 다르다. 이 다름의 정도는 어족(語族), 제어(諸語), 어파(語派), 개별언어, 방언(사투리)의 순으로 내려갈수록 줄어든다. 방언은 어순에서 동일하지만 발음이나 어휘 몇 가지에서 변별되 는 개별언어의 구성원이므로 별개의 언어로 분류되지 않는다. 방언차(差)로 불리우는 방언의 상이점이 커서 의사소통이 불가능한 경우, 별개의 개별언어로 분류되기도 한다.

이로 말미암아 현생언어의 수효는 늘어나기도하고 줄어들기도 한다. 어족(제어 포함)이 다른 개별언어는 문법체계 전반에서 모두 다르며, 어족이나 어파가 같은 개별언어는 그 근친성(近親性)의 정도에 따라 발음·어휘·어순에서 차이점을 보인다. 어족이나 어파의 계통 여부와 관계없이, 개별언어란 문법체계의 상이점으로 말미암아 인위적인 학습을 거치지 않고는 의사소통이 불가능한 경우를 뜻한다.

우리가 언어의 수를 헤아릴 때 흔히 「언어」라고 말하는데, 이는 개별언어를 일컫는다. 개별언어는 계통이 확인되었거나 그렇지 못한 경우를 막론하고 언어의 분류에서 기준으로 설정된다. 개별언어의 수효는 위클리프 성서번역공회(1984)의 『세계의 언어』에서 5천4백45종으로, 그리고 룰렌(Merritt Ruhlen, 1987)의 『세계언어입문』에서 5천3백13종으로 각각 집계되었다. 전자는 성서가 번역되거나 번역될 언어에 국한해 헤아린 것이며 두드러진 방언을 다수 포함하고 있다. 후자는 언어학적인 관점에서 분류 되었지만 언어분석자료가 영세한 기록언어를 다수 제외한 것이다.

따라서 기록언어와 현생언어를 포함해 세계의 개별언어는 5천5백종을 넘을 것으로 판단된다. 물론 이는 기록이 없는 사어를 고려하지 않은 수치이다. 언어의 기원(3만5천년 전)에서 문자의 기원(5천2백년전)에 이르는 사이에 사어가 된 개별언어와, 문자의 기원 이래 오늘날까지 기록을 남기지 않고 사어가 된 개별언어의 수는 아무도 모르는 일이다.

 

5천5백종 넘는 세계 언어

언어계통론에서는 계통이 확인된 경우 이를 어족(語族)으로, 계통의 확인이 미진한 경우 이를 제어(諸語)로, 계통의 확인이 불가능한 경우 이를 계통미확인 언어로 분류하고 있다. 앞에서 언급한 룰렌은 준(準)어족에 해당되는 제어를 모두 어족으로 다루었다. 이를 받아들이면 어족은 코시아, 니제르-코르도파니아, 나일-사하라, 아아(阿亞), 코카 시아, 인혁(印赫, INDO-HITTITE; 종래의 인구어족), 우랄-유카기르, 알타이, 축치-캄차카, 에스키모-얼루시아, 엘람-드라비다, 한장(漢藏), 대양주, 인도-태평양, 오스트리아, 나-데네, 아메린드 등 17종에 이른다.

우리에게 잘 알려진 애급어 에티오피아어 아카드어 히브리어 아람어 아랍어 페니키아어는 아아(阿亞)어족에, 라전어 희랍어 범어 혁제어(赫梯語, Hittite)와 영어 독어 불어를 포함한 구라파의 현생언어 일체는 인혁어족에, 헝가리어 핀란드어는 우랄-유카기르어족에, 만주어 몽골어 토이기어는 알타이어족에, 한어(漢語, 중국어) 서장어(西藏語, 티 베트어)는 한장어족에, 월남어 인도네시아어는 대양주어족에 속한다.

또한 룰렌은 한국어를 알타이어족으로, 수메르어는 계통미확인 언어로 분류했다. 하지만 한국어는 수메르어와 마찬가지로 아직은 계통미확인 언어로 놔두어야 마땅하다. 국 어가 알타이어족의 성원과 마찬가지로 토씨를 쓰며 어순에서 같고 차용 여부가 말끔하게 밝혀지지 않은 몇몇 어휘에서 대응하므로 자칫 알타이어족에 포함되기 쉽다.

국어와 알타이어족에서 두드러지게 다른 문법범주는 주격(主格)토씨이다. 주격토씨는 국어에서 「-이」나 「-가」로 실현되지만 알타이어족에는 없다. 국어 이외에 주격토 씨를 갖추고 있는 언어는 룰렌이 알타이어족의 한일어파(韓日語派)로 분류한 일어(「-ga」), 19세기에 사어가 된 유카기르어(「-e」), 최초의 문자문명을 일으킨 수메르어( 「-e」) 3종에 한한다. 국어와 수메르어는 주격토씨 이외에도 문법범주를 다수 공유하는데, 이는 양자가 계통론적으로 무관하지 않음을 시사한다.

조철수씨의 논문 「수메르어 국어고어(古語) 문법범주 대조분석」에 따르면, 수메르어와 국어에서 대조되는 문법범주가 꽤 있다. 예를 들어 속격(屬格)토씨는 /-ak/(수메르 어)와 /-ㄱ; -ㆁ/(중세국어)이다. /ak/의 /k/는 상실되거나 유지되며, /ㄱ; ㆁ/은 /*악/에서 /*아/를 상실하거나 음변화를 겪은 것이다(*은 재구음을 가리킨다). 이외에도 지 시사, 사역형태소, 수사 등에서 두 언어의 유사함을 찾아볼 수 있다. 또한 수메르어와 국어의 토씨는 주로 명사에서 전성된 것으로 알려져 있다. 특히 주격토씨(/-e; -이/)는 근칭 지시사 /-e; 이#/에서 전성된 것이 확실시된다. 이는 수메르어와 국어가 주격토씨의 형성 이후(5천년 이전) 미지의 언주집단에서 갈라진 것으로 짐작된다.

수메르어는 후대어를 남기지 않았고 국어는 수메르어와 엇비슷하게 오래된 기록이 없다. 더욱이 기록연대를 놓고 보면 수메르어와 국어의 기록문건은 4천년 이상 시간적으 로 격리된 것이다. 수메르어와 국어의 계통확인은 따로따로라면 당연히 불가능하겠지만, 양자의 문법범주에 대한 대조분석이 성공적으로 수행된다면 전혀 불가능한 것이 아닐 수도 있다. 향후 수메르어와 국어가 공유하는 문법범주가 대거 논증되는 경우 양자의 계통은 동반하여 확인될 수 있을 것으로 보인다.

뿌리가 같은 낱말인 동원어(同源語)는 어족의 차원을 벗어나면 찾아볼 수 없다는 것이 언어학의 지론이다. 그러나 실제로는 어족의 경계를 벗어나는 동원어가 비일비재하다.

예를 들면, <태양·광명·안녕>을 지칭하는 동원어는 ser(수메르어, <광명>); 해, 설(-날), 살(한국어, <태양, 햇(-날), 나이>); sw(고대애급어, <태양>); sahada(에티오피아 어, <태양>); Samas(아카드어, <태양신>); semes, salom(히브리어, <태양, 평화>); sams, salam(아랍어, <태양, 평화>); 세·서(한어, <歲, 曙>); surya(범어, <태양>); h elios(희랍어, <태양>); sol, salus(라전어, <태양, 안녕>); sun(영어, <태양>) 등이다. 이는 자음(s/h/s)-모음-자음(r/l/m/n/ф)으로 취합되며, 이에는 어족 3종과 계통불명 언어 2종이 포함되어 있다. 이외에도 동원어는 친족명칭(<아버지·어머니>)이나 기본적인 동작을 나타내는 동사(<가다·오다>)에서 나타난다.

이러한 동원어는 구라파와 아시아의 어족 대부분과 계통불명 언어에서 찾아볼 수 있지만 코시아, 니제르-코르도파니아, 나일-사하라와 같은 아프리카의 토박이 어족에서는 그렇지 않다. 위에 언급된 아아(阿亞)어족의 고대애급어와 에티오피아어는 실은 아시아에서 아프리카로 건너간 것이다. 따라서 아프리카의 토박이 어족과 구라파-아시아의 어족 양자에서 대응하는 동원어는 존재하지 않는다.

이는 언어의 기원 이후부터 문자기록 이전에 이르는 어떤 시점에서 지구 전체에 발생한 천재지변(예를 들면, 노아의 홍수)으로 말미암아 언어의 갈래가 아주계(阿洲系)와 구 아계(歐亞系)로 이분화되었을 가능성을 암시하는 대목이다. 앞에서 5천5백종으로 추정된 세계의 언어란 결국 아주계와 구아계의 이분화 이후에 성립된 개별언어의 수효로 볼 수 있다. 이러한 이분화를 초래한 원인이 없었다면, 세계의 언어는 5,500종을 훨씬 넘을 것이다. 아주계와 구아계의 이분화에서 언어의 계통에 대한 필자의 견해는 이원론 (二元論)으로 주장될 수 있다.

그러나 앞에서 언급되었듯이 3만5천년 전으로 추정되는 언어의 기원연대 이전에 슬기사람은 지구의 전역을 차지하고 살았으며 그만큼 많은 언주집단이 흩어져 있었다. 이들 언주집단이 각각 지녔던 음성기호(언어)는 다원적(多元的)으로 성립되지 않을 수 없었으며, 이들 언어는 이분화를 초래한 대사변이 발생할 때까지 다원적으로 존속했다. 대 사변을 모면한 언주집단은 아프리카와 구라파-아시아에서 각각 1개였다. 아프리카의 언주집단에서 아주계가, 구라파-아시아의 언주집단에서 구아계가 각각 형성되었다.

따라서 언어의 계통은 다원론에서 이원론으로 통폐합된다. 이러한 가설은 언어계통론과 언어학의 인접과학으로부터 대대적인 도움을 받아야 하는 사안이지만 동원어의 실 재 여부에 대한 논증으로써 입증될 수 있다. 한편 1960년대에 일단의 언어학자는 구(舊)대륙(아프리카·구라파·아시아)에 최소 6종의 원형(原形)언어가 있었던 것으로 주장했다. 이는 「우리 언어」(Nostradic)로 명명된 5만년전의 원(原)언어에서 분화된 것으로 상정되었다.

 

탈어족(脫語族) 언어학의 필요성

언어의 분화에 대한 좋은 실례는 말기 통속라전어와 로망스어이다. 전자는 서기 800년대에 이르러 라전어의 형태체계를 몽땅 잃어버려 더이상 라전어로 볼 수 없는 지경에 이르렀느데, 이에서 후자가 분화되었다. 따라서 통속라전어는 선대어이며 로망스어는 그 후대어이다. 로마가 통치하던 지역(이탈리아 이베리아 갈리아 발칸)에서 통용되던 선대어는 로마의 세력이 약화되면서 서기 800년 이후 이들 지역에서 각각의 후대어로 변모했으며, 이는 로망스어로 불려진다.

이탈리아로망스어는 사르디니아어 달마씨아어 이탈리아어 프리울라어 라딘어 로만쉬어; 이베리아로망스어는 카탈로니아어 서반아어 갈리시아어 포도아어 모자라빅어; 갈 리아로망스어는 프랑코-프로방샬어 불어 프로방샬어; 발칸로망스어는 루마니아어 이스트로-루마니아어 메글레노-루마니아어 아루마니아어 등으로 각각 갈린다. 기독교가 구심적인 구실을 맡았던 문자기록 시대에 이러한 언어의 분화가 1천년 어간에 이루어졌는데, 그렇지 않았던 시대의 언어분화는 더 심했을 것이다.

언어의 모든 문법범주는 변하며, 앞의 음운체계 형태체계 통사체계에 덧붙여 의미체계도 바뀐다. 이러한 변화를 그친 언어는 사어(死語)로 불리우는데, 현생언어는 모두 그 선대어가 변화해 온 최종단계에 있는 후대어이다. 기록이 없는 사어는 그 존재 여부도 추정이 불가능하며, 비록 다른 언어에 그 언어명이 실려 있을지라도 기록을 남기지 않 은 사어의 계통은 헤아릴 방도가 없게 마련이다.

기록언어라 할지라도 후대어를 남기지 않은 사어의 계통은 근친성이 있는 언어가 확보되지 못하면 추적이 불가능하다. 또한 기록이 없는 현생언어라 할지라도 근친성이 있는 언어가 몇 개 존재하면 계통 추적이 전혀 불가능하지 않다. 이에서 사용되는 계통론의 방법론은 언어학에서 외적 재구(外的 再構)로 불려진다. 앞에서도 언급했듯이 수메르 어는 후대어를 남기지 않았으며, 한국어와 근친성이 분명한 언어는 찾아볼 수 없다. 알타이어의 경우보다 더 확실한 문법범주를 수메르어와 국어에서 다수 찾을 수 있으므로, 양자의 계통에 대한 연구가 요망된다.

언어의 계통은 동원어의 존재 여부에 의한 어계(語系)와, 문법범주의 근친성 여하에 의한 어족 양자로 구분하여 고려되어야 한다. 지금까지 언어의 계통은 어족의 테두리 안 에서 추구되어 왔으므로 계통확인 방법은 내(內)어족적인 것이었으며, 언어학은 내어족 언어학이었다. 아주계와 구아계로 대립되는 동원어의 실재에서 계통확인 방법은 탈( 脫)어족적인 것이어야 하며 향후의 언어학은 탈어족 언어학이어야 한다.

언어분석자료와 인접과학의 연구성과를 성공적으로 다룰 수 있게 되면, 언어의 갈래에 대한 우리의 궁금증은 상당 부분 해소될 수 있을 것으로 보인다. 5천5백종에 달하는 개별언어를 통달할 탤런트(재능)는 누구에게도 없지만, 그래도 골고루 선별한 개별언어 2백~5백종에 대한 언어분석능력을 갖춘다면 언어의 계통확인은 난공불락의 요새로 만 남을 수 없을 것이다. 계통미확인 언어를 모국어로 지닌 민족은 마치 족보를 잃은 사람이나 마찬가지이다. 국어의 계통확인은 탈어족 언어학의 차원에서 추구되지 않는 한 계속 미궁에 머무를 것이다.