말뭉치 기반 국어 연구 총서 시리즈 25권. 이 빈도 사전의 특별한 점은, 이제까지의 빈도 조사 결과들의 심각한 문제점으로 여겨져 온 것들을 해결하려고 애썼다는 점이다. 국어정보학과 말뭉치언어학의 연구 성과를 바탕으로, 구어 균형 말뭉치를 구성하여 조사하였기 때문에 한국어 구어의 실제 모습이 있는 그대로 반영되었다.
단순히 빈도수 합만을 밝힌 것이 아니라, 구어를 네 가지의 종류 즉 사적 대화와 공적 대화, 사적 독백과 공적 독백의 넷으로 나누어 낱말마다의 쓰임을 비교해 볼 수 있도록 하였다. 어떤 말이 대화에서만 자주 쓰이는지, 독백에서만 자주 쓰이는지, 혹은 공적인 자리에서 자주 쓰이는지, 사적인 자리에서 자주 쓰이는지를 한 눈에 알 수 있다.
빈도표에서는 낱말뿐 아니라, 조사(토씨)와 어미(씨끝)의 빈도를 모두 함께 보였기 때문에, 한국어의 전체 모습을 한꺼번에 파악할 수 있다. 같은 말의 변이형태나 구어형을 대표 올림말에 함께 모아서 배열하였기 때문에, 어떤 말이 실제의 구어에서 얼마나 다양하게 나타나며, 형태들에 따라서 어느 정도 더 또는 덜 자주 쓰이는지, 또 대화인지 독백인지, 공적 장면인지 사적 장면인지에 따라서 그 쓰임이 어떻게 달라지는지를 한 눈에 알 수 있다.
이전의 많은 빈도표에서 출판상의 사정 때문에 빈도가 높은 일부의 자료만을 실음으로써 당시 언어의 전체 모습을 알 수 없었는데, 이 빈도표에서는 빈도 1까지의 모든 목록을 수록하여, 다른 시대, 다른 자료, 다른 방법에 의한 그 어떤 조사 결과와도 비교할 수 있게 하였다.
최근작 :<현대 한국어 어휘 빈도 사전 2> ,<현대 한국어 어휘 빈도 사전 1> ,<한국어 기본어휘 의미빈도 사전> … 총 30종 (모두보기) 소개 :세대학교 국어국문학과 교수.
연세대학교 국어국문학과 졸업(1982년) 후, 같은 대학원에서 문학석사 학위(1984년), 문학박사 학위를 받음(1992년).
1988년~1993년 일본 동경외국어대학 조선어학과, 1993년~1995년 츠쿠바(筑波)대학의 문예언어학계 교수를 지냄. 1995년 연세대학교 조교수로 부임, 부교수를 거쳐 현재 교수로 재직 중.
1995년~1996년 한국어 능력 시험(현재 TOPIK)을 위한 기초 연구와 모형 개발에 참여했으며, 1998년~2007년 문화관광부의 21세기 세종계획 국어정보화 기반 구축 사업의 국어 특수자료 구축 분과의 책임을 맡아서 한국어 구어 전사 말뭉치 과제를 수행하는 한편, 같은 기간 동안에 이루어진 한국어 해외 보급 사업에 참여하여, 『외국인을 위한 한국어 학습 사전』 등을 개발함.
『국어정보학입문』(공저 1998), 『한국어 구어 연구(1, 2)』(공편 2003, 2005), 『한국어교육과 학습사전』(2003), 『외국인을 위한 한국어 학습 사전』(공저 2004, 2006), 『한국어 구어 말뭉치 연구』(공저 2013), 『한국어 기본어휘 연구』(2013), 『한국어 구어 빈도 사전(1, 2)』(2015), 『한일대역 한국어 기본어휘 의미빈도 사전』(2017), 『최현배의 우리말본 연구(1, 2)』(2017, 2018), 『한국어 기본어휘 의미빈도 사전』(개정판, 2019) 등의 저서와, 한국어 문법 연구, 말뭉치언어학과 국어정보학, 학습 사전 편찬, 한국어 기본어휘 등과 관련된 논문을 발표함.
이 빈도 사전의 특별한 점은, 이제까지의 빈도 조사 결과들의 심각한 문제점으로 여겨져 온 것들을 해결하려고 애썼다는 점이다.
첫째, 국어정보학과 말뭉치언어학의 연구 성과를 바탕으로, 구어 균형 말뭉치를 구성하여 조사하였기 때문에 한국어 구어의 실제 모습이 있는 그대로 반영되었다.
둘째, 단순히 빈도수 합만을 밝힌 것이 아니라, 구어를 네 가지의 종류 즉 사적 대화와 공적 대화, 사적 독백과 공적 독백의 넷으로 나누어 낱말마다의 쓰임을 비교해 볼 수 있도록 하였다. 어떤 말이 대화에서만 자주 쓰이는지, 독백에서만 자주 쓰이는지, 혹은 공적인 자리에서 자주 쓰이는지, 사적인 자리에서 자주 쓰이는지를 한 눈에 알 수 있다.
셋째, 이 빈도표에서는 낱말뿐 아니라, 조사(토씨)와 어미(씨끝)의 빈도를 모두 함께 보였기 때문에, 한국어의 전체 모습을 한꺼번에 파악할 수 있다.
넷째, 같은 말의 변이형태(예컨대, 주격조사 ‘이’와 ‘가’)나 구어형(구어 실현형... 이 빈도 사전의 특별한 점은, 이제까지의 빈도 조사 결과들의 심각한 문제점으로 여겨져 온 것들을 해결하려고 애썼다는 점이다.
첫째, 국어정보학과 말뭉치언어학의 연구 성과를 바탕으로, 구어 균형 말뭉치를 구성하여 조사하였기 때문에 한국어 구어의 실제 모습이 있는 그대로 반영되었다.
둘째, 단순히 빈도수 합만을 밝힌 것이 아니라, 구어를 네 가지의 종류 즉 사적 대화와 공적 대화, 사적 독백과 공적 독백의 넷으로 나누어 낱말마다의 쓰임을 비교해 볼 수 있도록 하였다. 어떤 말이 대화에서만 자주 쓰이는지, 독백에서만 자주 쓰이는지, 혹은 공적인 자리에서 자주 쓰이는지, 사적인 자리에서 자주 쓰이는지를 한 눈에 알 수 있다.
셋째, 이 빈도표에서는 낱말뿐 아니라, 조사(토씨)와 어미(씨끝)의 빈도를 모두 함께 보였기 때문에, 한국어의 전체 모습을 한꺼번에 파악할 수 있다.
넷째, 같은 말의 변이형태(예컨대, 주격조사 ‘이’와 ‘가’)나 구어형(구어 실현형, 예컨대 ‘그런데’와 ‘근데, 근디’)을 대표 올림말에 함께 모아서 배열하였기 때문에, 어떤 말이 실제의 구어에서 얼마나 다양하게 나타나며, 형태들에 따라서 어느 정도 더 또는 덜 자주 쓰이는지, 또 대화인지 독백인지, 공적 장면인지 사적 장면인지에 따라서 그 쓰임이 어떻게 달라지는지를 한 눈에 알 수 있다.
다섯째, 이전의 많은 빈도표에서 출판상의 사정 때문에 빈도가 높은 일부의 자료만을 실음으로써 당시 언어의 전체 모습을 알 수 없었는데, 이 빈도표에서는 빈도 1까지의 모든 목록을 수록하여, 다른 시대, 다른 자료, 다른 방법에 의한 그 어떤 조사 결과와도 비교할 수 있게 하였다.
[머리말]
한국인들은 일상적으로 어떤 말들을 쓰면서 이야기를 나누고 있는 것일까?
21세기 현대의 우리는 얼마만큼의 낱말과 어떤 종류의 말들을 쓰면서 살고 있는 것일까? 어떤 말들은 자주 쓰이고, 어떤 말들은 자주 쓰이지 않는 것일까? 우리는 글을 쓸 때와 말을 할 때, 같은 말들을 쓰고 있는 것일까, 아니면 거기에 좀 다른 점이 있는 것일까?
한국말에 대해서 좀 관심을 가지게 되면 누구나 가질 수 있는 자연스러운 이런 의문을 품고 있으면서도, 우리는 정작 이를 명쾌하게 밝혀내지 못한 채 살아 오고 있다.
한국어의 낱말 잦기(빈도)에 대해서 맨 처음으로 본격적인 조사와 성과를 이룩한 것은 최현배· 이승화(1956)의 ??우리말 말수 사용의 잦기 조사 - 어휘 사용 빈도 조사 -??였다. 이 책에서는, 살아 있는 입말을 조사하는 것이 이상적이지만 온갖 사정의 어려움 때문에 글말로 대신 조사했다고 말하고 있다. 전쟁이 끝난 지 얼마 되지 않은 데다 컴퓨터조차 없던 시절이었기에 그 사정을 넉넉히 이해하고도 남음이 있다.
그러나 이때로부터 60년이나 세월이 지나고, 컴퓨터와 말뭉치(corpus)를 다루는 방법에도 매우 익숙해졌음에도 불구하고, 아직도 우리는 입말에 나타나는 낱말이나, 그 어떤 조사나 어미의 빈도조차 확실하게 알지도, 글말과 비교해 보지도 못하는 형편이 이어져 왔다. 그 까닭은 가지가지로 말할 수 있겠지만, 그 가장 큰 까닭은 최현배·이승화(1955) 책의 표지 안쪽에 숨은 듯 실려 있는 뭇솔(외솔)의 짤막한 시에서 미루어 짐작할 수 있지 않을까 싶다.
(사람은 아름다운 꽃을 좋아한다. 그러나, 그 아름다운 꽃이 피기까지에는
많은 노고가 숨어 있음을 모르는 이가 많다. 뭇솔(외솔))
이제 세상에 내놓는 <한국어 구어 빈도 사전>은 두 권으로 이루어졌다. 첫째 권은, 어떠한 낱말들이 말할 때에 자주 쓰이는가를 쉽게 찾아볼 수 있도록, 한국어 구어 빈도표를 그 쓰임이 잦은 순으로 배열한 <잦기순> 사전이다. 둘째 권은, 어떤 말의 잦기가 얼마나 되는지 독자들이 찾아보기 쉽게 배열한 <가나다순> 사전이다.
이 빈도 사전의 특별한 점은, 이제까지의 빈도 조사 결과들의 심각한 문제점으로 여겨져 온 것들을 해결하려고 애썼다는 점이다.
첫째, 국어정보학과 말뭉치언어학의 연구 성과를 바탕으로, 구어 균형 말뭉치를 구성하여 조사하였기 때문에 한국어 구어의 실제 모습이 있는 그대로 반영되었다.
둘째, 단순히 빈도수 합만을 밝힌 것이 아니라, 구어를 네 가지의 종류 즉 사적 대화와 공적 대화, 사적 독백과 공적 독백의 넷으로 나누어 낱말마다의 쓰임을 비교해 볼 수 있도록 하였다. 어떤 말이 대화에서만 자주 쓰이는지, 독백에서만 자주 쓰이는지, 혹은 공적인 자리에서 자주 쓰이는지, 사적인 자리에서 자주 쓰이는지를 한 눈에 알 수 있다.
셋째, 이 빈도표에서는 낱말뿐 아니라, 조사(토씨)와 어미(씨끝)의 빈도를 모두 함께 보였기 때문에, 한국어의 전체 모습을 한꺼번에 파악할 수 있다.
넷째, 같은 말의 변이형태(예컨대, 주격조사 ‘이’와 ‘가’)나 구어형(구어 실현형, 예컨대 ‘그런데’와 ‘근데, 근디’)을 대표 올림말에 함께 모아서 배열하였기 때문에, 어떤 말이 실제의 구어에서 얼마나 다양하게 나타나며, 형태들에 따라서 어느 정도 더 또는 덜 자주 쓰이는지, 또 대화인지 독백인지, 공적 장면인지 사적 장면인지에 따라서 그 쓰임이 어떻게 달라지는지를 한 눈에 알 수 있다.
다섯째, 이전의 많은 빈도표에서 출판상의 사정 때문에 빈도가 높은 일부의 자료만을 실음으로써 당시 언어의 전체 모습을 알 수 없었는데, 이 빈도표에서는 빈도 1까지의 모든 목록을 수록하여, 다른 시대, 다른 자료, 다른 방법에 의한 그 어떤 조사 결과와도 비교할 수 있게 하였다.
마지막으로, 이 연구를 하는 동안 지은이의 마음을 사로잡고 있었던 최현배·이승화(1955)의 말을, 이제 다음에 이런 일을 하고자 하는 누군가에게 다시 전하고자 한다.
“이제 이 일에 있어서, 맨 마지막의 붓방아를 찧는 마당에서 이 보고서는, 오자, 오식, 등을 비롯하여 많은 모자람이 있고, 여러 잘못이 조사의 구석구석에 나와 있을 줄로 생각된다. 장차 이와 같은 일을 하게 되는 분이 부디 많이 나와서, 이 길의 완성에 있기를 다시 한 번 더 빈다. 4288(1955),6,28” (최현배·이승화 1955:239)
흔히 컴퓨터를 사용한 말뭉치 분석 자료가 가진 자동 분석의 한계나 문제점이 많이 지적되고 있는데, 이 사전에서는 말뭉치에 나타난 모든 어절을 그 구성 낱말과 조사나 어미로 분석해 내고, 품사를 부여하고, 동음이의어를 구분하고, 변이형태를 대표형태로 묶어 내는 그 모든 과정의 작업을, 수 년에 걸쳐서 지은이 스스로 직접 보고 판단하며 고쳐 온 것이므로, 틀림이 아주 없을 수는 없겠지만, 이제까지의 그 어떤 빈도 조사에 비해서도 적을 것이라는 것은 분명히 말할 수 있다.
2015년 4월 1일
서 상 규 씀