<한국어정보학> 문어 형태의미분석 말뭉치 내 소설 분야에 대한 계량적 연구
- 최초 등록일
- 2021.01.05
- 최종 저작일
- 2019.06
- 10페이지/ 한컴오피스
- 가격 4,000원
소개글
한국어 교사가 되기 위해 들어야 하는 '한국어정보학' 강의에 필히 쓰이는 국립 국어원 말뭉치 속 소설 분야에 대한 문어 형태의미분석 논문입니다. 낯선 프로그램과 말뭉치를 분석하는 것이 쉽지 않은 일이지만 좋은 샘플이 있다면 새로운 논문을 써내는데 어렵지 않을 것입니다. 한국어정보학 강의에서 A+의 성적을 받은 레포트이며 말뭉치를 분석한 표까지 첨부된 표지와 참고문헌 포함 총 8장의 한글 파일로 구매에 있어 후회 없으실 것 입니다.
목차
1. 제 1 장 서 론
1-1. 연구의 목적 및 의의
1-2. 연구의 범위
2. 제 2 장 본 론
2-1. 빈도 목록 추출 방법
2-2. 실질어 빈도 목록 분석
2-3. 형식어 빈도 목록 분석
2-4. 어휘 다양도 계산 및 비교 분석
3. 제 3 장 결 론
4. 참 고 문 헌
본문내용
1-1. 연구의 목적 및 의의
오늘날의 정보사회에서 컴퓨터는 일상생활 뿐 아니라, 많은 학문 영역에서도 큰 영향을 미치게 되었다. 자연과학의 여러 분야는 말할 것도 없고, 컴퓨터 음악, 컴퓨터 그래픽스 등 예술 분야, 나아가 전통적인 인문학의 여러 분야에서도 컴퓨터는 기존의 연구 과제에 대한 새로운 접근법을 제시하는 동시에, 새로운 연구 과제를 창출해 왔다. 언어의 연구도 예외는 아니다. 이러한 맥락에서, 컴퓨터에 저장된 전자 텍스트 자료를 기반으로 컴퓨터를 이용하여 자연언어를 연구하는 접근법이 근래 언어학과 국어학계의 큰 관심사이다. 이러한 접근법을 코퍼스 언어학이라고 부르며, 국어에 국한하여 언급할 경우에는 국어정보학이라는 이름으로 부르기도 한다. 강범모, 『언어, 컴퓨터, 코퍼스 언어학』, 고려대학교출판부, 2003
필자는 언어학을 전공으로 두고 많은 글을 쓰고 읽었어도, 컴퓨터를 기반으로 한 코퍼스 언어학에 대해서는 한 번도 들어본 적이 없었다. 한국어정보학 강의를 통해 문어와 구어의 자료를 수집하는 말뭉치 언어학에 대해서도 처음 접했고, 그 하위 분야의 텍스트들을 분석해 어떤 단어나 어휘가 제일 많이 쓰이는지에 대한 연구법 또한 마찬가지로 커다란 충격이었다. 국립 국어원에 들어가는 횟수가 많아지는 만큼 한국어 즉, 언어에 대한 정보는 지금 시대에 표준국어대사전에 든 의미와 서적 속 내용만으로는 설명할 수 없다는 사실을 깨달았다. 따라서 본 보고서의 목적은 여태 해본 적 없는 새로운 분석법을 적용하여, 세종말뭉치의 문어 형태의미분석 말뭉치 내 필자가 제일 많이 접했던 소설 분야 쪽 텍스트를 바탕으로 한 고빈도 어휘에 대한 분석과 어휘 다양도에 대한 계산 및 분석이다.
본고의 분석 자료바탕인 말뭉치 데이터는 2007년 배포된 세종계획 기초 말뭉치로 21세기 세종계획은 1998년부터 2007년까지 수행한 국어 정보화 사업이다. 이것은 우리 언어문화의 발전을 꾀하고, 세계적인 정보화 추세에 적극적으로 대응하며, 문화 산업과 정보 산업 역량을 강화하고자 그 기반이 되는 국어 정보 자료를 구축한 사업임을 밝힌다.
참고 자료
황용주, 최정도, 「21세기 세종 말뭉치 제대로 살펴보기」, 국립 국어원 새국어생활, 2016
이희자, 「말뭉치(coupus)를 이용한 국어 어휘 의미 기술에 대하여」, 『국어 사전 편찬론』을 위한 서설, 2000
정희연, 「중의성 해결을 위한 말뭉치 기반의 한국어 형태소분석기의 설계 및 구현」, 학위 논문(석사), 서울대학교, 2001
국립국어원, https://www.korean.go.kr
21세기 세종계획 한국어 말뭉치, 국립 국어원 언어정보나눔터, 2007