벡터모델
- 최초 등록일
- 2010.11.07
- 최종 저작일
- 2008.10
- 5페이지/ 한컴오피스
- 가격 1,500원
소개글
정보검색론에서의 벡터모델에 대한 정의와 원리, 예제 등을 알아본다
목차
1. 벡터모델의 정의
2. 벡터모델의 원리
3. 벡터모델의 예제
본문내용
1. 벡터모델의 정의
벡터모델은 이진 가중치 사용이 너무 제한적이어서, 부분 정합이 가능한 틀을 제공한 것으로 인식할 수 있으며, 이는 질의나 문헌의 색인어에 비이진 가중치를 할당함으로써 가능하다. 이 용어 가중치는 궁극적으로 사용자 질의와 시스템에 저장되어 있는 각 문헌과의 유사도를 계산하는데 사용되는데 검색된 문헌을 이 유사도 값의 내림차순으로 정렬함으로써 벡터 모델은 질의 용어에 부분 정합되는 문헌을 포함시킨다. 결과적으로 순위화된 문헌 집합이 불리안 모델에서 검색된 문헌 집합보다 사용자 정보 요구에 더 잘 맞는다고 볼 수 있다.
-정의-
벡터 모델에서 용어, 문헌 쌍 (ki, dj)의 가중치 wi,j는 양의 비이진 값이며, 질의 색인어도 가중치를 가진다. [ki, q]의 가중치를 wi,q ≧ 0이라 하면, 질의 벡터 q는 q=(w1,q, w2,q, ...wt,q)로 정의 되며, 여기서 t는 시스템 내의 전체 색인어 수이다. 문헌 dj 벡터는 dj=(w1,j, w2j, ...wt,j)로 표현된다.
2. 벡터모델의 원리
불린 모델이 가지는 이진가중치에 대한 대안으로 나온 검색 모델링 방법으로 이 부분의 색인어 가중치는 나름대로의 알고리즘에 따라서 도출되어야 하지만(일반적으로 tf/idf방법) 여기서는 1, 0의 값으로만 가중치를 표현한다.
참고 자료
Joinc Wiki
http://freesearch.pe.kr/431
질의구조 ppt자료(작성자:류근호)
최신정보검색론(김명철외)