학사 그리고 석사/데이터베이스

파일의 인덱스 구조

쁑뿅 2019. 9. 20. 23:58
반응형

[ 인덱스 ]

▪ 단일 단계 인덱스는 데이터 파일내의 레코드를 효과적으로 찾도록 도와주는 보조 파일이다.

▪ 인덱스는 보통 파일내의 한 필드에 대해 정의된다. (여러 필드에 대해 정의 될 수도 있다.)

▪ 인덱스는 <필드값, 레코드에 대한 주소>로 구성된 엔트리들을 저장한 파일이다.

▪ 인덱스는 파일에 대한 접근 경로라고 불린다.

▪ 인덱스 엔트리는 실제 레코드 크기보다 훨씬 작기 때문에, 인덱스 파일은 데이터 파일보다 훨씬 적은 디스크 블록을 차지한다.

▪ 인덱스에 대한 이진 탐색으로 데이터 파일의 해당 레코드에 대한 주소를 얻을 수 있다.

▪ 인덱스는 밀집 또는 희소 인덱스가 될 수 있다.

  - 밀집인덱스는 데이터 파일내의 모든 탐색 키 값(즉, 모든 레코드)에 대한 인덱스 엔트리를 갖는 index이다.

  - 희소 인덱스는 탐색 값의 일부에 대해서만 인덱스 엔트리를 갖는 index이다.

 

[ 다단계 인덱스 ]

▪ 단일 단계 인덱스가 순서 파일이므로, 이 인덱스 자체에 대한 기본 인덱스를 만들 수 있다. 이 경우, 원래 인덱스 파일은 첫 번째 단계 인덱스라 부르고 그 인덱스에 대한 인덱스는 두번째 단계 인덱스라 부른다. 이 와 같은 과정을 반복하면 모든 엔트리를 한 블록에 저장할 수 있는 단계가 생기고, 이 단계의 블록을 최상위 단계라고 한다.

▪ 다단계 인덱스는 첫번째 단계 인덱스가 어떤 인덱스 유형(기본 인덱스, 클러스터링 인덱스, 보조 인덱스)이든 지 사용 할 수 있다.

▪ 다단계 인덱스에서는 주어진 인덱스 필드값으로 레코드를 탐색할 경우 접근해야 하는 블록들의 개수를 줄일 수 있다. 즉, 탐색 트리 형태를 갖는다.

▪ 인덱스의 모든 단계가 물리적으로 정렬된 파일들이기 때문에 인덱스 삽입이나 인덱스 삭제를 다루는 문제가 있다.

 

글이나 공감 남겨주는 사람 착한사람

 

반응형