검색엔진 기초대부분의 검색엔진을 위해 필요한 기능의 기초는 다음 네개면 해결할 수 있다.색인 생성파일, 웹사이트, 데이터베이스 레코드를 검색가능하게 만든다. 색인이라는 뜻이 와닿지 않으면 모든 책장의 소개 부분에 목차가 있는데 이와 비슷한 것이라고 생각하면 이해가 빠르다.사용자 입력사용자가 무엇을 검색할지 입력하고, 입력 인터페이스를 제공하기도 한다.순위화결과를 사용자가 입력한 것과 가까운 순으로 정렬한다.결과 보여주기사용자가 입력한 내용을 보여준다.색인화색인화는 보통 문서를 분석한뒤 토큰 단위로 나누고 선택적으로 각 토큰을 색인어라고 하는 정규화된 토큰을 만들기 위한 하나이상의 변경 작업으로 구성된다. 색인어를 만들기 위해선 어간 추출, 소문자화, 완전한 제거를 포함하여 토큰 변경을 정하고 (혹은 정..