Индекс
Индексирането в търсачките събира, анализира и съхранява данни, за да улесни бързото и точно извличане на информация. Проектирането на индекси включва интердисциплинарни концепции от лингвистиката, когнитивната психология, математиката, информатиката и компютърните науки. Алтернативно наименование на процеса в контекста на търсачките, предназначени за намиране на уебстраници в интернет, е уебиндексиране. Популярните двигатели се фокусират върху пълнотекстовото индексиране на онлайн документи на естествен език. Търсенето може да се извършва и в медийни типове, като видео, аудио и графики. Метатърсачките използват повторно индексите на други услуги и не съхраняват локален индекс, докато търсачките, базирани на кеш, постоянно съхраняват индекса заедно с корпуса. За разлика от пълнотекстовите индекси, частично-текстовите услуги ограничават дълбочината на индексиране, за да намалят размера на индекса. По-големите услуги обикновено извършват индексиране на предварително определен интервал от време поради необходимото време и разходите за обработка, докато агентно-базираните търсачки индексират в реално време.
