Да си представим за момент, че страниците в интернет са страниците от една книга. Много дебела книга. За да стигнем бързо до страницата, която ни интересува, се нуждаем от добре структурирано съдържание.
Идеята на търсачките е да направят намирането на нужната ни информацията максимално бързо. За да бъде това възможно, търсачките „събират“ съдържанието на страниците в собствен индекс. Когато търсим нещо, те ни предоставят резултати въз основа на информацията от техния индекс.
Има три важни процеса, необходими за предоставяне на резултатите:
– обхождане
– индексиране
– показване
Обхождането на сайта от търсачката е процес, позволяващ ѝ да открие ново или променено съдържание (програмата, която се грижи за обхождането на страници, може да се нарича бот, робот, паяк или иначе). Обхождането започва след като търсачката получи адрес на страница (url) или списък с адреси, и/или карта на сайта (xml). Тези списъци могат да се подават от уеб администратора на страницата или чрез последвани връзки от други сайтове.
След като обходи сайта, търсачката обработва съдържанието на страниците, които е посетила, и го събира в огромна база данни – индекс. Допълнително се обработва и информацията, включена в заглавията, мета описания, alt на изображения и т.н.
Търсейки някаква информация, потребителят изпраща своята заявка и търсачката претърсва индекса, за да покаже резултатите, които смята за най-подходящи. Този избор се прави въз основа на стотици фактори.