Веб-паук

Веб-паук

Поиско́вый ро́бот («веб-пау́к», краулер) — программа, являющаяся составной частью поисковой системы и предназначенная для обхода страниц Интернета с целью занесения информации о них в базу данных поисковика. По принципу действия паук напоминает обычный браузер. Он анализирует содержимое страницы, сохраняет его в некотором специальном виде на сервере поисковой машины, которой принадлежит, и отправляется по ссылкам на следующие страницы. Владельцы поисковых машин нередко ограничивают глубину проникновения паука внутрь сайта и максимальный размер сканируемого текста, поэтому чересчур большие сайты могут оказаться не полностью проиндексированными поисковой машиной. Кроме обычных пауков, существуют так называемые «дятлы» — роботы, которые «простукивают» проиндексированный сайт, чтобы определить, что он доступен.

Порядок обхода страниц, частота визитов, защита от зацикливания, а также критерии выделения значимой информации определяются поисковыми алгоритмами.

В большинстве случаев переход от одной страницы к другой осуществляется по ссылкам, содержащимся на первой и последующих страницах.

Также многие поисковые системы предоставляют пользователю возможность самостоятельно добавить сайт в очередь для индексирования. Обычно это существенно ускоряет индексирование сайта, а в случаях, когда никакие внешние ссылки не ведут на сайт, вообще оказывается единственной возможностью указать на его существование.

Ограничить индексацию сайта можно с помощью файла

См. также

Ссылки




Wikimedia Foundation. 2010.

Игры ⚽ Поможем сделать НИР

Полезное


Смотреть что такое "Веб-паук" в других словарях:

  • Паук (значения) — Паук: В Викисловаре есть статья «паук» Пауки (лат. Aranei)  отряд паукообразных членистоногих. Паук, или поисковый робот  программа, скачивающая веб страницы для последующего индексирования. Паук (пасьянс)&# …   Википедия

  • Паук (программа) — Поисковый робот («веб паук», краулер)  программа, являющаяся составной частью поисковой системы и предназначенная для обхода страниц Интернета с целью занесения информации о них в базу данных поисковика. По принципу действия паук напоминает… …   Википедия

  • Список эпизодов телесериала «Удивительный Человек-паук» — В этой статье не хватает ссылок на источники информации. Информация должна быть проверяема, иначе она может быть поставлена под сомнение и удалена. Вы можете …   Википедия

  • FlashGet — С …   Википедия

  • Free Download Manager — Free Download Manager …   Википедия

  • Супергерой — В этой статье не хватает ссылок на источники информации. Информация должна быть проверяема, иначе она может быть поставлена под сомнение и удалена. Вы можете …   Википедия

  • OTOY — OTOY  комплекс аппаратных и программных решений, методик и средств, предназначенный для обработки графических вычислений на стороне сервера и отправки результатов в виде аудио и видеопотока клиенту на веб браузер через сетевые соединения,… …   Википедия

  • Harvey Award — (рус. Премия Харви) престижная американская премия присуждаемая c 1988 года за достижения в области индустрии комиксов[1]. Награда была названа в честь писателя и художника Харви Курцмана. Она была основана Гэри Гротом, президентом издательства… …   Википедия

  • Альтернативные версии Человека-паука — Значимость предмета статьи об объекте вымышленного мира поставлена под сомнение. Пожалуйста, добавьте в статью ссылки на независимые авторитетные источники, рассматривающие её предмет достаточно детально (в объёме, позволяющем написать… …   Википедия

  • Железный человек 2 — У этого термина существуют и другие значения, см. Железный человек (значения). Железный человек 2 Iron Man II …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»