журнал.ру
Выходные данные Написать редактору Архив ">Книга отзывов Реклама в журнале


Rambler: Не просто коллекция ссылок...

  • Что такое Rambler?
    Это система поиска информации в российской части Интернета. А проще говоря — искалка. Но не только...

  • Почему Rambler?
    С английского языка это слово можно перевести как "праздношатающийся человек", этакий бродяга по серверам России, можно сказать бесцельно шатающийся. Но цель все же есть — это быстро и доходчиво рассказать вам обо всем, что он встретил на своем пути. Но и не только...

  • Когда и где появился Rambler?
    Проект Rambler был начат компанией "Стек" в июне 1996 года. В октябре того же года был открыт web-сайт www.rambler.ru. Территориально компания "Стек" расположена в Пущинском научном центре (Пущино на Оке, Московская область).

  • Почему решили создать Rabmler?
    Несмотря на то, что поисковых систем в мире не так уж мало. Во-первых, зарубежные системы либо вообще не воспринимают нашу кириллицу, либо не могут учитывать нашей реальности с несколькими кодовыми страницами (кодировками). Во-вторых, в зарубежных системах нас не устраивает глубина индексации сайтов из серверов России и стран бывшего СССР. А в-третьих... за державу обидно! Доказать, что и в России можно делать подобные вещи, даже не имея той технической и материальной базы, какая есть на Западе, — за счет качества программной части.

  • Что собой представляет Rambler?
    Это система, состоящая из двух частей: накопителя данных и поисковой программы. Первая часть представляет собой робота, который сканирует WWW-сервера и берет URLs (Universal Resource Locator) через Proxy-сервер или непосредственно с указанного хоста (host computer), индексирует содержание документа, а полученные результаты помещает в базу данных.
    Rambler не проходит мимо серверов, имеющих домены первого уровня *.RU или *.SU, а также общеизвестных российских серверов, домен первого уровня которых не указывает на принадлежность к России. Это серверы, имеющие домен второго уровня типа sovam.com, mvc.net, stack.net, free.net, rosmail.com и т.д.
    В поле зрения Rambler попадают лишь серверы, которые имеют домены первого уровня, с определенной долей вероятности указывающие на то, что они русскоязычные (*.ua, *.by, *.kz и т.д.). Это серверы стран бывшего СССР. Или владелец сервера может заявить о себе сам, заполнив анкету-запрос на индексацию. Это в случае, если Rambler еще праздно не дошатался до такого сервера.
    Второй частью является собственно сама поисковая система. Она предоставляет весь привычный набор удобств как при составления запроса, так и при работе с результатами поиска. А именно: использование логических операций между словами в запросе (логическое И, ИЛИ, логические группы); использование усечения слов с помощью метасимволов (*, ?); установка по желанию выходного формата документов, максимального количества результатов поиска и т.д. На сегодня база данных Rambler содержит около 2 млн. документов с сайтов России и стран СНГ. Всего представлено более 10,5 тыс. сайтов. Ежедневно система пополняется не менее чем на 10 тыс. документов.

  • Как развивается Rambler?
    В марте 1997 года был начат проект по созданию нового раздела — рейтинговой системы — Rambler’s Top100 counter. Сейчас уже многим знаком значок этой системы. Эта часть проекта имеет следующие цели:
      1. Дать возможность владельцам крупных серверов определить свою популярность на основе сравнительной оценки с другими крупными серверами. Такое сравнение является корректным, так как все счетчики работают по одному и тому же алгоритму для всех зарегистрированных сайтов.
      2. Дать возможность владельцам собственных web-страниц, но при этом не являющимся веб-мастерами, быстро и точно определить количество визитов на их творения и возможность анализировать статистику посещений их web-страниц. Если зарегистрированный пользователь пожелает, он может скрыть свою статистику от глаз третьих лиц либо вообще не принимать участия в рейтинге, при этом его данные будут доступны только ему.
      3. Дать возможность рекламодателям оценить траффик их потенциальных партнеров для принятия решения о целесообразности размещения рекламы.

    Для реализации этого вида сервиса было разработано специальное программное обеспечение, к которому предъявляются требования быстроты и точности результата. Сервер рейтинговой системы регистрирует следующие параметры:
    • общее количество обращений (hits) на указанную страницу,
    • дневное количество обращений на страницу,
    • количество проигнорированных обращений (следующих с одного сайта менее чем через 30 секунд),
    • количество подозрительных обращений,
    • количество перевызовов заявленной страницы (Reload),
    • количество возвратов к странице менее чем через час,
    • количество возвратов к странице более чем через час и
    • среднечасовые значения обращений для страницы.
    А что дальше?
    Не останавливаться...

    Сергей Абсалямов
    Коммерческий директор компании Стек
    Дмитрий Крюков
    Руководитель проекта Rambler,
    системный администратор компании Стек
    dvk@stack.net


    ">Дискуссия
    Предыдущая статья Оглавление Следующая статья


    viewsonic viewpad 7 EF-russia: обучение за рубежом подробная информация на сайте.Уникальное термобелье с хитофайбером.
    Новые модели: коньки хоккейные в Спортмастере!Качественный перевод с русского на английский в краткий срок.