Расточительный Яндекс

Наверное, можно сказать, что на сегодняшний день Яндекс является наиболее продвинутой поисковой машиной в русском Интернете как в плане удобства использования, так и в плане суммарной величины проиндексированных страниц. Впрочем, в последнее время стало заметно, что его индекс очень сильно спамят, вследствие чего Яндекс при поиске выдает либо большое количество бесполезных doorway-результатов (страницы, специально созданные для раскрутки того или иного ресурса), либо подряд одни страницы-близнецы. Впрочем, в настоящей статье речь пойдет не об этом.

Не секрет, что исходящий трафик с поисковых машин огромен. Очевидно, что для сокращения его объемов, необходимо оптимизировать интерфейс доступа к поиску, а также HTML-код страниц, выдаваемых пользователям. Что ж, по всей видимости, специалисты, работающие в Яндексе, так не считают (отрывок HTML-кодастраницы результатов поиска):

Помимо богатого набора бесполезных HTML-комментариев, в коде очень большое количество пробельных символов. Нет, понятно, конечно, что механизм выдачи результатов поиска Яндекса использует XML, что HTML-шаблоны там не верстаются как обычно, а используется XSLT. Но неужели специалистам и руководству проекта абсолютно все равно, сколько трафика тратят посетители на использование их сервисов?

А ведь оптимизация (пусть даже не очень большая) HTML-кода страницы является вполне тривиальной задачей! Достаточно в модуле вывода HTML удалять комментарии и преобразовывать последовательности пробелов (и символов табуляции) к одному пробельному символу. Программа на PHP, производящая минимальную оптимизацию кода, будет состоять из 4-х (!) строчек:

Давайте посчитаем, насколько можно сократить объемданной, отдельно взятой страницы Яндекса. Ее изначальный размер — 28014 байт. После обработки вышеприведенным кодом — 26468 байт. Если вынести Javascript в отдельный файл (который, с большой степенью вероятности будет кэшироваться) — 24643 байта.

Таким образом, Яндекс заставляет своих пользователей тратить трафика на 12% больше, чем следовало бы. Наверное, не очень большая цифра для отдельно взятого пользователя системы Яндекс. А как же с общим итоговым трафиком? По статистике, к поисковой части Яндекса в день осуществляется до 30 000 000 запросов. Большинство из них — запросы к страницам с результатами поиска (т.е. именно к таким, как та, анализ которой только что был произведен). Путем несложных вычислений можно посчитать, что за один день Яндекс генерирует порядка 100 ГБ (!) лишнего исходящего трафика. Бесполезная трата трафика для каждого пользователя составляет 100 кБ в день в среднем. Расточительно... даже для Яндекса.

P.S. Нет, я, конечно, пользуюсь и буду пользоваться Яндексом, так как он мне, безусловно, нравится. Но лучшему русскому поисковику пора бы взять пример хотя бы с того жеGoogle, у которого с оптимизацией страниц все в порядке.

1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (Пока оценок нет)
Загрузка...

Дата публикации:
Автор публикации: