Google стремится наиболее эффективно индексировать ваш сайт. Загрузка и индексация страниц с одинаковым содержанием вызывает неэффективное использование ресурсов. Это ограничивает число страниц, которые поисковая система может просмотреть на вашем сайте и скопировать содержимое в индекс, что может ухудшить положение ваших страниц в результатах поиска.
Дублирование контента часто связано с тем, что эти же материалы будут доступны на веб-сайте под разными адресами URL – это происходит, например, с помощью идентификаторов сеансов или других параметров:
При обнаружении находящегося в общем доступе дублированного содержимого, вызванного отличиями в параметрах URL, объедините повторяющиеся адреса URL в один кластер и выберите один URL-адрес, который, по вашему мнению, будет лучше всего представлять этот кластер в результатах поиска. Затем консолидируйте свойства отдельных URL-адресов из кластера (например, популярность ссылки) в самом URL.
Для того, чтобы улучшить этот процесс, мы рекомендуем использовать средства для обработки параметров. Благодаря этому Google получает информацию о способе обработки URL-адреса, содержащие конкретные параметры. Эта информация принимается во внимание, однако могут возникнуть ситуации, когда указанные предложения могут быть для веб-сайта более вредны, чем полезны.
Параметры в URL можно отнести к одной из двух категорий:
- Параметры, которые не изменяют содержание веб-страницы: например, sessionid, affiliateid. Такого рода параметры часто используются для отслеживания посещений и рефералов. Они не влияют на реальное содержание страницы.
- Параметры, которые изменяются или определяют содержание страницы: например, brand, gender, strana, sortorder. Параметр может, например, повлиять на содержание страницы следующим образом:
- Сортировка (например, sort=price_ascending): изменяет порядок, в котором отображается содержимое.
- Переработка (например, t-shirt_size=XS): фильтр содержимого, отображаемого на странице.
- Определение (например, store=women): определяет набор контента, отображаемого на странице.
- Перевод (например, lang=ru): отображает переведенную версию содержания.
- Разбиение на страницы (например, page=2): отображает конкретную страницу длинного списка или статьи.
- Спорт и отдых: изменяет содержание иным образом, чем это описано выше.
Мы рекомендуем использовать средства для обработки параметров в URL, для того, чтобы сообщить Google о назначении параметров, используемых на вашем сайте и том, как Google будет обрабатывать URL-адреса, содержащие эти параметры.
- На Панели управления, в области Конфигурация сайта нажмите пункт Параметр URL-адреса.
- Рядом с нужным параметром нажмите кнопку Изменить. Если параметр не указан в списке, нажмите кнопку Добавить параметр. Помните, что в этом инструменте учитывается регистр, поэтому необходимо вводить параметры в точности так, как они используются в вашем URL-адресе.
- Если параметр не влияет на содержимое отображаемое пользователю, выберите Не... в списке Если этот параметр меняется..., а затем нажмите кнопку Сохранить. Если параметр влияет на отображаемое содержимое, щелкните Да изменяет, устанавливает порядок или сужает содержание страницы, а затем выберите, каким образом Google может индексировать URL-адреса, содержащие этот параметр.
- Оставьте возможность решения роботу googlebot. Робот google анализирует веб-сайт, чтобы определить наилучший способ обработки этого параметра. Это хороший выбор.
- Каждый URL-адрес. Робот google будет использовать значения этого параметра, чтобы определить, является ли URL-адрес уникальным. Например, URL-адрес www.example.com/odegda/jubki.htm?productid=1202938 будет считаться полностью отличным от адреса www.example.com/odegda/jubki.htm?productid=5853729. Перед тем как выбрать эту опцию, убедитесь, что параметр на самом деле изменяет содержание страницы.
- Только адреса URL со значением x. Робот Googlebot проиндексирует только те URL-адреса, в которых данный параметр имеет определенное значение. URL-адреса с другими параметрами будут проигнорированы. Это полезно, например, если ваш веб-сайт использует значение параметра для изменения порядка отображения одного и того же содержания.
- Ни один URL-адрес. Робот google не будет индексировать любые URL-адреса, содержащие этот параметр.
Если на вашем веб-сайте, публикуется содержание, к которому можно получить доступ через несколько URL-адресов, вы можете получить больший контроль над тем, каким образом ваши URL-адреса отображаются в результатах поиска, указав каноническую (предпочтительную) версию URL-адреса.
Использование инструментов для обработки параметров является одним из способов выполнения этой задачи, но также вы можете передать в Google дополнительную информацию, добавив элемент rel="canonical" к HTML-коду вашего предпочитаемого URL-адреса.