Многоязычный веб-сайт – это любой сайт, предлагающий содержание более чем на одном языке. Примеры многоязычного веб-сайта могут включать в себя официальную страницу канадской компании с английской и французской версией своего сайта или блога или портала о латиноамериканском футболе на испанском и португальском языках.
Мультирегиональный веб-сайт – это сайт, который явно направлен для пользователей из нескольких стран. Некоторые веб-сайты являются одновременно мультирегиональными и многоязычными (например, веб-сайт может иметь различные версии для США и Канады, а также французскую и английскую языковую версию содержания для канадских пользователей).
Разработка сайта, охватывающего контентом много стран и/или языков может быть непростой задачей. Так как у Вас получается несколько версий сайта, все проблемы множатся.
Управление многоязычной версией сайта
Вот несколько советов, которые помогут убедиться, что содержимое вашего сайта будет отображаться в результатах поиска соответствующего языка.
Убедитесь в том, что язык страницы очевиден
Чтобы определить язык страницы Google использует только ее видимое содержание. Он не обращает внимание на какие-либо сведения о языке на уровне кода, такие как атрибут lang. Вы можете помочь Google правильно определить язык, с помощью единого языка для содержания и элементов навигации на каждой странице и избегания прилегающих друг к другу переводов. Перевод только основного текста на страницах и оставление значительной части материалов в исконном языке может вызвать разочарование пользователей.
Используйте файл robots.txt для исключения возможности индексирования автоматически переведенных страниц сайта. Автоматический перевод не всегда имеет смысл и может рассматриваться как спам. Что еще более важно, плохое или искусственное звучание перевод может поставить под угрозу индексацию сайта.
Убедитесь в том, что каждая языковая версия легко обнаруживаема
Содержание для каждого языка поместите в отдельный URL-адрес. Не используйте файлы cookie для показа переведенных версий страницы. Подумайте о размещении ссылок на другие языковые версии в каждой языковой версии сайта. Благодаря этому, французский пользователь, который попадет на немецкую версию сайта, сможет одним щелчком мыши перейти к нужной языковой версии.
Избегайте автоматического перенаправления на основе предполагаемого языка. Такие перенаправления могут помешать пользователям (и поисковым системам) просмотреть все версии Вашего сайта.
Внимательно обдумайте выбор URL-адреса
Google использует содержание страницы, чтобы определить ее язык, но сам URL дает пользователям полезные советы о содержании страницы. Например, следующие URL-адреса из домена .ca используют имя fr как субдомена или подкаталога для четкого обозначения французского содержания: http://example.ca/fr/velo-montag.html http://fr.example.ca/velo-montage.html
Перевод слов в URL-адресах или использование международных доменных имен (IDN) является наиболее правильным. Помните только о применении в URL-кодировке UTF-8 (использовать кодировку UTF-8 рекомендуется везде, где это возможно) и соответствующем использовании символов изменения значения при создании ссылки на такие URL-адреса. (Много программ для кодирования URL-адресов доступны в интернете).
Направления содержания веб-сайта для конкретной страны
Если требуемая страна известна Google, он попробует использовать эту информацию для улучшения качества результатов поиска в различных странах.
Для определения страны назначения сайта Google, использует, как правило, следующие элементы:
- Доменов ccTLD (доменное имя верхнего уровня, определяющее код страны). Они связаны с конкретной страной (например, .de для Германии, .cn для Китая) и являются сильным сигналом как для пользователей, так и поисковым системам, что Ваш сайт явно предназначен для данной страны. (Некоторые страны налагают ограничения на то, кто может использовать их имена ccTLD, поэтому помните о проверке этого вопроса). Кроме того, некоторые домены ccTLD использованы в рекламных целях (например, .tv, .me и т.д.), Google рассматривает их в качестве домена функционального (gTLD), потому что обнаружил, что пользователи и вебмастера часто воспринимают их скорее как функциональные, чем национальные.
- Настройки геотаргетинга. Вы можете воспользоваться инструментом для геотаргетинга в Инструментах для веб-мастеров, чтобы указать Google, что Ваш сайт ориентирован для конкретной страны. Делайте так, только в том случае, если Ваш сайт имеет домен gTLD. Не используйте этот инструмент, если Ваш сайт ориентирован более чем на одну страну.
Примечание: поскольку региональные домен TLD, такие как .asia, не относятся к одной стране, Google рассматривает их как домены gTLD.
- Местоположение сервера (на основании IP-адреса сервера). Местоположение сервера находится часто рядом с пользователями и может указать на страну сайта. Некоторые сайты используют однако распределенные сети передачи данных (CDN) или помещаются в странах с лучшей инфраструктурой веб-серверов, поэтому это не окончательный сигнал.
- Другие сигналы. Другими источниками информации о том, что сайт ориентирован на конкретную страну являются локальные адреса и номера телефонов на сайтах, использование местного языка и валюты, ссылки с других местных веб-сайтов.
Структура URL
Рассмотрим применение такой структуры URL, которая будет способствовать географическому таргетингу части сайта для различных регионов.
URL | Пример | Плюсы | Минусы |
---|---|---|---|
Домен ccTLD | example.de |
|
|
Субдомен с доменами gTLD | de.example.com |
|
|
Подкаталоги с доменов gTLD | example.com/de/ |
|
|
Параметры в URL-адресе | site.com?loc=de |
|
|
Геотаргетинг не является точной наукой, поэтому важно подумать о пользователях, которые попадут на неверную версию сайта. Одним из способов может быть показ на всех страницах ссылок, благодаря которым пользователи могут выбрать нужный регион и/или язык.
Дублирование содержания сайта и мультиязычность
На сайтах, обеспечивающих содержание для разных регионов и на разных языках можно иногда заметить, что похожий текст будет доступен под разными адресами URL. Это не является проблемой до тех пор, пока такая форма контента предназначена для различных пользователей из разных стран.
Хотя Google настоятельно рекомендует предоставление уникального контента для всех групп пользователей, тем не менее, он понимает, что это не всегда возможно.
Нет необходимости «сокрытия» дубликатов в файле robots.txt или использование метатега для роботов «noindex». Однако, если вы показываете одно содержание одним и тем же пользователям под разными адресами URL (например, когда оба адрес example.de/ и example.com/de/ отображает текст на немецком языке для пользователей из Германии), необходимо выбрать нужную версию и сделать правильное перенаправление (или использовать элемент rel=canonical).