Технология URL-адресов (Uniform Resource Locator) – зачем она нужна

Россия+7 (910) 990-43-11
Обновлено: 2021-09-10

URL-адрес может состоять из нескольких частей. Он включает имя хоста, которое сопоставляется с IP-адресом определенного ресурса в интернете, и дополнительную информацию, которая сообщает вашему браузеру и серверу, как общаться.

Можно сказать, что IP-адрес является чем-то вроде номера телефона. Имя хоста похоже на имя человека, номер телефона которого вы хотите найти. Стандарт под названием Domain Name System (DNS) работает в фоновом режиме, как телефонная книга, переводя удобные для пользователя имена хостов в IP-адреса, используемые сетями для маршрутизации трафика.

Помня об этой аналогии, давайте посмотрим на структуру URL-адреса и на то, как он работает, чтобы отправить Вас туда, куда вы хотите пойти.

Как структурирован URL-адрес

Структура URL-адреса была впервые определена сэром Тимом Бернерсом Ли, парнем, который создал первый веб-сайт и первый веб-браузер, – в 1994 году. URL-адреса объединяют идею доменных имен с идеей использования пути к файлу для идентификации конкретной папки и файла. Таким образом, это похоже на использование пути, такого как C:\Documents\Personal\myfile.txt, в Windows, но с некоторым дополнительным материалом в начале, чтобы помочь найти нужный сервер в интернете, и определить используемый протокол.

URL-адрес состоит из нескольких разных частей. Возьмем, к примеру, базовый URL-адрес, подобный показанному на изображении ниже.

Схема и полномочия url-адреса в интернете

Этот простой URL-адрес разбит на два основных компонента: схема и полномочия.

Схема URL-адреса

Многие люди считают URL-адрес просто веб-адресом, но это не так просто. Веб-адрес – это URL-адрес, но не все URL-адреса являются веб-адресами. Другие сервисы, к которым вы можете получить доступ в интернете, например через FTP или даже локально, также являются URL-адресами. Часть схемы URL (буквы, за которыми следует двоеточие) обозначает протокол, с помощью которого должно взаимодействовать приложение (например, ваш веб-браузер) и сервер.

Веб-адреса являются наиболее распространенным типом URL-адреса, но существуют и другие. Вы можете увидеть такие схемы, как:

  • Протокол передачи HyperText (HTTP): базовый протокол интернета – определяет, какие действия должны выполнять веб-серверы и браузеры в ответ на определенные команды.
  • HTTP Secure (HTTPS): это форма HTTP, которая работает через защищенный и зашифрованный слой для более безопасной транспортировки информации.
  • Протокол передачи файлов (FTP): этот протокол часто используется для передачи файлов через интернет.

В современных браузерах схема не является технически необходимой частью URL-адреса. Если вы введете адрес веб-сайта, например, «webznam.ru», ваш браузер автоматически определит правильный протокол. Тем не менее, некоторые другие приложения (и протоколы) требуют использования схемы.

Полномочия URL-адреса

Часть полномочий URL (которым предшествует двойной слэш) разбивается на несколько частей. Начнем с очень простого URL-адреса, который приведет вас на домашнюю страницу веб-сайта.

Полномочия URL-адреса

В этом простом примере вся часть «www.example.com» называется именем хоста, и она скрывает IP-адрес. Вы также можете ввести IP-адрес в адресную строку браузера, а не имя хоста, если он Вам известен.

При анализе имени хоста лучше читать его с конца, чтобы понять, что происходит:

  • Домен верхнего уровня. В приведенном здесь примере «com» – это домен верхнего уровня. Это самый высокий уровень в системе доменных имен (DNS), используемой для перевода IP-адресов на простые языковые адреса, которые нам легче запомнить. Эти домены верхнего уровня создаются и управляются интернет-корпорацией присвоения имён и номеров (ICANN). Три наиболее распространенных домена верхнего уровня: .com, .net и .gov. В большинстве стран также есть свой двухбуквенный домен верхнего уровня, поэтому Вы встретите такие домены, как .ru (Россия), .uk (Великобритания), .ca (Канада) и многие другие. Также есть некоторые дополнительные домены верхнего уровня (например, museum), которые спонсируются и управляются частными организациями. В дополнение к ним существуют также некоторые общие домены верхнего уровня (например, .club, .life и .news).
  • Субдомен: поскольку DNS – это иерархическая система, обе части «www» и «example» нашего URL-адреса рассматриваются как поддомены. Часть «www» является субдоменом домена «com» верхнего уровня, а часть «www» является субдоменом «example» домена.

Это самый простой пример раздела полномочий URL-адреса, но всё может усложниться. Есть два других компонента, которые могут содержать полномочия:

  • Информация о пользователе: раздел полномочий также может содержать имя пользователя и пароль для сайта, к которому вы обращаетесь. Сегодня такую структуру в URL-адресах увидеть сложно, но это может произойти. Например, Вы можете увидеть что-то вроде «//username:password@www.example.com», если он содержит информацию о пользователе.
  • Номер порта: сетевые устройства используют IP-адреса для получения информации на нужном компьютере в сети. Когда этот трафик поступает адресату, номер порта сообщает компьютеру, для кого предназначен этот трафик. Номер порта – это ещё один элемент, который вы не будете часто видеть при просмотре в интернете, но вы можете увидеть его в сетевых приложениях (например, в играх), в которых вам нужно ввести URL-адрес. Если URL-адрес содержит номер порта, он появляется после имени хоста и ему предшествует двоеточие. Это будет выглядеть примерно так: «//www.example.com:8080».

Итак, это схема и часть полномочий URL-адреса, но, как вы могли догадаться, просмотрев много URL-адресов при просмотре веб-страниц, они могут включать в себя ещё больше атрибутов.

Пути, запросы и фрагменты URL-адреса

Есть три дополнительные части URL-адреса, которые вы можете увидеть после части полномочий: пути, запросы и фрагменты. Вот как они работают.

Путь URL-адреса

Раздел полномочий URL-адреса указывает браузеру (или любому другому приложению) на нужный сервер в сети. Это работает также, как путь к папке или файлу в Windows, macOS или Linux. Пути предшествует косая черта, и между каждым каталогом и подкаталогом есть косая черта, например:

www.example.com/folder/subfolder/filename.html

Последняя часть – это имя файла, который открывается при доступе к веб-сайту. Хотя вы не видите его в адресной строке, это не значит, что его нет. Некоторые языки, используемые для создания веб-страниц, скрывают имя файла и расширение. Это упрощает запоминание и ввод URL-адреса, и придаёт ему более чистый вид.

Запрос в URL-адресе

Часть запроса URL-адреса используется для идентификации вещей, которые не являются частью строгой структуры пути. Чаще всего вы увидите, что они используются при выполнении поиска или когда веб-страница передает данные через форму. Перед запросом ставят знак вопроса и размещают его после пути (или после имени хоста, если путь не включен).

В качестве примера возьмите этот URL-адрес, который был сформирован, когда мы искали в Yandex «wi-fi маршрутизатор»:

https://yandex.ru/search/?text=wi-fi%20маршрутизатор

Форма поиска передала информацию поисковой системе. После вопросительного знака вы можете увидеть, что в запросе указан текст, который мы набрали (это ?text=wi-fi%20маршрутизатор).

Это довольно простой пример, и Вы часто увидите URL-адреса с дополнительными (и более сложными) переменными. Например, вот URL, который мы получили при поиске через Google:

https://www.google.de/search?q=wi-fi+маршрутизатор&oq=wi-fi+маршрутизатор&aqs=chrome..69i57j0l5.5162j0j1&sourceid=chrome&ie=UTF-8

Как вы можете видеть, там есть какая-то другая информация. В этом случае вы можете увидеть, что есть дополнительная информация, указывающая браузер, который мы использовали (Chrome), и даже номер версии браузера.

Фрагменты URL-адреса

Конечный компонент URL-адреса, который вы можете увидеть, называется фрагментом. Фрагменту предшествует хэш-метка (#) и используется для указания определенного местоположения на веб-странице.

При кодировании веб-страницы разработчики могут создавать привязки к определенному тексту, например, к заголовкам. Когда соответствующий фрагмент используется в конце URL-адреса, ваш браузер загрузит страницу, а затем перейдет к этому якорю. Якоря и URL-адреса с фрагментами часто используются для создания таблиц контента на веб-страницах, чтобы упростить навигацию.

Вот пример. Страница Википедии о ренессансе – довольно длинный документ, и он разбит на 14 разделов, каждый из которых имеет несколько подразделов. Но каждый заголовок на странице содержит привязку, а оглавление в верхней части статьи содержит ссылки, которые позволяют перейти к различным разделам.

Вы также можете использовать эти фрагменты непосредственно в адресной строке своего браузера или в качестве разделяемых ссылок. Скажем, например, вы хотели показать кому-то раздел этой страницы, который описывает эпоху Возрождения в России. Вы можете просто отправить им эту ссылку:

https://ru.wikipedia.org/wiki/Возрождение#Возрождение_в_России

Часть «#Возрождение_в_России» в конце URL-адреса переместит Вас прямо в этот раздел после загрузки страницы.


3.6/12