Рассмотрим простой запрос, например, [автомобили]. Когда кто-то вводит в поисковую систему Google слово «автомобили», запрос посылается с компьютера пользователя через Интернет на компьютеры Google, которые ищут подходящие результаты. Как только компьютеры находят результат, они посылают их на компьютер пользователя. Все это происходит за долю секунды.
Затем происходит сохранение некоторых данных о обмене: запрос ([автомобили]), время и дату его введения, IP-адрес и файл cookie компьютера, с которого был введен, и тип браузера и операционной системы. Большинство веб-сайтов хранят записи о посещении подобным образом.
Типичная запись в журнале поисковой системы Google выглядит так:
Что значат записи в журнале поиска Google
- IP-адрес:
-
123.45.67.89 – это IP-адрес, присвоенный компьютеру пользователя его поставщиком услуг. Как и на других сайтах, когда вы ищете страницу Google (например, страницу результатов поиска), система использует IP-адрес вашего компьютера, чтобы послать нужные результаты на нужный компьютер.
Важно помнить, что с помощью IP-адреса нельзя определить местонахождение или лицо пользователя. На самом деле некоторые поставщики интернет-услуг (ISP) присваивают пользователям иной IP-адрес при каждом входе в интернет. Больше, что Google может узнать о пользователе с IP-адреса его компьютера, – это общее географическое местонахождение пользователя (например, Самара) и, возможно, название поставщика интернет-услуг, с помощью которого он подключается к Интернету. Только поставщик интернет-услуг (который на самом деле контролирует учетную запись) может связать человека с IP-адресом.
- Время и дата:
-
25/Aug/2011 10:15:32 – дата и время, когда пользователь ввел запрос в поисковую систему Google.
- Поисковый запрос:
-
https://www.google.com/search?q=автомобили – это запрос, в данном случае – [автомобили].
- Браузер и операционная система:
-
Chrome 2.0.0.7; Windows NT 5.1 – это браузер и операционная система, которые использовались.
- Файл cookie:
-
740674ce2123a969 – это уникальный идентификатор файла cookie, который присваивается браузеру, когда пользователь впервые посещает Google. Как и IP-адрес, файл cookie не указывает Google, кем является пользователь или где он проживает. С его помощью можно только идентифицировать компьютер. Эти файлы cookie можно удалить в браузере компьютера.
Временные рамки хранения данных
IP-адрес становится анонимными через 9 месяцев, а числа файлов cookie изменяются в журналах поиска навсегда через 18 месяцев. Таким образом разрушается связь между поисковым запросом и компьютером, с которого он был введен, подобно тому, как в выписках по кредитным карт цифры заменяются символами решетки для повышения защиты клиента.
Через 9 месяцев IP-адрес в журналах поиска может иметь такой вид: 123.45.67.XXX . Через 18 месяцев файл cookie будет заменен новым сгенерированным числом файла cookie.
Google – первая крупная поисковая система, которая ввела временные рамки хранения данных журналов и другие поисковые системы взяли это в пример.
Файлы cookie в интернете не являются вечными, как ничто не вечно в реальной жизни. Срок действия файлов cookie Google истекает через два года. Кроме того, Google всегда позволяет людям пользоваться своими службами без файлов cookie (хотя это может означать потерю некоторых возможностей или функций определенных продуктов).
Зачем Google сохраняет журналы поиска
Google использует журналы поиска для многих целей, например, для обеспечения защиты служб, разработки новых функций, которые сделают поиск быстрым и подходящими, а также для предсказания вспышек заболеваний.
Читайте следующую тему: как Google нацеливает рекламу