Современные технологии всё чаще вносят свой вклад в распространение наших тайн. Опустим бесчисленные документы каждого гражданина, хранящиеся в государственных базах данных или коммерческих структурах – наивно предположим, что эти данные надежно защищены от посторонних глаз. Забудем также о том, что мы теряем флэш-накопители и нас нередко атакуют хакеры. Мы возьмем во внимание только то, что пользователи отправляют в интернет.
Решение может показаться простым – что-то личное лучше не публиковать. Тем не менее, люди не имеют полного контроля над всеми своими личными данными; конфиденциальными сведениями могут поделиться друзья или родственники, – иногда это происходит без согласия самих участников.
Гены доступные публично
Информация, которая становится публичной, может быть очень личной. Например, в интернете может появиться код ДНК без вашего ведома. В последнее время приобретают популярность онлайн-сервисы, связанные с генетикой и родословной, такие как 23andMe, Ancestry, GEDmatch и MyHeritage.
Пользователи добровольно предоставляют сервису образцы генетического материала (слюна или слизь с внутренней части щеки), на основании которых в лаборатории составляют генетический профиль. Он может быть использован, например, для проверки происхождения данного лица или установления генетической предрасположенности в отношении конкретных заболеваний.
О конфиденциальности не может быть и речи. Генеалогические сервисы работают путём сопоставления созданного профиля с уже имеющимися в базе данных (в противном случае члены семьи не будут найдены). Однако это работает и в обратную сторону: пользователи добровольно раскрывают информацию о себе, чтобы родственники, которые также используют этот сервис, могли их найти.
Тут есть один нюанс: пользователи таких услуг одновременно публикуют генеалогические сведения о членах своей семьи, которые имеют такие же гены. А родственники могут быть против, чтобы кто-то имел возможность найти их, и особенно на основе их ДНК.
Преимущества генеалогических сервисов неоспоримы; благодаря им, много семей восстановило свою целостность. Однако, нельзя забывать, что публично доступные базы генов могут быть использованы в неблаговидных целях.
Братская любовь
На первый взгляд, проблема хранения генетической информации в государственных базах данных может не вызывать удивления, потому что трудно представить себе практические последствия этой ситуации. Однако, правда заключается в том, что генеалогические сервисы и образцы биоматериала (кусок кожи, ногтей, волос, крови, слюны и т.д.) могут – при определенных обстоятельствах – помочь в идентификации личности, без наличия его фото.
Фактический размер угрозы показало исследование, опубликованное в октябре на страницах журнала Science. Один из авторов, Янив Эрлиха, прекрасно знает все тонкости этой отрасли: он работает в организации MyHeritage, которая предоставляет услуги анализа ДНК и создания генеалогического дерева семьи.
По данным исследования, не менее 15 миллионов человек (на момент исследования) сделали генетический тест и сформировали свой профиль через электронную форму (другие данные указывают на то, что сама компания MyHeritage имеет более чем 92 млн пользователей). Исследователи показали, что публично доступные генетические данные скоро позволят идентифицировать любого американца европейского происхождения на основе кода ДНК.
Здесь стоит добавить, что нет разницы, будет ли тест сдан конкретным человеком или его родственником.
Как пишет журнал Nature, чтобы показать, как просто идентифицировать человека на основе кода ДНК, команда Янива использовала генетического профиль члена научно-исследовательского проекта в области генома, поместив его в базу данных службы GEDmatch и в течение 24 часов, получив имя и фамилию владельца образца ДНК.
Этот метод оказался может быть полезен для нотариусов, которые, благодаря генеалогическим сервисам, могут находить наследников.
Как цепочка ДНК находит преступников
Прошлой весной – после 44 лет бесплодных поисков – арестовали 72-летнего подозреваемого в совершении серии убийств, изнасилований и грабежей. Он был найден на основе генеалогической информации, доступной в интернете.
Лабораторный анализ биоматериала, найденного на месте преступления, позволил составить генетический профиль, который соответствовал требованиям государственных сайтов генеалогии. «Полицейский» под видом обычного пользователя загрузил файл в базу GEDmatch и получил список возможных родственников преступника.
Все найденные люди – а их было несколько – были отдаленными родственниками (родство не ближе 2 степени). Другими словами, в начале XIX века эти люди имели того же предка, что и преступник. Как описывает газета The Washington Post, пять генеалогов, имеющих доступ к архивам переписи населения, газетными некрологам и другим данным, стали изучать найденных родственников, постепенно заполняя пустые места в генеалогическом дереве.
В результате был создан большой круг дальних родственников преступника. Отвергая тех, кто не вписывался в критерии возраста и пола, исследователь, в конечном счете, нашли подозреваемого. Группа детективов проследила за ним, нашли предмет, на котором оставался образец его ДНК, а затем сравнили с материалом, найденным на месте преступления много лет назад. Оказалось, что код ДНК в обеих пробах идентичен, а 72-летний Джозеф Джеймс ДеАнжело был арестован.
Этот случай обращает внимание на главное преимущество, доступных публично в сети интернет генеалогических данных: их можно сопоставлять с базами данных ДНК правоохранительных органов. Вторая база хранит информацию только о преступниках, между тем, первая полна обычных пользователей, которые «втягивают» своих родственников виртуальную сеть.
Одно дело, когда какой-то человек не находится в розыске в соответствии с законом, совсем другое – когда этими данными воспользуется преступная группа. Эти сервисы находятся в открытом доступе, так что их может использовать каждый. И это вовсе не так хорошо.
Обременительная маркировка
Поиск на основе кода ДНК с помощью публичных сервисов – это всё ещё нишевые сервисы. Друзья и родственники, у которых нет дурных намерений, могут «также успешно» сообщить о вашем местонахождении преступникам, правоохранительным органам и остальному миру через пометку фотографий, видео и постов в социальных сетях.
Эти теги могут привести к возникновению неловких моментов. Предположим, что неосторожный лаборант решил перенести фотографии с мероприятия для сотрудников и отметил на них всех, в том числе известного профессора. Эти фотографии сразу же автоматически появляются на сайте профессора, подрывая его авторитет в глазах студентов.
Бездумно опубликованный пост вполне может привести к увольнению или другим проблемам. Стоит подчеркнуть, что все сведения, публикуемые в социальных сетях, могут быть использованы как недостающее звено во время описанного выше поиска с использованием общедоступных генеалогических баз данных.
Как настроить тегирование
Социальные сети позволяют пользователям контролировать ситуации, в которых они становятся участниками и в которых упоминаются. Например, Facebook позволяет удалять маркировку на фотографиях, опубликованных другими лицами, и ограничивать круг лиц, которые могут отмечать Вас или просматривать материалы, на которых вас кто-то пометил. Вместе с тем, пользователи Facebook могут скрыть фотографии, которые загрузили от друзей и отмеченных людей.
Интересно, что Facebook не только поощряет пользователей отмечать друзей через подсказки, получаемые с помощью технологии распознавания лиц (эту функцию можно отключить в настройках учетной записи), но также помогает им «бороться с конфиденциальностью»: социальная сеть отправляет уведомление, если указанная технология находит на картинке кого-то другого.
В случае сервиса Instagram ситуация выглядит так: в своих фотографиях и фильмах Вас могут пометить все, кроме тех, кого вы сами заблокировали.
Несмотря на то, что эти функции предлагают частичный контроль над тем, где и когда появится ваш образ, эта ситуация создает много угроз. Даже если заблокировать человека, отмечающего вас на фотографиях, ваше имя по-прежнему может быть упомянуто в описании или комментариях к фото. Это означает, что изображение по-прежнему будет связано с вами, и отследить такие утечки личных данных практически невозможно.
Что будет дальше?
Интернет сегодня хранит гораздо больше информации, связанной с нашими семьями или генами, чем мы можем себе представить. Эту ситуацию мы не можем полностью контролировать по одной причине: мы не знаем об этом слишком много. Очень вероятно, что с развитием новых технологий понятие «личных данных» уйдёт в историю – наша реальная и виртуальная личности станут более связаны друг с другом, а каждая тайна в интернете рано или поздно станет устаревшей.
Тем не менее, проблема конфиденциальности в интернете всё чаще обсуждается в правительствах по всему миру, так что, возможно, мы ещё сможем найти способ, чтобы защитить себя от любопытных людей.