Яндекс начал индексировать Google Документы с паролями. Как с этим бороться?

  • 05.07.2018, 22:52
  • 372
  • Вечером 4 июля российские пользователи обнаружили, что поисковик «Яндекс» слишком тщательно индексирует документы, хранящиеся в сервисе Google Docs: в выдаче оказались файлы, содержавшие пароли, номера кредитных карт и корпоративные документы.

    Яндекс начал индексировать Google Документы с паролями. Как с этим бороться?


    Пресс-служба «Яндекса» заявила, что компания действовала строго по правилам, но уже в час ночи 5 июля российский поисковик переставал выдавать какие-либо результаты из Google Docs. «Медуза» рассказывает, что произошло — и какая общественно значимая информация появилась в публичном доступе из-за лазейки.

    Как это могло произойти?

    В 2009 году Google объявила, что публичные документы из Google Docs начнут появляться в выдаче поисковиков — но только если на них существует публичная ссылка. На практике это должно означать, что ссылка на документ, которой пользователь не делился ни с кем (или делился только в почте или мессенджерах), не должна появляться в выдаче — даже если доступ к документу не ограничен. С тех пор поисковики — и сам Google, и Mail.ru, и Yahoo, и Bing — действительно индексируют десятки тысяч публичных документов из Google Docs. Уникальная ситуация с «Яндексом» заключается в том, что он удивительно качественно начал выдавать ссылки на файлы с действительно важной информацией.

    Если покопаться, в других поисковиках тоже можно найти документы с приватными данными, но по простому запросу «пароли» они не выдают ссылки на таблицы с паролями, предлагая вместо этого неинтересные документы-ловушки. Более того, журналистам «Медузы» не удалось найти в Google те приватные документы, что выдавались на первых страницах выдачи «Яндекса», даже используя их полное название.

    В корпоративном блоге Google на русском языке 5 июля появилась запись, которая фактически подтверждает правила индексации, описанные выше. «Яндекс» в ней никак не упомянут.

    В «Яндексе» не объясняют, что произошло

    Формально вина за утечку таких документов лежит на пользователях, которые выставили неправильные настройки приватности (не хочешь, чтобы их видели посторонние, — не открывай доступ «для всех»). Однако как они оказались в выдаче «Яндекса», все равно неясно.

    В «Яндексе» на этот вопрос не отвечают. Единственный комментарий пресс-службы о произошедшем звучит так: «„Яндекс“ индексирует только открытую часть интернета — те страницы, которые доступны при переходе по ссылкам без ввода логина и пароля. Страницы, индексация которых запрещена администратором сайта в файле robots.txt, „Яндекс“ не индексирует, даже если они находятся в открытой части интернета. В среду вечером в службу поддержки обратились пользователи с жалобами на проблему доступности файлов на docs.google.com. Наша служба безопасности связывается сейчас с коллегами из Google, чтобы обратить их внимание на то, что в этих файлах может оказаться приватная информация».

    Robots.txt — специальный файл, который хранится в корне многих сайтов. В нем указаны инструкции для поисковых роботов: какие файлы и пути на сервере они не должны сканировать, а какие могут. У Google Docs такой файл тоже есть. В нем прописано, что поисковики могут сканировать в том числе адреса, начинающиеся на docs.google.com/document — именно так выглядит первая часть ссылки на текстовый документ, созданный в сервисе. Таким образом, роботы «Яндекса» имели право индексировать документы, к которым сами пользователи открыли доступ (изучить содержимое приватных файлов поисковик в любом случае не смог бы — это уже контролирует Google). Другое дело, что просто подобрать адреса документов «Яндекс» бы не сумел: это длинные случайные наборы символов. Ссылки на файлы, к которым может иметь доступ кто угодно, все равно нужно было где-то добыть.

    Возможно, все дело в «Яндекс.Браузере». Но это неточно

    Можно осторожно предположить, что люди, создающие файлы с паролями или отчетами, не выкладывали на них публичные ссылки. Некоторые пользователи предположили, что «Яндекс» индексирует ссылки, которые открывали пользователи «Яндекс.Браузера» — либо пересылали друг другу через «Яндекс.Почту».

    У теории с браузером есть предыстория: в 2015 году оказалось, что «Яндекс.Браузер» передавал на серверы «Яндекса» информацию о том, какие страницы посещал пользователь (это задокументированная особенность приложения). Затем эти ссылки попадали в базу робота, который индексирует интернет для поисковика. Как следствие, робот переходил даже по ссылкам, которые передавались приватно, — они позволяли зайти в профиль пользователя без пароля. Теоретически такие приватные страницы, доступные только по прямой ссылке, могли оказаться в поисковой выдаче, но в том случае этого не произошло. В «Яндексе» тогда заявили, что робот получил ссылки от браузера по ошибке и больше такого не будет.

    На вопросы «Медузы» о том, могло ли появление ссылок на Google Docs в выдаче «Яндекса» быть связано с тем, что эти документы открывались в «Яндекс.Браузере» или пересылались в «Яндекс.Почте», в пресс-службе компании не ответили.

    Какая информация появилась благодаря утечкам?

    «Тинькофф-банк» якобы не нанимает мужчин «кавказской национальности» и геев

    Несколько пользователей фейсбука обратили внимание на документ, выглядящий как инструкция для сотрудников HR-отдела «Тинькофф-банка». Из него следует, что в банке запрещают нанимать мужчин «кавказской национальности» и людей «с неславянскими ФИО», за исключением армян и дагестанцев с опытом работы в банках. «Нельзя» нанимать и кандидатов «с нетрадиционной сексуальной ориентацией», а также «представителей негроидной расы».

    Утром 5 июля в «Тинькофф-банке» изданию TJ заявили, что в организации нет ни таких документов, ни ограничений при найме персонала. Сейчас документ удален. Через несколько часов компания предложила новую версию событий: «Сотрудник [банка] изготовил этот текст с неясными для нас намерениями и выложил его в интернет». В пресс-службе добавили, что автор документа продолжает работать в банке, а вопрос о дисциплинарных мерах в его отношении будет решен позже; пока ему провели «дополнительный инструктаж по ценностям» банка.

    Московские чиновники якобы уже повышают явку на выборах мэра

    Представители движения наблюдателей «Сонар» обнаружили гугл-документы с личными данными московских избирателей. Например, как указывается в фейсбуке «Сонара», начальница управления соцзащиты Северного административного округа Москвы Светлана Истомина 27 июня создала документ под названием «Ресурсная карта УИК», где собраны данные голосующих на дому, людей с инвалидностью и других избирателей, зависимых от соцзащиты, а также указаны ответственные за «меры по мобилизации ресурса». Активисты предполагают, что мобилизовать таким образом предполагается электорат для участия в выборах московского мэра, которые состоятся в начале сентября. Также активисты «Сонара» нашли документ со списком 23 тысяч избирателей, зарегистрированных в Восточном Дегунино. Рядом с фамилиями в таблице стоит пометка «звонить»; в некоторых ситуациях — в случае людей, которым, видимо, уже позвонили, — указано: «живет на даче», «отказ голосовать», «отказ от уч. в выборах» и прочее.

    В пресс-службе Мосгоризбиркома сообщили «Медузе», что о появлении в открытом доступе персональных данных избирателей они ничего не знают и «ничего не думают». Пресс-служба правительства Москвы была недоступна для комментариев.

    «Леруа Мерлен» ведет учет своих критиков

    Обозреватель «Эха Москвы» Александр Плющев обнаружил гугл-таблицу, в которой ведется учет негативных комментариев, оставленных о компании «Леруа Мерлен» в связи с выступлениями ее пиар-директора Галины Паниной.

    Плющев предположил, что таким образом координировалась кампания против Паниной. Позже представители «Леруа Мерлен» подтвердили достоверность таблицы и сообщили, что сами собирали негативные комментарии, чтобы провести их «аналитику».

    Екатеринбургские чиновники якобы борются с Варламовым

    Блогер Илья Варламов утверждает, что нашел отчет, составленный сотрудниками администрации Екатеринбурга, в котором чиновники указывают, как ответить на негативные публикации Варламова о городе. В документе требуют подготовить репортаж от имени «местного жителя и блогера» «об удобстве парков и улиц Екатеринбурга», а также «максимально связать [произошедшее] с темой [бывшего мэра города Евгения] Ройзмана — заявить, что это очередной пример, когда глава города, выбранный не как „крепкий хозяйственник“, а как популярная политическая фигура, в итоге не способен эффективно поддерживать городское хозяйство и крупные федеральные проекты».

    Сотрудница пресс-службы администрации Екатеринбурга Виктория Мкртчян сказала «Медузе», что попавший в интернет документ о минимизации последствий визита в город блогера Ильи Варламова — фейк. «Администрация Екатеринбурга не работает в Google Docs из-за требований безопасности», — добавила она.

    У «троллей», возможно, есть методичка

    В своем телеграм-канале Александр Плющев также опубликовал ссылку на гугл-таблицу, сопроводив ее комментарием «еще какую-то методичку прислали». В таблице три вкладки: «Путин», «Горбачев» и «Сталин»; в каждой из них приведены исторические события, случившиеся во время их правления, или общественные феномены, существовавшие в этот период. События распределены по графам «позитив для России» и «негатив для России»; также есть столбцы «аргумент» и «контраргумент». Например, к пункту «Посол России в Ливии был резко против нашего молчаливого потакания свержению Кадафи» (так в документе) приводится комментарий «Строго говоря командовал Медведев. Путин же был не согласен (по крайней мере на словах)» (так в документе). В столбце «контраргумент» по закону о запрете гей-пропаганды указано «Это все-таки хороший закон, хотя я не знаю, как он работает на практике».

    Издание Znak.com предполагает, что таблица содержит в себе сценарии интернет-дискуссий, которые могут использовать люди, пишущие платные комментарии в поддержку российской власти, однако верифицировать это невозможно.


    * Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

    Рейтинг:

    (0)
    Meduza