Проблема формирования качественной поисковой выдачи Google связана с повсеместным распространением фейковых новостей. Сможет ли Google преодолеть её?
Последние несколько месяцев Google столкнулась с претензиями, связанными с качеством поиска. Долгое время поисковый сервис был условным “золотым стандартом”. Результаты, полученные с помощью Google, практически не вызывали сомнений. Но сейчас компанию все чаще обвиняют в том, что на результаты ее работы надеяться нельзя. Кризис столь глобален, что его можно сравнить с кризисом Apple после запуска Apple Maps или проблемами Samsung после взрывающихся Samsung Galaxy Note 7. Однако в отличие от этих компаний, защитить Google от потери доли на рынке может отсутствие реальных конкурентов. Попытки Bing стать конкурентом Google, по большому счету, успехом не увенчались, по крайней мере, вне американского рынка. Тем не менее, компании нужно что-то делать с репутационными потерями.
Что не так с поиском Google
В ноябре прошлого года Google оказалась втянутой в скандал вокруг фейковых новостей в Facebook. Вначале интернет-сообщество активно обсуждало распространение фейков в Facebook, связанных с избирательной кампанией по выборам президента США. Засилье фейков в Facebook стало предметом обсуждения людей, далеких от интернета. Со временем рост популярности фейковых новостей отобразился и в выдаче Google. В частности, при поиске результатов голосования на выборах в США в новостном блоке Google оказались ссылки на фейковые страницы.
Не успел утихнуть скандал вокруг «избирательных фейков», как The Guardian опубликовал статью, анализирующую выдачу Google по ряду запросов. При этом журналисты провели эксперимент и проверили, как Google формирует блоки с ответами. Для этого запросы задавались «умному» голосовому помощнику Google Home, который озвучивал найденные результаты.
Обнаруженные факты поражали. Например, Google Home сравнивал женщин с проститутками, отрицал факт Холокоста и делал множество других весьма спорных выводов. Позже обнаружились и другие проблемы в формировании расширенных сниппетов (featured snippets) – блоков с ответами на вопрос и с фактами, помогающими понять его суть. Например, в таком блоке было сказано, что бывший президент Барак Обама замышляет переворот.
Куда пролезли фейки: что Google стоит исправить в работе поисковика
Популярность сайтов с фейковыми новостями наряду с особенностями работы алгоритма Google привели к общему снижению качества работы поисковой системы. Это особенно заметно в некоторых возможностях Google.
Автозаполнение
Несколько недель назад Google начала тестирование инструмента, который бы позволил сообщать о неприемлемых вариантах автозаполнения. Тем не менее, до сих пор в списке автозаполнения, предлагаемом для ввода, можно найти странные и даже нежелательные пункты. Чаще всего они связаны с запросами о политике, расовых группах, национальностях и сексуальной ориентации.
Это будет продолжаться до тех пор, пока функция будет основана на наиболее частых запросах. Действительно, много людей задают такие спорные и неполиткорректные запросы. Формируя на их основе список автозаполнения, Google всегда будет сталкиваться с неприемлемым содержанием. Bing, кстати, работает не так однозначно.
Чтобы решить эту проблему, Google стоит как можно быстрее запустить жалобы на спорные пункты и улучшить способы фильтрации оскорбительных предположений.
Поисковые сниппеты
В своей работе уже несколько лет поиск от Google стремится избавить пользователей от необходимости искать и часто предлагает готовый ответ на поисковый запрос. Однако в этих ответах могут оказаться не только неполиткорректные, а еще и ложные сведения. Для решения этой проблемы, возможно, Google следует устранить поисковые сниппеты как элемент выдачи, особенно там, где они не нужны. Это поощрит людей оценивать различные результаты, а не фиксироваться на одном конкретном ответе.
Правда, это усложнит работу умных колонок Google Home и персонального ассистента Google Assistant и даже где-то позволит им потерять основное конкурентное преимущество перед Apple Siri и Amazon Echo. Даже если система оценки контента от Google, стартовавшая несколько недель назад, будет работать «на отлично», это не защитит поисковую выдачу от других проблем. Например, от Google-бомбинга. По большому счету, у любой попытки дать точный ответ есть вероятность появления неясных или неточных ответов.
Одним из вариантов решения этой проблемы может быть подсказка, подчеркивающая пользователям, что поисковая система дает не точный ответ, а всего лишь «лучший из предположительных», поощряя рассмотреть и другие ответы.
Главные истории
Проблема поддельных новостей или сайтов сомнительного содержания в блоке «Главные истории» – это исключительно результат политики Google. Компания сознательно отказалась от включения в этот раздел только проверенных новостных сайтов еще в октябре 2014 года. Именно по этой причине в новостном блоке Google можно встретить не только официальные ресурсы, а любые другие сайты. Среди них могут быть и сайты с фейковыми новостями.
Можно, конечно, пойти по пути Рунета и требований к агрегатору новостей включать в свою выдачу только проверенные сайты, более того, отвечать за достоверность размещаемого контента. Однако такие шаги – не борьба с фейками, а проявление цензуры.
Более того, возврат к проверенным источникам не решит проблему. Ведь есть проверенные источники, подающие информацию только с одной стороны. Теоретически, их тоже можно запретить, но тогда и это тоже будет цензурой.
Поиск никогда не будет идеальным
По большому счету, кризис, с которым столкнулась поисковая система Google – это положительное явление, это повод что-то улучшить. Текущая ситуация вынуждает компанию решить, наконец, вопросы, не терпящие отлагательств. Не ясно, как Google сможет решить свою главную проблему качества поиска. Ведь результат поиска никогда не будет идеальным и единственно верным.
Google обрабатывает 5,5 млрд запросов в день. Причем около 15% из них – это новые запросы, которые никогда ранее не задавались. Google пытается отвечать на эти вопросы, анализируя миллиарды страниц из интернета. Каждый раз давать идеально точный и правильный ответ – задача практически невыполнимая. Почти для любого запроса в выдаче можно найти некорректные или сомнительные результаты. Однако эта проблема становится более актуальной на фоне появления спорного контента в сети и большого количества людей, занимающихся фактчекингом или просто тех, кто знает условно правильный ответ.
Еще одна проблема для специалистов по поиску и разработчиков алгоритмов поисковой системы состоит в работе в новых условиях. Если раньше они имели дело с SEO-спамом, который пытался достичь высот поисковой выдачи, то сегодня они должны бороться и с фейками, которые положительно воспринимаются аудиторией. О популярности этих фейковых страниц говорят их доходы от рекламы.
Мы должны продолжать требовать от Google высокого качества поиска, но нужно понимать, что совершенство в этом вопросе недостижимо. Что с несовершенными поисковыми системами мы будем вынуждены использовать навыки критического мышления, а не просто вслепую доверять ответу. И этому же нам стоит учить будущие поколения.
Жизнь сама по себе редко имеет “один правильный ответ” на любой вопрос. Ожидать такой единственный ответ от Google будет большой ошибкой.