В какой степени алгоритмы и SEO-специалисты несут ответственность за предвзятость поиска Google? Тема сложнее, чем кажется на первый взгляд.
В 2016 году ООН заявила, что доступ к Интернету является правом человека.
Решение было принято при том понимании, что Интернет является инструментом, позволяющим каждому получить доступ к информации и самовыражению.
Эта резолюция вызвала дискуссию о доступе с точки зрения инфраструктуры, где проложены или обновлены оптоволоконные кабели, или о предоставлении бесперебойного доступа во время гражданских беспорядков и других чрезвычайных ситуаций.
Хотя это действительные и важные моменты, Интернет — это не просто провода и экраны, и доступ к информации может быть изменен на основе алгоритмов.
Поскольку Интернет интегрировался в нашу жизнь, он стал частью нашей социальной инфраструктуры (аналогично медицинским или образовательным услугам).
Хорошо задокументировано, что в медицинском и образовательном пространстве существуют предубеждения, включая доступ к медицинской помощи и качество медицинской помощи, но как насчет результатов поиска?
Насколько результаты поиска справедливы? Являются ли они неотъемлемыми атрибутами окружающего нас мира? Или они приносят больше вреда, чем пользы?
Что в алгоритме?
В цифровом маркетинге «алгоритм» — это термин, который используется ежедневно независимо от того, понимает ли кто-то, что он означает. У каждой платформы есть один (или несколько), и наша задача — попытаться удовлетворить их.
Алгоритм — это процесс, которому следуют, когда система выполняет вычисления.
Он принимает входные данные и использует формулы, правила или другие операции по решению проблем, чтобы получить результат.
Для поиска это означает, что запросы, введенные в поле поиска, являются входными данными, а SERP (страница результатов поисковой системы) — выходными данными.
Это очень упрощенное объяснение происходящего. Google использует несколько алгоритмов в сочетании с ИИ (искусственным интеллектом) и машинным обучением.
Анализ всей системы выходит далеко за рамки моих возможностей и целей этой статьи.
Является ли алгоритм PageRank предвзятым?
Исследование, опубликованное в 2011 году, уже поставило под сомнение справедливость PageRank.
Модели показывают, что по мере роста сети стабильность сайтов с высоким рейтингом становится все более стабильной, в результате чего оставшиеся веб-сайты вынуждены спорить о том, что делать.
Журнал Nature в феврале 2022 года опубликовал статью, в которой исследуется алгоритм PageRank, чтобы выяснить, вносит ли он или усиливает предвзятость.
Проще говоря, исследователи создали пять потенциальных социетальных моделей с разной степенью гомофилии («тенденция связываться с похожими другими»).
Каждая модель содержит 20 узлов, но будем называть их сайтами. Затем каждому сайту был присвоен ранг страницы и либо часть большинства, либо меньшинство в обществе.
Неравенство измерялось с использованием коэффициента Джини (статистический анализ для измерения неравенства), чтобы увидеть, как индивидуум набрал баллы по сравнению с равным распределением. Неравенство измерялось путем подсчета процента меньшинств в верхних результатах поиска.
Их результаты показывают, что алгоритм PageRank может уменьшить, воспроизвести или усилить предубеждения в зависимости от используемой модели.
В моделях с высокой степенью гомофилии доминирующие голоса увековечили эти взгляды и предубеждения, недопредставляя меньшинства.
С другой стороны, когда группа большинства гетерофильна (тенденция собираться в разные группы), меньшинства преобладают.
Это закладывает некоторую основу для будущих исследований потенциальных вмешательств или снижения предвзятости алгоритмов.
Пересечение культуры и результатов поиска изображений в Google
Исследования показали, что алгоритмы могут быть предвзятыми и что многие из них таковыми являются. Как обсуждалось ранее, PankRank может играть роль в этих предубеждениях, усиливая или уменьшая их, но алгоритмы не действуют в одиночку.
В случае с Google задействованы не только несколько алгоритмов, но и искусственный интеллект и машинное обучение. Все эти элементы постоянно развиваются благодаря нашему (человеческому) взаимодействию.
В другом исследовании, опубликованном в этом году, изучалось, присутствует ли социальное гендерное неравенство в результатах поиска изображений Google (с помощью алгоритмов локализованного поиска).
Исследователи составили график гендерного неравенства по странам (на основе Глобального индекса гендерного разрыва) и процент мужчин, которые появились в результатах поиска Google Image при поиске «человек» на соответствующем языке каждой страны (используя VPN для доступа к местным результатам).
Страны с большим гендерным неравенством видели больше изображений мужчин по гендерно-нейтральному ключевому слову «человек». Они утверждают, что это связь между социальными нормами и алгоритмическими результатами.
Во второй части исследования изучалось, как эти предвзятые результаты могут повлиять на принятие решений людьми.
Участники просмотрели скриншоты результатов Google Image из стран с низким и высоким неравенством, и им были заданы вопросы о поле и роде занятий.
Опуская детали (хотя я думаю, что статью стоит прочитать), результаты показали, что культурные предубеждения, присутствующие в алгоритмах, могут (и влияют) влиять на индивидуальное принятие решений.
Когда участники видели результаты изображений из стран с низким уровнем неравенства, их результаты были более эгалитарными по сравнению с результатами из стран с высоким неравенством, где результаты усиливали гендерные предубеждения.
Уровень гендерного неравенства в обществе отражается в алгоритме поиска, что заставляет задаться вопросом, насколько. Ведь сочетание этих элементов влияет на индивидуальное восприятие при каждом использовании.
Кто несет ответственность за предвзятость в поисковой выдаче?
Задав этот самый вопрос, мы надеялись получить простой ответ.
К сожалению, его нет, потому что мы все несем ответственность за предвзятость в результатах поиска. От оригинальных кодеров до писателей, SEO-специалистов и создателей ссылок, а также общества, культуры и среды, в которой мы существуем.
Представьте себе все алгоритмы, с которыми вы ежедневно взаимодействуете. Если воздействие этих алгоритмов влияет на ваше восприятие мира, то оно становится беспорядочным, распутывая цепочки множества входных данных.
Как мы можем сделать алгоритм лучше?
Нельзя оставить вас с таким тяжелым бременем. Давайте начнем обсуждение того, как мы можем сделать поиск и контент более инклюзивным пространством.
Исследователи, изучавшие предубеждения в PageRank, пришли к выводу, что, хотя гомофильные сети являются причиной неравенства, меньшинства могут преодолеть это с помощью стратегического сетевого взаимодействия.
Это неразумное решение, поэтому они предложили реализовать DPAH (не волнуйтесь, мы не будем вдаваться в подробности!).
Эта модель устраняетт необходимость в том, чтобы меньшинства были связаны с большинством.
В другом исследовании были предложены вмешательства, основанные на психологии, поскольку они пришли к выводу, что социальное гендерное неравенство отражается в алгоритме. Они призывают к более этичному ИИ, который сочетает в себе наше понимание психологии и общества.
Как правило, самая большая забота SEO-специалиста заключается в том, как обратиться к алгоритму, а не сомневаться в его справедливости или равенстве, или в том, как мы можем повлиять на укоренение вредных предубеждений.
Благодаря использованию программного обеспечения на основе ИИ для интерпретации алгоритмов должен наступить момент, когда мы начнем сомневаться в этической составляющей нашей работы.
В настоящее время результаты поиска не являются точным представлением справедливого мира, когда они могут быть таковыми.
Как SEO-специалисты, создатели контента и маркетологи, мы играем большую роль в воспроизведении несправедливого контента, повышении видимости и без того громких голосов и сохранении наших предубеждений, связанных с местной культурой.
Вот несколько других предложений, которые должны был помочь создать более справедливую среду поиска.
- Прекратите копировать предвзятый контент — поделитесь своей платформой с разными мнениями и создавайте новые нарративы в своей нише.
- Аудит ИИ-контента. Не нужно отказываться от ИИ-контента, но его должен проверять человек, поскольку он рискует попасть в те же шаблоны.
- Аудит алгоритмов — аналогично тому, как мы проверяем веб-сайты, алгоритмы могут быть проверены. Имеются ресурсы для аудита потенциальных предубеждений и аудита для оценки воздействия.
- Поддержите образование — поддержите или станьте волонтером в организациях, которые предоставляют кодирование, программное обеспечение или техническое обучение женщинам, цветным людям или другим маргинализированным группам.
- Многоязычные ресурсы — создавайте SEO и другие маркетинговые ресурсы на языках, отличных от русского, чтобы учесть разные мнения и точки зрения.
- Создавайте менее предвзятые алгоритмы и ИИ — легче сказать, чем сделать, но в прошлом году Google AI анонсировала KELM, у которого есть некоторый потенциал в отношении проверки фактов и уменьшения предвзятости.
- Остановить джентрификацию поиска. Быть антиконкурентным — значит быть антибизнесом. Он подавляет новые и разнообразные мнения, поэтому хотелось бы видеть больше компаний в поисковом ландшафте и больше разнообразия в результатах.
Здесь не будет заключения по этой теме, так как этот разговор должен продолжаться в соцсетях, на конференциях, за чашкой кофе и в нашей повседневной работе.