Site icon UiP

Как интеллектуальный анализ данных Facebook поможет найти наркоманов

Злоупотребление психоактивными веществами изменяет модели поведения людей, и это обнаруживается в сообщениях социальных сетей, говорят исследователи.

Расстройство, вызванное употреблением психоактивных веществ (substance use disorder – SUD) – это болезнь, возникающая у тех, кто злоупотребляет алкоголем, наркотиками и табаком, и нечто более серьезное. У таких людей ухудшается качество жизни.

Это является серьезной проблемой. Примерно один из 10 американцев страдает от этого расстройства. Оно обходится американской экономике в более чем $700 мдрд в год — от снижения производительности труда, роста преступности и расходов на здравоохранение. Поэтому власти, страховые компании и работодатели заинтересованы в том, чтобы идентифицировать людей, страдающих от такого расстройства.

Уоррен Бикель (Warren Bickel) из медицинского центра города Роанок, штат Вирджиния, предлагает методику, определяющую таких людей всего лишь по их записям в социальных сетях. Этот метод даже дает новое представление о том, как злоупотребление различными веществами влияет на людей, на их поведение в реальной жизни и в социальных сетях.

Новая методика анализирует данные, собранные в период с 2007 по 2012 год. Данные были получены в рамках проекта, который запускался на Facebook под названием myPersonality – “Моя идентичность”. Пользователям, пожелавшим принять участие в проекте, были предложены различные психометрические тесты. Позже они получили отзывы о результатах. Многие участники проекта также согласились предоставить свои данные для исследовательских целей.

В одном из этих тестов было опрошено более 13 тысяч пользователей среднего возраста 23 года. Пользователям задавали вопрос о веществах, которые они употребляли. В частности, авторы опроса интересовались, как часто респонденты употребляют табак, алкоголь или другие наркотики. Каждый участник сам оценивал активность употребления веществ и также получал оценку от экспертов. Затем людей разделили на группы в соответствии с уровнем злоупотребления психоактивными веществами.

Полученные данные очень важны. Они достаточно наглядно фиксируют точный уровень употребления психоактивных веществ для каждого человека.

Затем команда собрала еще два набора данных, связанных с Facebook. В первый набор данных вошли 22 млн обновлений статусов, опубликованных более чем 150 тыс пользователями Facebook. Другой был еще больше – “лайки” были получены от 11 млн пользователей крупнейшей в мире социальной сети.

И наконец, команда анализировала как эти наборы данных перекрываются. Ученые обнаружили почти тысячу пользователей, которые находились во всех наборах данных. Кроме того, было найдено более тысячи человек, которые находились в наборах данных о злоупотреблении психоактивными веществами и опубликованных статусах, и 3,5 тыс респондентов, которые находились в наборе данных о злоупотреблении психоактивными веществами и отмечали “лайками” подобные посты.

Эти пользователи с перекрывающимися наборами данных обеспечивают богатую пищу для исследователей. Если люди с расстройствами, вызванными употреблением психоактивных веществ, имеют определенные уникальные модели поведения, то можно обнаружить их в своих обновлениях статуса в Facebook или в том, как они “лайкают” записи.

Так Бикель и его сотрудники начали вначале анализировать обновления статусов на Facebook, а затем анализировали “лайки” этих людей. Любые шаблоны, которые они обнаружили, сравнивали с шаблонами поведения других людей и выясняли, есть ли у них одинаковый уровень употребления психоактивных веществ.

Ученые утверждают, что исследования оказались весьма результативны. Они с 86%й точностью угадывали употребление табака, с 81%й вероятностью употребление алкоголя и 84% вероятностью употребление наркотиков. По словам ученых, эти результаты значительно превосходят все существующие на сегодня методы.

Этот метод также выявил широкий диапазон ключевых слов, которые чаще используют в сообщениях в социальных сетях люди, употребляющие алкоголь и наркотики. Это ругательные слова, слова с сексуальным подтекстом, а также связанные с биологическим процессом. Все эти фразы характерны для наркоманов. А еще они чаще используют также медицинские термины. Алкоголики, в то же время, чаще употребляют язык ненависти.

Данные показывают корреляцию в обе стороны. Иными словами, есть связь между содержанием записей в соцсетях, пользовательскими интересами и склонностям к зависимостям. Например, те, кто любит такие фильмы как “V for Vendetta” или “Злой Санта”, часто принимают алкоголь, а те, кто употребляет слова типа “злость”, “убийство” — принимают наркотики.

Авторы исследования не скрывают, что их работа – это только начало. Для получения данных, которые можно было использовать повсеместно, нужно гораздо больше исходного материала. Цель ученых – повысить вероятность узнавания людей с зависимостями. Более того, используемый учеными способ можно применять и для идентификации других групп людей.

Социальные медиа предоставляют настолько огромные пласты данных, что ученым остается только применить к ним правильные инструменты анализа, чтобы получить готовый ответ. Социология нового типа позволит дать ответы на многие актуальные вопросы.

Другое дело, что люди без их собственного желания и согласия могут стать участниками эксперимента, а их персональные данные могут использоваться без их желания. Однако кто думает о приватности и защите индивидуума по сравнению с такой благородной целью, как исследование человечества.

Exit mobile version