Перейти до головного Перейти в головне навігаційне меню Перейти на нижній колонтитул сайту
Опубліковано: 2017-08-18

Google як засіб для прогнозування рівня самогубств

Редакція журналу
suicide rates forecast google суїцид самогубство google прогноз прогнозування

Анотація

Нове дослідження мало на меті визначити валідність цього метода.

Актуальність

Приблизно кожна третя людина у світі використовує інтернет, тому й не дивно, що дані щодо його використання можуть дати важливу статистичну інформацію. Враховуючи, що близько 5% всіх запитів у пошуковиках стосуються медицини та охорони здоров’я, ці дані можна використовувати для аналізу стану здоров’я населення.

Ця ідея не є новою. Навіть сама корпорація Google (нині Alphabet) використовувала дані пошуків з метою прогнозування спалахів грипу. Онлайн сервіс «Google Flu Trends» проіснував з 2005 по 2015 рік і зараз доступний лише як архів даних (див. 1).

Один із нових напрямків використання «Big Data» в медицині – це прогнозування рівнів самогубств задля оцінки ефективності профілактичних інтервенцій на популяційному рівні. Перші роботи з цього приводу почали проводитись із 2010 року і нині цей метод та його валідність інтенсивно вивчаються.

Прогнозування рівня суїцидів

Нова робота щодо використання даних пошукових систем для прогнозування рівня самогубств була опублікована 16 серпня в журналі «PLoS ONE» 2. Автори – співробітники Університету Вени, Австрія. Головною метою дослідження була оцінка валідності такого аналізу, іншими словами наскільки вдало можна спрогнозувати рівень суїцидів, базуючись на аналізі даних пошуків із пошукових систем.

Дослідження мало доволі простий дизайн. Спочатку були проаналізовані реальні статистичні дані щодо суїцидів, взяті із баз даних США, Німеччини та Австрії за 2004 -2010 рр. Потім ці дані порівняли із статистикою використання термінів, пов’язаних із самогубствами, в пошуковій системі Google за цей період. Серед ключових слів використовувались такі, як «суїцид», «депресія», «як себе вбити», «суїцид онлайн» тощо декількома мовами. Аналіз даних використання таких пошукових запитів проводився за допомогою «Google Trends».

Для оцінки взаємозв’язку між даними із пошукових запитів та реальною картиною використовували крос-кореляційні коефіцієнти. Загальна кількість статистично значимих крос-кореляційних коефіцієнтів, тобто випадків, коли показники співпадали по країнах склала: США – 9.96%, Німеччина – 2.29%, Австрія - 11.43%, Швейцарія - 2.86%.

Це означає, що прогностична потужність використання аналізу рівня суїцидів за пошуковими запитами доволі мала. Для порівняння, у середньому передбачування могли би справдитись у 8.34% всіх випадків, це при тому, що 5% - це рівень помилки 1го типу (хибно позитивний результат). Іншими словами передбачення лише трохи точніші за випадковий результат.

Задля більшої об’єктивності наведемо результати інших 3х досліджень, які підтвердили валідність цього прогностичного методу (табл. 1).

Дослідження Країна Пошукові запити Метод Розмір ефекту, r*
Ma-Kellams та ін., 2016 3 США Суїцид/самогубство, як вчинити самогубство, як себе вбити, безболісне самогубство Кореляційний та лінійних регресійний аналіз Великий (0.49-0.63)
Gunn та Lester, 2014 4 США Вчинити самогубство, попередження самогубства Кореляційний аналіз Від середнього до великого (0.31 та 0.61)
McCarthy, 2010 5 США Самогубство/суцид, підліткове самогубство, депресія, розлучення, втрата роботи Кореляційний аналіз Великий (0.70 та 0.50)
Sueki, 2011 6 Японія Самогубство/суїцид, депресія, спосіб самогубства Крос-кореляційний аналіз Від середнього до великого (0.25-0.43)
Yang та ін, 2011 7 Тайвань 37 різних пошукових запитів Крос-кореляційний та лінійний регресійний аналіз Від середнього до великого (0.27-0.48)
Таблиця 1.Дослідження, в яких підтвердилась валідність методу прогнозування рівня суїцидів за пошуковими запитами 2.*Чим ближче показник до 1, тим більш прогностичні дані були схожими із реальними.

Посилання

  1. Google Flu Trends. Official site.
  2. Tran U, Andel R, Niederkrotenthaler T, Till B, Ajdacic-Gross V, Voracek M. Low validity of Google Trends for behavioral forecasting of national suicide rates. PLoS ONE. 2017;12(8).
  3. Ma-Kellams C, Or F, Baek J, Kawachi I. Rethinking suicide surveillance: Google search data and self-reported suicidality differentially estimate completed suicide risk. Clin Psychol Sci. 2016;4:480-4.
  4. Gunn J, Lester D. Using google searches on the internet to monitor suicidal behavior. J Affect Disord. 2013;148:411-2.
  5. McCarthy M. Internet monitoring of suicide risk in the population. J Affect Disord. 2010;122:277-9.
  6. Sueki H. Does the volume of internet searches using suicide-related search terms influence the suicide death rate: Data from 2004 to 2009 in Japan. Psychiatry Clin Neurosci. 2011;65:392-4.
  7. Yang A, Tsai S-J, Huang N, Peng C-K. Association of internet search trends with suicide death in Taipei City, Taiwan, 2004–2009. J Affect Disord. 2011;132:179-84.