The new study was intended to determine the validity of this method.
Нове дослідження мало на меті визначити валідність цього метода.
Приблизно кожна третя людина у світі використовує інтернет, тому й не дивно, що дані щодо його використання можуть дати важливу статистичну інформацію. Враховуючи, що близько 5% всіх запитів у пошуковиках стосуються медицини та охорони здоров’я, ці дані можна використовувати для аналізу стану здоров’я населення.
Ця ідея не є новою. Навіть сама корпорація Google (нині Alphabet) використовувала дані пошуків з метою прогнозування спалахів грипу. Онлайн сервіс «Google Flu Trends» проіснував з 2005 по 2015 рік і зараз доступний лише як архів даних (див.
Один із нових напрямків використання «Big Data» в медицині – це прогнозування рівнів самогубств задля оцінки ефективності профілактичних інтервенцій на популяційному рівні. Перші роботи з цього приводу почали проводитись із 2010 року і нині цей метод та його валідність інтенсивно вивчаються.
Нова робота щодо використання даних пошукових систем для прогнозування рівня самогубств була опублікована 16 серпня в журналі «PLoS ONE»
Дослідження мало доволі простий дизайн. Спочатку були проаналізовані реальні статистичні дані щодо суїцидів, взяті із баз даних США, Німеччини та Австрії за 2004 -2010 рр. Потім ці дані порівняли із статистикою використання термінів, пов’язаних із самогубствами, в пошуковій системі Google за цей період. Серед ключових слів використовувались такі, як «суїцид», «депресія», «як себе вбити», «суїцид онлайн» тощо декількома мовами. Аналіз даних використання таких пошукових запитів проводився за допомогою
Для оцінки взаємозв’язку між даними із пошукових запитів та реальною картиною використовували крос-кореляційні коефіцієнти. Загальна кількість статистично значимих крос-кореляційних коефіцієнтів, тобто випадків, коли показники співпадали по країнах склала: США – 9.96%, Німеччина – 2.29%, Австрія - 11.43%, Швейцарія - 2.86%.
Це означає, що прогностична потужність використання аналізу рівня суїцидів за пошуковими запитами доволі мала. Для порівняння, у середньому передбачування могли би справдитись у 8.34% всіх випадків, це при тому, що 5% - це рівень помилки 1го типу (хибно позитивний результат). Іншими словами передбачення лише трохи точніші за випадковий результат.
Задля більшої об’єктивності наведемо результати інших 3х досліджень, які підтвердили валідність цього прогностичного методу (
*Чим ближче показник до 1, тим більш прогностичні дані були схожими із реальними.
Дослідження | Країна | Пошукові запити | Метод | Розмір ефекту, r* |
---|---|---|---|---|
Ma-Kellams та ін., 2016 |
США | Суїцид/самогубство, як вчинити самогубство, як себе вбити, безболісне самогубство | Кореляційний та лінійних регресійний аналіз | Великий (0.49-0.63) |
Gunn та Lester, 2014 |
США | Вчинити самогубство, попередження самогубства | Кореляційний аналіз | Від середнього до великого (0.31 та 0.61) |
McCarthy, 2010 |
США | Самогубство/суцид, підліткове самогубство, депресія, розлучення, втрата роботи | Кореляційний аналіз | Великий (0.70 та 0.50) |
Sueki, 2011 |
Японія | Самогубство/суїцид, депресія, спосіб самогубства | Крос-кореляційний аналіз | Від середнього до великого (0.25-0.43) |
Yang та ін, 2011 |
Тайвань | 37 різних пошукових запитів | Крос-кореляційний та лінійний регресійний аналіз | Від середнього до великого (0.27-0.48) |
Автор заявляє про відсутність конфлікту інтересів.