Анотація
Мета дослідження: розглянути особливості статистичного аналізу при проведенні психологічних та медико-психологічних досліджень.
Результати. Однією з особливостей проведення медико-психологічних досліджень є процес вимірювання результатів експерименту. На відміну від медичних досліджень, в яких зазвичай використовуються фізичні одиниці вимірювання, більшість змінних у психологічних дослідженнях не є однозначними чи простими для вимірювання. Для опису процедур психологічного вимірювання у психологічних дослідженнях використовують 4 типи шкал вимірювання: номінативна, порядкова, інтервальна та шкала рівних відносин. Статистичний аналіз результатів медико-психологічного дослідження залежить від типу шкали, в якій вимірювалася досліджувана ознака.
Номінативна шкала – це шкала, що класифікує за назвою. Для опису та аналізу номінативних шкал використовують таблиці спряженості. Порядкова шкала – шкала, що класифікує за принципом «більше-менше». Статистичний аналіз порядкових шкал проводять за допомогою непараметричних критеріїв. Інтервальна шкала – це шкала, за якою кожне з можливих значень ознаки знаходиться на однаковій відстані від іншого значення. Шкала рівних відносин має всі властивості номінативної, порядкової та інтервальної шкал. Для аналізу результатів дослідження, що були виміряні у інтервальних шкалах або у шкалах рівних відносин використовують параметричні або непараметричні критерії в залежності від розподілу випадкової величини.
Висновок. Вибір методу статистичного аналізу результатів психологічного дослідження залежить від типу шкали, в якій вимірювалися дані. Коректне застосування статистичного аналізу є запорукою отримання достовірних результатів медико-психологічного дослідження.
Вступ
Останні два десятиліття у світовій медицині спостерігається збільшення використання міждисциплінарного підходу в наукових дослідженнях та мультидисциплінарності як принципу надання не лише медичної допомоги, але й забезпечення якості життя пацієнта та його фізичного та соціально-психологічного добробуту [1,2]. Особливе місце в цьому контексті займають медико-соціальні, насамперед медико-психологічні дослідження, психологія здоров’я, психосоматичний підхід нині набувають особливо актуального значення [3,4]. За своїми методами психологія, як наука, що сформувалась відносно недавно, суттєво відрізняється від медицини та інших наук. Основними методами психології є спостереження, опитування, тестування, експеримент [5].
Важлива відмінність психологічних досліджень – це процес вимірювання результатів психологічного експерименту. На відміну від фізичних одиниць, для яких вимірювання - це чисельна оцінка і вираз однієї величини по відношенню до іншої, в психометрії вимірювання – це присвоєння чисел об’єктам чи подіям за деяким правилом [6]. Іншими словами, вимірювання в процедурі психологічного експерименту розглядається як метод реєстрації стану об'єкта дослідження і відповідно зміни цього стану у відповідь на експериментальний вплив [7]. Багато змінних, що вивчаються психологами, є простими для вимірювання (вік, зріст, вага). Проте більшість змінних у психологічних дослідженнях не настільки однозначні чи прості для вимірювання. Ми не можемо, наприклад, точно оцінити рівень інтелекту людей, виміряти їхню самооцінку [8]. Крім того, багато психологічних змінних можна визначити різними способами. Наприклад, стрес можна визначити за шкалою стресу, за шкалою сприйнятого стресу, за концентрацією кортизолу в слині, за кількістю стресових життєвих подій, які пацієнт нещодавно переживав, або навіть за власно створеним показником [8].
У психології розрізняють три основні процедури психологічного виміру, в основі яких лежить об'єкт вимірювання: вимір піддослідних, вимір стимулів, спільне вимірювання стимулів і піддослідних [7]. Для опису процедур психологічного вимірювання у психологічних дослідженнях використовують 4 типи шкал вимірювання, які були запропоновані С.Стівенсоном [6].
Номінативна шкала
Номінативна шкала –це шкала, що класифікує за назвою. Назви не вимірюються кількісно, вони лише дозволяють відрізнити один об’єкт дослідження від іншого. Найпростіші номінативні шкали – це дихотомічні шкали, що мають тільки дві категорії (наприклад, стать, домінантна рука, наявність братів чи сестер) [9]. Більш складні номінативні шкали складають з трьох або більшої кількості комірок. Це можуть бути, наприклад, класифікація за етнічною приналежністю, сімейним станом, кольором очей. Суттєвою ознакою номінальних шкал є те, що вони не передбачають жодного упорядкування відповідей. Наприклад, класифікуючи людей за їх улюбленим кольором, дослідник не може зелений поставити «попереду» синього. Відповіді просто класифікуються. Таким чином, номінальні шкали відображають найнижчий рівень вимірювання [8]. Оперуючи номінативними шкалами, дослідник має тільки одну числову характеристику – кількість спостережень.
Для статистичного аналізу номінативних шкал використовують таблиці спряженості, в яких вказують кількість осіб кожної дослідної групи, що мають або не мають дану ознаку. Результати досліджень подають у вигляді кількість (%). Для порівняння частоти наявності ознаки в двох дослідних групах використовують критерій Пірсона, при умові, що вибірки незалежні та в усіх комірках числа більше ніж 10. Для порівняння малих незалежних вибірок використовують точний критерій Фішера. Якщо необхідно порівняти залежні вибірки, застосовують тест МакНемара. Для оцінки відносного ризику в дослідженнях типу «випадок-контроль» використовують відношення шансів, а для аналізу проспективних досліджень - відносний ризик. Більш детально аналіз таблиць спряженості описаний в роботі М.Іванчук і співавт. [10].
Розглянемо приклад даних, поданих у номінативній шкалі. Тут і надалі приклади статистичних розрахунків ґрунтуються на обстеженні пацієнтів із порушеннями ритму серця, що перебували на стаціонарному або амбулаторному лікуванні у Чернівецькому обласному клінічному кардіологічному центрі. Вивчається розподіл за статтю пацієнтів з різними нозологіями (екстрасистолії високих градацій, фібриляція передсердь, пароксизмальні тахікардії, порушення провідності, що включали синоатріальну, атріовентрикулярну блокади та синдром слабкості синусового вузла). Оскільки не можливо дані нозології впорядкувати від «найбільшої» до «найменшої», для статистичного аналізу даних розглядаємо дані як такі, що подані в номінативній шкалі.
Дані представлені в Таблиці 1 у вигляді n (%).
Чоловіки | Жінки | |
---|---|---|
Екстрасистолії високих градацій | 84 (52,5) | 76 (47,5) |
Фібриляція передсердь | 44 (55,0) | 36 (45,0) |
Пароксизмальні тахікардії | 26 (53,1) | 23 (46,9) |
Порушення провідності | 12 (52,2) | 11 (47,8) |
Для порівняння розподілу хворих за статтю в групах відносно нозологій, застосовуємо критерій Пірсона, оскільки вибірки незалежні, груп для порівняння більше двох, в кожній комірці таблиці числа більше, ніж 10. Отримаємо значення критерію , . Отже, розподіл пацієнтів за статтю в групах з різними нозологіями достовірно не відрізняється.
Порядкова шкала
Порядкова шкала – шкала, що класифікує за принципом «більше-менше». В порядковій шкалі повинно бути не менше трьох класів. На відміну від номінативної шкали, в порядковій шкалі можна ранжувати елементи від найбільшого до найменшого. Проте, на відміну від інтервальної шкали та шкали відношень, в порядковій шкалі не можна вважати різницю між двома рівнями такою ж, як різниця між двома іншими рівнями. Наприклад, якщо розглядається шкала задоволеності, то неможна вважати однаковою різницю між «повністю задоволений» і «частково задоволений» та між «частково задоволений» і «частково незадоволений» [8].
Для опису даних в порядковій шкалі аналогічно до номінативної шкали використовують кількості та відсотки. Статистичний аналіз порядкових шкал проводять за допомогою непараметричних методів. Для порівняння незалежних вибірок використовують критерій Манна-Уїтні або критерій Розенбаума, а для порівняння залежних вибірок - критерій Уілкоксона або критерій знаків. Для порівняння трьох і більше рівнів певної ознаки використовують критерій Краскала-Уолліса. Для визначення узгодженості змін ознак застосовують рангову кореляцію Спірмена.
Розглянемо приклад даних, поданих в порядковій шкалі. Вивчається розподіл хворих за статтю за рівнем алекситимії. За результатами проведеного дослідження із використанням Торонтської шкали алекситимії визначають три рівні – відсутність алекситимії, тенденція (проміжне значення) та наявність алекситимії. Оскільки в наявності три класи, які можна ранжувати від найменшого (відсутня алекситимія) до найбільшого (наявна алекситимія), статистичний аналіз даних проводимо як аналіз даних, поданих у порядковій шкалі.
Результати дослідження наведені в таблиці 2 у вигляді n (%).
Чоловіки | Жінки | |
---|---|---|
Відсутність | 48 (49,5) | 49 (50,5) |
Тенденція | 90 (63,4) | 52 (36,6) |
Алекситимія | 68 (60,7) | 44 (39,3) |
Для порівняння груп проставимо ранги для рівнів алекситимії: відсутність – 1, тенденція – 2, алекситимія – 3 та використаємо критерій Манна-Уїтні. Отримаємо висновок про відсутність різниці між рівнями алекситимії у пацієнтів різної статі (p>0,05).
Інтервальна шкала
Інтервальна шкала – це шкала, за якою кожне з можливих значень ознаки знаходиться на однаковій відстані від іншого значення [9]. Недоліком інтервальних шкал є те, що вони не мають справжньої нульової точки, навіть якщо одне із масштабованих значень має назву "нуль". Прикладом інтервальної шкали у психології є рівень інтелекту (IQ). Хоча технічно можливо отримати оцінку 0 на тесті IQ, така оцінка не буде свідчити про повну відсутність IQ. Більше того, якщо людина має показник IQ 140, це не означає, що її рівень інтелекту в два рази вищий за рівень інтелекту людини з IQ 70. Однак, різниця між показниками IQ 80 і 100 така ж, як різниця між показниками IQ 120 і 140 [8].
Опис даних, поданих у інтервальній шкалі представляють за допомогою середнього значення та його похибки або середньоквадратичного відхилення, якщо прийнята гіпотеза про нормальність розподілу випадкової величини, або за допомогою медіани та міжквартільного інтервалу в противному випадку. Детальніше способи перевірки розподілу на нормальність описані в нашій попередній роботі [11]. Статистичний аналіз інтервальних шкал проводять за допомогою параметричних або непараметричних критеріїв в залежності від розподілу випадкової величини. Якщо прийнята гіпотеза про нормальний розподіл вибірок, то для їх порівняння використовують критерій Стьюдента (парний для залежних вибірок і непарний для незалежних). Якщо необхідно порівняти три та більше рівнів певної ознаки, проводять дисперсійний аналіз Фішера. Для визначення узгодженості змін ознак застосовують кореляційний аналіз Пірсона. Якщо розподіл хоча б однієї з досліджуваних вибірок відрізняється від нормального, використовують непараметричні методи аналогічно до порядкових шкал.
Розглянемо приклад даних, поданих в інтервальній шкалі. Аналогічно попередньому прикладу вивчаємо розподіл хворих за статтю за рівнем алекситимії . Проте в даному випадку для дослідження беремо не рівень алекситимії (відсутність-тенденція-алекитимія), а бали, отримані за Торонтською шкалою алекситимії. Оскільки ми не можемо сказати, що, наприклад, хворий з кількістю балів 80 має в два рази більший рівень алекситимії, ніж хворий з кількістю балів 40, вважаємо, що дані представлені у інтервальній шкалі.
Результати дослідження наведені в таблиці 3 у вигляді Mm, оскільки обидві вибірки розподілені нормально.
Алекситимія | |
---|---|
Чоловіки (n=206) | 69,010,67 |
Жінки (n=145) | 67,481,10 |
Для порівняння вибірок застосуємо непарний критерій Стьюдента. Робимо висновок про відсутність різниці рівня алекситимії у хворих різної статі (р=0,219).
Шкала рівних відносин
Шкала рівних відносинмає всі властивості номінативної, порядкової та інтервальної шкал. Як і номінативна шкала, вона надає назву або категорію для кожного об’єкта (цифри служать мітками). Як і в порядковій шкалі, об’єкти упорядковані (з точки зору впорядкування чисел). Як і в інтервальній шкалі, однакова різниця в двох місцях шкали має однакове значення. Основною відмінністю шкали рівних відносин є наявність справжньої нульової точки [8]. Класичним прикладом різниці між інтервальною шкалою та шкалою рівних відносин є температурна шкала. Температура за Кельвіном має абсолютний нуль, і можна сказати, що температура 100оК в два рази більша за температуру 50оК. Температура за Цельсієм не має абсолютного нуля, і тому не можна сказати, що температура 100оС в два рази більша за температуру 50оС. Прикладом шкали рівних відносин у психології є шкала порогів абсолютної чутливості. Слід зауважити, що в психології шкала рівних відносин зустрічається рідко, оскільки можливості людської психіки настільки великі, що важко знайти вимірювану психологічну змінну, що має абсолютний нуль [9].
Статистичний аналіз шкал рівних відносин проводять аналогічно до аналізу інтервальних шкал.
Розглянемо приклад даних, поданих у шкалі рівних відносин. Вивчається розподіл нозологій за віком. Вік – одна з небагатьох змінних, що вивчаються в психології, яка подається у шкалі рівних відносин, оскільки вона має абсолютний нуль, а про людину віком 50 років можна сказати, що вона в два рази старша за людину віком 25 років.
Результати дослідження наведені в таблиці 4 у вигляді Me(IQR), оскільки розподіл вибірок відмінний від нормального.
Вік | |
---|---|
Екстрасистолія високих градацій (n=123) | 49 (24) |
Фібриляція передсердь (n=120) | 65,5 (11,25) |
Пароксизмальні тахікардії (n=49) | 44 (23) |
порушення провідності (n=22) | 62,5 (15) |
Для порівняння віку в чотирьох групах застосуємо непараметричний критерій Краскела-Уолліса. Робимо висновок про наявність різниці групових середніх (p<0,001).
Відмінності між шкалами та статистичні методи, що застосовуються для їх аналізу, узагальнені в таблиці 5.
Шкала | Мітки категорій | Порядок ранжування | Рівні інтервали | Істинний нуль | Описова статистика | Статистичний аналіз | ||||
---|---|---|---|---|---|---|---|---|---|---|
Нормальний розподіл | Розподіл відрізняється від нормального | Нормальний розподіл | Розподіл відрізняється від нормального | |||||||
Залежні вибірки | Незалежні вибірки | Залежні вибірки | Незалежні вибірки | |||||||
Номінативна | + | n (%) | тест МакНемара відносний ризик | χ2 Пірсона (n≥10) точний критерій Фішера (n<10)відношення шансів | ||||||
Порядкова | + | + | n (%) | критерій Манна-Уїтні критерій Розенбаума | критерій Уілкоксона критерій знаків рангова кореляція Спірмена критерій Краскала-Уолліса | |||||
Інтервальна | + | + | + | M±m M±SD | Me (IQR) | парний критерій Стьюдента | непарний критерій Стьюдента кореляція Пірсона дисперсійний аналіз Фішера | критерій Манна-Уїтні критерій Розенбаума | критерій Уілкоксона критерій знаків рангова кореляція Спірмена критерій Краскала-Уолліса | |
Відношень | + | + | + | + | M±mM±SD | Me (IQR) | парний критерій Стьюдента | непарний критерій Стьюдента кореляція Пірсона дисперсійний аналіз Фішера | критерій Манна-Уїтні критерій Розенбаума | критерій Уілкоксона критерій знаків рангова кореляція Спірмена критерій Краскала-Уолліса |
Висновок
Вибір методу статистичного аналізу результатів психологічного дослідження залежить від типу шкали, в якій вимірювалися дані. Коректне застосування статистичного аналізу є запорукою отримання достовірних результатів медико-психологічного дослідження.
Посилання
- Gagne T, Lapalme J, McQueen DV Multidisciplinarity in health promotion: a bibliometric analysis of current research Health Promotion International. 2017:1–12. https://doi.org/ 10.1093/heapro/dax002 https://pubmed.ncbi.nlm.nih.gov/28334790/
- Barthel R, Seidl R Interdisciplinary Collaboration between Natural and Social Sciences – Status and Trends Exemplified in Groundwater Research. PLoS ONE. 2017; 12(1): e0170754. https://doi.org/10.1371/journal.pone.0170754 https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0170754
- Johnson BT, Acabchuk RL What Are the Keys to a Longer, Happier Life? Answers from Five Decades of Health Psychology Research Soc Sci Med. 2018 Jan; 196: 218–226. https://doi.org/ 10.1016/j.socscimed.2017.11.001 https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6894515/
- Chaban OS, Khaustova OO. Psychosomatic comorbidity and quality of life in elderly patients. NeuroNEWS. 2016; 1(2):8-12. URL: https://neuronews.com.ua/uploads/issues/2016/2-1/803578556.pdf
- Turynina OL. Metodolohiia ta metody psykholohichnoho doslidzhennia. Kyiv: Personal; 2018. 206. http://maup.com.ua/assets/files/lib/book/metod_psih_dosl.pdf
- Styvens SS, editor. Matematyka, yzmerenye y psykhofyzyka. Eksperymentalnaia psykholohyia. М; 1960: 19–89.
- Odynochkyna EV. Uchebno-metodycheskyi kompleks po uchebnoi dystsyplyne «Metody psykholohycheskoho yssledovanyia». Gomel; 2019. 152. https://elib.bsu.by/handle/123456789/213940
- Jhangiani RS., Chiang IA., Cuttler C., Leighton D. Research Methods in Psychology, 4th Edition. Kwantlen Polytechnic University. 2019. 432 p. https://kpu.pressbooks.pub/psychmethods4e/
- Sydorenko EV. Metody matematycheskoi obrabotky v psykholohyy, SPb: Rech; 2001. 350 с. http://umo.edu.ua/images/content/aspirantura/zabezp_discipl/sidorenko.pdf
- Ivanchuk MA., Malyk IV., Knihnitska TV., Lukashiv TO. Statystychnyi analiz vidnosnykh velychyn v medytsyni. Klinichna ta eksperymentalna patolohiia. 2019;4 (70);109-114 http://cep.bsmu.edu.ua/article/view/1727-4338.XVIII.4.70.2019.18 https://doi.org/10.24061/1727-4338.XVIII.4.70.2019.18
- Ivanchuk MA., Ivanchuk PR. Normalnyi zakon rozpodilu v medychnykh doslidzhenniakh. Medychna informatyka ta inzheneriia. 2013 (1):48-52 https://doi.org/10.11603/mie.1996-1960.2013.1.419