Критерії оцінювання ефективності для пацієнтів з ампутаціями нижніх кінцівок

Загальний вступ( edit | edit source )

Критерії оцінювання ефективності можна використовувати для різних цілей. Прогнозоване оцінювання призначене для класифікації осіб відповідно до набору попередньо визначених категорій одночасно або перспективно, наприклад, чи успішно користуватиметься протезом особа з ампутованими кінцівками. (1) (2) Виявлення відмінностей між особами або групами осіб свідчить про диференційне значення критерію оцінювання, наприклад, можливість визначити різні здібності транстібіальної та трансфеморальної ампутації або відмінності між протезними компонентами на підставі набраних балів або зафіксованого часу. (3)

Однак оціночний показник повинен бути спрямований на виявлення змін зазвичай протягом певного періоду в окремої особи або групи осіб. Оціночний показник результативності може також виявляти зміни, що відбуваються після будь-якого втручання, наприклад, після терапії (4) або забезпечення протезом. Деякі показники результативності призначені для досягнення лише одного з вищезгаданих критеріїв, у той час як інші можуть поєднувати декілька, незважаючи на те, що деякі з вимог до цих різних типів показників результатів є конкуруючими. (5) Незалежно від того, для якої мети він розроблений, психометричні властивості інструменту оцінювання необхідно повідомити, щоб переконати користувача, що він відповідає своєму призначенню для населення, для якого він використовуватиметься. (6)

Психометричні властивості інструменту оцінювання – це характеристики, які виражають його адекватність з точки зору надійності, валідності та чутливості. Також часто використовується інший термін – клініметричні властивості. Клініметрія, хоч і розвивалася з тих самих джерел, що й психометрія, проте описується як практика оцінювання або опису симптомів, проявів та клінічних даних за допомогою шкал, індексів та інших кількісних інструментів, які повинні мати належні психометричні властивості. (7) (8)

На початкових етапах реабілітації важливо використовувати критерії оцінювання, які допомагають передбачити здатність пацієнта ходити з протезом і визначити, які компоненти протеза будуть найкращими для пацієнта.(9)

Міркування щодо вибору критерію оцінювання ефективності ( edit | edit source )

Якщо ви збираєтеся використовувати критерії результативності для пацієнта з ампутованою кінцівкою, вам слід звернутися до питань, викладених на сторінці “Критерії оцінювання ефективності” на сайті Physiopedia (Guide to Selecting Outcome Measures). Принаймні ви повинні розглянути ці питання, орієнтуючись на конкретного пацієнта або групу пацієнтів з ампутованими кінцівками.

Чому я використовую критерій оцінювання ефективності?

 • Чи намагаюся я встановити базовий показник, за яким я можу відстежувати зміни з часом для окремого пацієнта?
 • Чи намагаюся я передбачити, якою буде активність мого пацієнта?
 • Чи намагаюся я оцінити вплив програми терапії або протезного компонента на конкретну особу чи групу осіб?
 • Чи намагаюся я оцінити потреби людини з ампутованою кінцівкою, яка є споживачем моїх послуг?
 • Чи намагаюся я оцінити, наскільки мої послуги відповідають потребам людини з ампутованою кінцівкою?

Що саме я маю намір виміряти?

 • Порушення структури та функції організму?
 • Обмеження активності?
 • Обмеження щодо участі?
 • Якість життя?
 • Щось інше?

Незважаючи на те, що ви можете знати критерій оцінювання ефективності, вам також слід обміркувати наступні питання.

Чи вимірювалися клініметричні властивості показника результативності, який я розглядаю, у популяції, подібної до моєї?

 • Чи надійний критерій оцінювання?
 1. Чи знаю я відсоток помилок, виявлених під час підрахунку балів?
 2. Чи знаю я мінімальну помітну зміну?
 • Чи є критерій оцінювання валідним?
 1. Чи вимірює він те, що я хочу, щоб він вимірював?
 • Чи реагує критерій оцінювання на зміни?
 1. Чи існує відома мінімальна клінічно важлива різниця?

Ось кілька прикладів досліджень, у яких клініметричні, іноді звані психометричними, властивості були виявлені у популяції людей з ампутованими кінцівками, про що вам можуть розповісти отримані результати.

Надійність(edit|edit source)

Надійність зазвичай вимірюється внутрішньокласовими коефіцієнтами кореляції (ВКК) і подається як число від 0 (немає відповідності) до 1 (повна відповідність). (10)
Внутрішньорейтерна надійність: показує, наскільки послідовно експерт застосовує та оцінює показник результативності.
Міжрейтерна надійність: показує, наскільки добре два експерти згодні з тим, як вони застосовують та оцінюють показник результативності.
Тест-ретест надійність: якщо особа заповнює опитування для власного звіту, а потім повторює опитування вдруге, коли не очікується жодних змін, результати мають бути подібними.

 • Brooks, Hunter та ін. (2002) перевірили надійність тесту 2-хвилинної ходьби (2MWT). (11). Учасники виконали 2 послідовні прогулянки з вимірюванням часу, що фіксували два різні оцінювачі 2 дні поспіль. Внутрішньокласові кореляції (ВКК) були >0.98 показуючи чудову внутрішньорейтерну надійність та надійність міжрейтерну.

Помилки у вимірюваннях: це ступінь, до якого бали або рейтинги є ідентичними незалежно від того, хто виконує або оцінює тест, і можуть бути повідомлені за допомогою стандартної помилки вимірювання (СПМ) або мінімальної виявленої зміни (МВЗ), яка є такою ж, як найменша виявлена зміна (НВЗ).(12)

 • Deathe & Miller (2005) повідомили СПМ в абсолютних значеннях, які становили 3 секунди для L-тесту. (13)
 • Resnik & Borgia (2011) також повідомили МВЗ в абсолютних значеннях для всіх показників, які вони досліджували: 2MWT (34,3 м), 6-хвилинний тест ходьби (6MWT) (45 м), “Встань та йди” (TUG) (3,6 с) і прогноз мобільності пацієнтів з ампутацією (AMP) (3,4 бали). (14)

Внутрішня відповідність: ця властивість надійності призначена для критеріїв оцінювання, розроблених для перевірки лише однієї концепції. Внутрішня відповідність оцінює, наскільки всі пункти або питання в системі вимірювання результатів стосуються однієї і тієї ж базової концепції, наприклад, у шкалі мобільності всі пункти мають бути пов’язані з мобільністю. (5)
Є два основні методи, які використовуються для звіту про внутрішню відповідність. Теорія класичного тесту використовує альфа Кронбаха (Cronbachs alpha, α), щоб визначити надійність показника результативності в цілому. Відповідно до теорії “Завдання-Відповідь” (Item Response Theory, IRT) для оцінки внутрішньої відповідності використовується аналіз Rasch, який розглядає кожен елемент у рамках підсумкового показника. (15).

 • Внутрішня відповідність шкали ABC була визнана відмінною, що підтверджується альфа Кронбаха (0,93) у дослідженні Milleret al (2003) (16).
 • Аналіз Rasch використовувався для вивчення всіх пунктів шкали балансу Берга, який підтвердив, що він здатний перевірити діапазон складності та визначити чотири рівні здібностей (17).

Валідність(edit|edit source)

Змістовна валідність: це ступінь, до якого зміст інструмента оцінювання є адекватним відображенням конструкції або концепції, що підлягає вимірюванню (5). Зазвичай розглядається та погоджується на основі згоди експертної групи клініцистів, до якої можуть і повинні входити представники пацієнтів. Наприклад, інструмент для вимірювання обмеження активності у молодих спортивних людей повинен включати не тільки ходьбу, але також біг, стрибки та лазання.

Структурна валідність: стосується ступеня, до якого бали інструменту оцінювання є адекватним відображенням розміру або фактора конструкції, що вимірюється. (5) Її можна виміряти шляхом проведення факторного аналізу, результат якого показує, що > 50 % даних належать до одного фактора, це підтверджує, що критерій оцінювання вимірює один фактор/вимір. Найменше значення вказує на те, що оцінюється більше одного фактора. Rasch-аналіз може також використовуватися у випадках, коли результат вимірює одновимірний показник, тобто вимірює один або кілька факторів чи параметрів.

 • Wong та ін. (2013) повідомили результати факторного аналізу, виконаного за шкалою балансу Берга (BBS). Результати показали, що 70% даних було описано у межах моделі, що належить до одного виміру, тобто здатності до балансу (17).
 • Franchignoni та ін. (2007) використовували Rasch-моделювання для модифікованого індексу рухових здібностей щоб підтвердити хорошу структурну валідність, коли відповіді рівнів 1 і 2 категорій були об’єднані, а 4 пункти були видалені через надмірну або недостатню відповідність. (18). У результаті отримали модифікований індекс відомий як LCI-5, ним зараз користується багато клініцистів.

Конструктивна валідність: це ступінь, у якій результати дослідження відповідають заздалегідь визначеним (апріорним) гіпотезам, які описують взаємозв’язок із результатами інших інструментів чи відмінності між групами. Якщо >75 % гіпотез доведено, це свідчить про гарну валідність (19) .
Вона також може називатися: Конкурентна валідність – демонстрація здатності розрізняти групи (наприклад, літніх та молодих людей з ампутованими нижніми кінцівками), що часто вимірюється шляхом перевірки гіпотез, або: Конвергентна валідність – показує, що показники, які мають бути пов’язані, дійсно пов’язані, що також може бути виміряно за допомогою внутрішньокласового коефіцієнта кореляції (ВКК), високі значення якого вказують на хорошу валідність.

 • Major та ін. (2013) висунули гіпотезу про позитивний зв’язок між показниками за шкалою балансу Берга (BBS) і шкалою впевненості в рівновазі при активності (Activities specific Balance Confidence, ABC), шкалою мобільності анкети оцінки протезів (Prosthetic Evaluation Questionnaire, PEQ (ms), індексом активості Frenchay (FAI) і 2MWT і негативним зв’язком з оцінкою L-тесту (20). Усі ці факти було доведено.
 • Для оцінки конкурентної та конвергентної валідності L-тесту Deathe & Miller (2005) попросили суб’єктів пройти тести на ходьбу: тест “Встань та йди (TUG), 10-метровий тест ходи, 2-х хвилинний тест ходи (2MWT), а потім провели аналіз власних показників – шкала ABC, FAI, PEQ (мс). Конкурентна валідність була високою (ВКК = 0,86-0,97) між даними L-тесту та іншими тестами ходьби та задовільною або помірною (ВКК = 0,22-0,54) для показників за даними самозвіту. Вищий середній час спостерігався для тих суб’єктів, які:
 1. були старші
 2. використовували допоміжні засоби для ходьби
 3. повинні були зосередитися на кожному кроці, який вони робили
 4. мали судинну ампутацію та
 5. мали трансфеморальну ампутацію.

Таким чином, було продемонстровано, що L-тест здатний розрізнити всі групи згідно з гіпотезою. (13)

Валідність за критерієм: це ступінь, до якого бали, отримані під час вимірювання результату, є адекватним відображенням “золотого стандарту”. Однак у реабілітації дуже мало ситуацій, де існує такий золотий стандарт тесту. Якщо золотий стандарт недоступний, можливо доцільно перевірити гіпотетичні взаємозв’язки за допомогою порівняльних показників.
Оцінка валідності за критерієм залежить від типу даних. Внутрішньокласові кореляції використовуються, якщо обидва інструменти (інструмент оцінювання і той, з яким порівнюють) мають безперервні бали (наприклад, час, відстань тощо), а результати бажано перевищують 0,70. Якщо інструмент оцінювання має безперервну шкалу, а інструмент, що порівнюється, має дихотомічну шкалу (наприклад, так / ні), то кращим методом є робоча характеристика приймача (receiver operated characteristic (ROC). Знову ж таки, пропонується критерій 0,70 (19).

 • Gremeauxet al (2012) представили ROC-криві для 2MWT. Модифікована шкала Houghton була використана для розподілу пацієнтів на дві групи: тих, у кого не було проблем з мобільністю (оцінка 20/20), і тих, хто набрав менше 20 балів, що вказує на функціональне обмеження. Згідно ROC-аналізу, значення граничного відхилення 130 м або 150 м були здебільшого пов’язані з наявністю функціональних обмежень. (21).

Чутливість(edit|edit source)

Внутрішня чутливість – це здатність показника змінюватися за певний проміжок часу. Це буде залежати від конкретної досліджуваної популяції, терапії або втручання, які проводяться протягом цього періоду часу, і показника результативності, що використовується для визначення будь-яких змін. (5)
Стандартний показник ефективності – це різниця між середніми вихідними балами і балами після спостереження, поділена на базове стандартне відхилення (SD). Якщо існує велика різниця у вихідних балах по відношенню до середніх показників змін, то ефект буде невеликим, і здатність показника результативності виявити значні зміни також буде невеликою. Невеликий ефект становитиме 0,2, що означає зміну приблизно на 1/5 базового SD, 0,5 вважається помірним, а все, що перевищує 0,8, або зміна принаймні 4/5 базового SD вважається великим. (22) .
Парний t-тест – це статистичний тест, який можна використовувати для виявлення зміни середніх балів у двох точках часу, але він залежить від розміру вибірки та валідності/чутливості обраного інструменту вимірювання результативності.(15).
У дослідженні Devlinet al (2004) розмір ефекту, розрахованого для зміни середніх балів за шкалою Houghton від виписки до подальшого спостереження, становить 0,60, що вказує на помірну різницю.(23).

 • Результати дослідження Brooks et al (2001) показали, що 2MWT “чутливо реагує на зміни під час реабілітації”. Значні покращення спостерігалися в середніх показниках та стандартних відхиленнях (SD) щодо відстані, пройденої пішки, між початковим рівнем, випискою та наступним спостереженням. (24). Однак розмір ефекту не розраховувався.

Інші аспекти( edit | edit source )

При ухваленні рішення про те, який показник результативності використати, можуть з’явитися й інші аспекти (інструменти оцінювання):
Фінансові питання:

 • Яка вартість цього тесту?
 • Чи потрібна ліцензія?
 • Чи потрібне обладнання?

Залучення терапевта

 • Чи легко клінічному фахівцю провести вимірювання?
 • Чи необхідна/можлива спеціальна підготовка?
 • Чи існують чіткі стандартизовані інструкції щодо того, як проводити та оцінювати вимірювання?
 • Скільки часу потрібно на виконання оцінювання?
 • Скільки часу потрібно на реєстрацію результатів?

Ресурси

 • Чи потрібне спеціальне обладнання чи спеціальні форми?
 • Чи достатньо місця для здійснення цього заходу?

Клієнт

 • Скільки часу потрібно людині для завершення роботи?
 • Чи є завдання складним?
 • Чи потрібна конфіденційність?

Результати, про які повідомляють пацієнту (PROQ)

 • Чи потрібен особистий контакт, чи цей захід можна завершити в кімнаті очікування?
 • Чи охоплює анкета делікатні особисті питання?
 • Чи потрібно дотримуватись певних умов щодо оприлюднення результатів?
 • Чи доступний інструмент іншими мовами?

Перелік інструментів оцінювання, валідованих для використання особами з ампутацією нижніх кінцівок( edit | edit source )

Перш ніж використовувати інструмент оцінювання, не забудьте розглянути питання, зазначені вище.

Постампутаційний період(edit|edit source)

Протезна реабілітація ( edit | edit source )

Наступні критерії оцінювання ефективності включені до останньої версії (2014) Інструментарій показників результативності Британської асоціації дипломованих фізичних терапевтів з реабілітації людей з ампутованими кінцівками (BACPAR).

Пацієнти з ампутацією високого рівня активності( edit | edit source )

Наведені вище критерії оцінювання ефективності можуть бути використані при роботі з пацієнтами з ампутованими кінцівками з високим рівнем активності, але слід зазначити, що може спостерігатися ефект граничного значення, тобто пацієнт досягне максимальної кількості балів при використанні порядкових шкал, чи то як результату спостереження, чи то як показнику самостійних вимірювань.

Комплексний прогноз високого рівня активності (Comprehensive High-Level Activity Mobility Predictor, CHAMP) був розроблений для оцінювання пацієнтів із втратою кінцівок, які потребують повернення до високої активності. Цей показник був визнаний безпечним та надійним для поранених військовослужбовців Walter Reed Medical Center з високим рівнем мобільності та травматичними ампутаціями нижніх кінцівок. (25)

Передпротезний та/або безпосередньо післяопераційний період( edit | edit source )

Наративний огляд, проведений групою експертів проєкту BACPAR з критеріїв оцінювання ефективності, присвячений вивченню доказів використання показників результативності для людей з ампутацією нижніх кінцівок (LLA) у гострому чи передпротезному періоді. Огляд було представлено у журналі BACPAR навесні 2014 року bacpar.csp.org.uk/. Пошук у MEDLINE, CINAHL та PsychINFO у травні 2013 року з використанням таких пошукових термінів, як “невідкладна допомога” та “ккритерії оцінювання результатів” разом з “ампутації нижніх кінцівок” АБО “ампутація нижніх кінцівок” дозволив знайти загалом 26 статей, з яких після відбору було визначено дві статті, що заслуговують на подальше вивчення. З цих статей тільки шкала “Оцінювання функціональної незалежності (FIM)” виявилася потенційно цікавою, і подальший пошук був проведений з додаванням конкретної назви FIM. Незважаючи на наявність доказів того, що FIM використовується на етапі гострої та/або ранньої реабілітації пацієнтів з LLA і може продемонструвати покращення стану між госпіталізацією та випискою, ці докази виявилися слабкими. Не було доказів того, що загальний бал FIM ефективний як інструмент прогнозу, але в одному дослідженні було відзначено хорошу кореляцію рухової підшкали з результатами протезування.

При оновленні Інструментарію в жовтні 2014 року було прийнято рішення не включати FIM або будь-який інший специфічний критерій оцінювання в Інструментарій для цієї популяції, оскільки наявні докази недостатньо переконливі. Всі інші інструменти оцінювання, включені до Інструментарію (Toolbox), мають хороші докази при більшому обсязі вибірки. Крім того, FIM вимагає навчання перед початком використання і рекомендується як інструмент MDT, тому не відповідає критерію “простий у використанні”.

Ресурси(edit|edit source)

Посилання(edit|edit source)

 1. Condie ME, McFadyen AK, Treweek S, Whitehead L. The trans-femoral fitting predictor: a functional measure to predict prosthetic fitting in transfemoral amputees–validity and reliability. Arch Phys Med Rehabil 2011 08;92(8):1293-1297.
 2. Raya M, A., Gailey R, S., Gaunaurd I, A., Ganyard H, Knapp-Wood J, McDonough K, et al. Amputee Mobility Predictor-Bilateral: A performance-based measure of mobility for people with bilateral lower-limb loss. J Rehabil Res Dev 2013 11;50(7):961-968.
 3. Hafner BJ, Willingham LL, Buell NC, Allyn KJ, Smith DG. Evaluation of function, performance, and preference as transfemoral amputees transition from mechanical to microprocessor control of the prosthetic knee. Archives of Physical Medicine & Rehabilitation 2007 02;88(2):207-217.
 4. Rau B, Bonvin F, de Bie R. Short-term effect of physiotherapy rehabilitation on functional performance of lower limb amputees. Prosthet Orthot Int 2007;31(3):258-270.
 5. 5.0 5.1 5.2 5.3 Mokkink LB, Terwee CB, Patrick DL, Alonso J, Stratford PW, Knol DL, et al. The COSMIN study reached international consensus on taxonomy, terminology, and definitions of measurement properties for health-related patient-reported outcomes. J Clin Epidemiol 2010;63(7):737-745.
 6. Kirshner B, Guyatt G. A methodologicalframework for assessing health indices. J Chronic Dis 1985;38(1):27-36.
 7. Streiner DL. Clinimetrics vs. psychometrics: an unnecessary distinction. J Clin Epidemiol 2003 12;56(12):1142-1145.
 8. Galea M. Introducing Clinimetrics. Australian Journal of Physiotherapy 2005;51(3):139-140.
 9. 9.0 9.1 Spaan MH, Vrieling AH, van de Berg P, Dijkstra PU, van Keeken HG. Predicting mobility outcome in lower limb amputees with motor ability tests used in early rehabilitation. Prosthetics and orthotics international. 2017 Apr;41(2):171-7.
 10. Shrout PE(1), Fleiss JL. Intraclass correlations: Uses in assessing rater reliability. Psychol Bull 1979 / 03 / 01 /;86(2):420-428.
 11. Brooks D, Hunter JP, Parsons J, Livsey E, Quirt J, Devlin M. Reliability of the two-minute walk test in individuals with transtibial amputation. Arch Phys Med Rehabil 2002 11;83(11):1562-1565
 12. Stratford P, W., Riddle D, L. When Minimal Detectable Change Exceeds a Diagnostic Test-Based Threshold Change Value for an Outcome Measure: Resolving the Conflict. Phys Ther 2012 10;92(10):1338-1347.
 13. 13.0 13.1 Deathe AB, Miller WC. The L test of functional mobility: measurement properties of a modified version of the timed “up & go” test designed for people with lower-limb amputations. Phys Ther 2005 07;85(7):626-635
 14. Resnik L, Borgia M. Reliability of outcome measures for people with lower-limb amputations: distinguishing true change from statistical error. Phys Ther 2011 04;91(4):555-565.
 15. 15.0 15.1 Streiner DL, Norman GR. Health measurement scales : a practical guide to their development and use / David L. Streiner and Geoffrey R. Norman. : Oxford : Oxford University Press, 2003; 3rd ed; 2003.
 16. Miller WC, Deathe AB, Speechley M. Psychometric properties of the Activities-Specific Balance Confidence Scale among individuals with a lower-limb amputation. Arch Phys Med Rehabil 2003 05;84(5):656-661.
 17. 17.0 17.1 Wong C, Kevin, Chen C, C., Welsh J. Preliminary Assessment of Balance With the Berg Balance Scale in Adults Who Have a Leg Amputation and Dwell in the Community: Rasch Rating Scale Analysis. Phys Ther 2013 11;93(11):1520-1529.
 18. Franchignoni F, Giordano A, Ferriero G, Muñoz S, Orlandini D, Amoresano A. Rasch analysis of the Locomotor Capabilities Index-5 in people with lower limb amputation. Prosthet Orthot Int 2007 12;31(4):394-404.
 19. 19.0 19.1 Terwee CB, Bot SDM, de Boer M,R., van der Windt D,A.W.M., Knol DL, Dekker J, et al. Quality criteria were proposed for measurement properties of health status questionnaires. J Clin Epidemiol 2007 01;60(1):34-42.
 20. Major MJ, Fatone S, Roth EJ. Validity and reliability of the berg balance scale for community-dwelling persons with lower-limb amputation. Arch Phys Med Rehabil 2013 11;94(11):2194-2202.
 21. Gremeaux V, Damak S, Troisgros O, Feki A, Laroche D, Perennou D, et al. Selecting a test for the clinical assessment of balance and walking capacity at the definitive fitting state after unilateral amputation: a comparative study. Prosthet Orthot Int 2012 12;36(4):415-422.
 22. Kazis LE, Anderson JJ, Meenan RF. Effect sizes for interpreting changes in health status. Med Care 1989 / 03 / 01 /;27(3):S178-189.
 23. Devlin M, Pauley T, Head K, Garfinkel S. Houghton Scale of prosthetic use in people with lower-extremity amputations: reliability, validity, and responsiveness to change. Arch Phys Med Rehabil 2004 08;85(8):1339-1344.
 24. Brooks D, Parsons J, Hunter JP, Devlin M, Walker J. The 2-minute walk test as a measure of functional improvement in persons with lower limb amputation. Arch Phys Med Rehabil 2001 10;82(10):1478-1483.
 25. Gailey RS, Gaunaurd IA, Raya MA, Roach KE, Linberg AA, Campbell SM, Jayne DM, Scoville C. Development and reliability testing of the Comprehensive High-Level Activity Mobility Predictor (CHAMP) in male servicemembers with traumatic lower-limb loss. WALTER REED ARMY MEDICAL CENTER WASHINGTON DC; 2013 Jan.


Професійний розвиток вашою мовою

Приєднуйтесь до нашої міжнародної спільноти та беріть участь в онлайн курсах для фахівців з реабілітації.

Переглянути доступні курси