Medidas de resultado para pacientes con amputaciones de miembros inferiores

Introducción general( editar | editar fuente )

Las medidas de resultados pueden utilizarse con fines muy diversos. Una medida predictiva debe ser capaz de clasificar a las personas según un conjunto de categorías predefinidas, ya sea de forma concurrente o prospectiva; por ejemplo, si una persona amputada utilizará una prótesis con éxito (1) (2). Detectar diferencias entre personas o grupos demuestra el valor discriminativo de una medida de resultados, por ejemplo, poder determinar las diferentes capacidades de una persona amputada transtibial o transfemoral o las diferencias entre componentes protésicos a partir de las puntuaciones o los tiempos registrados. (3)

Mientras que una medida evaluativa debe ser capaz de detectar cambios, normalmente a lo largo de un periodo de tiempo en un individuo o grupo. Una medida de resultado evaluativa también puede detectar los cambios que se producen tras algún tipo de intervención, por ejemplo, un programa terapéutico(4) o el suministro de un componente protésico. Algunas medidas de resultados están diseñadas para hacer sólo una de las cosas anteriores, mientras que otras pueden hacer una combinación, aunque algunos de los criterios de estos diferentes tipos de medidas de resultados compiten entre sí. (5) Sea cual sea el propósito para el que se diseñe, las propiedades psicométricas de la medida de resultado deben notificarse para que el usuario quede satisfecho de que es adecuada para la población con la que desea utilizarla. (6)

Las propiedades psicométricas de una medida de resultados son las características que expresan su adecuación en términos de fiabilidad, validez y sensibilidad. Otro término utilizado a menudo es el de propiedades clinimétricas. Aunque se desarrolló a partir de orígenes similares a los de la psicometría, la clinimetría se ha descrito como la práctica de evaluar o describir síntomas, signos y hallazgos de laboratorio mediante escalas, índices y otros instrumentos cuantitativos, todos los cuales deben tener propiedades psicométricas adecuadas. (7) (8)

En las fases iniciales de la rehabilitación es importante utilizar medidas de resultados que ayuden a predecir la capacidad que tendrá un paciente para caminar con una prótesis y a determinar qué componentes protésicos serían los mejores para el paciente.(9)

Consideraciones antes de elegir una medida de resultados( editar | editar fuente )

Si estás pensando en utilizar una medida de resultados con una persona amputada, merece la pena que te plantees las preguntas que se plantean en la página de medidas de resultados aquí en la Physiopedia (Guide to Selecting Outcome Measures). Como mínimo, deberías plantearte estas preguntas pensando en tu paciente o grupo de pacientes amputados.

¿Por qué utilizo una medida de resultados?

  • ¿Intento establecer una medida de referencia a partir de la cual pueda controlar los cambios a lo largo del tiempo en un paciente concreto?
  • ¿Intento predecir cómo va a actuar mi paciente?
  • ¿Intento evaluar el impacto de un programa de tratamiento o un componente protésico en un individuo o un grupo?
  • ¿Intento evaluar las necesidades de la persona amputada que acude a mi servicio?
  • ¿Intento evaluar cómo responde mi servicio a las necesidades de la persona amputada?

¿Qué quiero medir?

  • ¿Deterioros de la estructura y función corporales?
  • ¿Limitaciones de actividad?
  • ¿Restricciones de participación?
  • ¿Calidad de vida?
  • ¿Algo más?

Cuando tengas en mente una medida de resultados, también debes considerar estas preguntas.

¿Se han medido las propiedades clinimétricas de la medida de resultados que estoy considerando en una población similar a la mía?

  • ¿Es fiable la medida de resultados?
  1. ¿Conozco el porcentaje de error detectado con las puntuaciones?
  2. ¿Conozco el cambio mínimo detectable?
  • ¿Es válida la medida de resultados?
  1. ¿Mide lo que quiero que mida?
  • ¿Es la medida de resultado sensible al cambio?
  1. ¿Se conoce alguna diferencia mínima clínicamente importante?

He aquí algunos ejemplos de estudios en los que se han descrito las propiedades clinimétricas, a veces llamadas psicométricas, en una población de personas amputadas y lo que los resultados pueden indicarte.

Fiabilidad(edit | edit source)

La fiabilidad suele medirse mediante los coeficientes de correlación intraclase (CCI) y se presenta como un número comprendido entre 0 (ausencia de concordancia) y 1 (concordancia total). (10)
Fiabilidad intra-evaluador: Indica la consistencia con la que un evaluador administra y puntúa una medida de resultado.
Fiabilidad inter-evaluador: Indica hasta qué punto coinciden dos evaluadores en la forma de administrar y puntuar una medida de resultado.
Fiabilidad test-retest: Si una persona completa un cuestionario autoinformado y luego repite el cuestionario en una segunda ocasión en la que no se espera ningún cambio, los resultados deberían ser similares.

  • Brooks, Hunter y col. (2002) examinaron la fiabilidad del test de marcha de 2 minutos (2MWT) (11). Los participantes completaron 2 trayectos cronometrados sucesivos medidos por 2 evaluadores diferentes en 2 días consecutivos. Las correlaciones intraclase (CCI) fueron >0,98, lo que demuestra una excelente fiabilidad intra e inter-examinador.

Error de medición: Se trata del grado en que las puntuaciones o calificaciones son idénticas independientemente de quién realice o puntúe la prueba, y puede notificarse utilizando el error estándar de medida (EEM) o el mínimo cambio detectable (MCD). (12)

  • Deathe & Miller (2005) informaron del EEM en valores absolutos, que fue de 3 seg para el L test (13).
  • Resnik & Borgia (2011) también informaron del MCD en valores absolutos para todas las medidas que estudiaron: test de marcha de 2 minutos (2MWT, por sus siglas en inglés) (34,3m), test de marcha de 6 minutos (6MWT, por sus sigas en inglés) (45m), timed up and go (TUG) (3,6s) y predictor de movilidad del amputado (AMP, por sus siglas en inglés) (3,4pts). (14)

Consistencia interna: Esta propiedad de fiabilidad se reserva para las medidas de resultados diseñadas para evaluar un solo concepto. La consistencia interna evalúa hasta qué punto todos los ítems o preguntas de una medida de resultados abordan el mismo concepto subyacente, por ejemplo, en una escala de movilidad, todos los ítems deberían tratar sobre la movilidad (5).
Existen dos métodos principales para informar sobre la consistencia interna. La teoría clásica de los tests utiliza el alfa de Cronbach (α) para indicar la fiabilidad de una medida de resultados en su conjunto. Y la teoría de respuesta al ítem utiliza el análisis de Rasch para evaluar la consistencia interna observando cada ítem dentro de la medida de resultado. (15).

  • La consistencia interna de la escala ABC se consideró excelente según el alfa de Cronbachs (0,93) en un estudio de Milleret y col. (2003) (16).
  • Se utilizó el análisis de Rasch para examinar todos los ítems de la escala de equilibrio de Berg, lo que confirmó que era capaz de evaluar rango de dificultad e identificar cuatro niveles de habilidad (17).

Validez(edit | edit source)

Validez de contenido: Es el grado en que el contenido de una medida de resultados es un reflejo adecuado del constructo o concepto que se pretende medir (5). Suele considerarse y acordarse por consenso de un grupo de expertos clínicos y puede y debe incluir a representantes de los pacientes. Por ejemplo, un instrumento que mida la limitación de la actividad en jóvenes atletas debería incluir no sólo la marcha, sino también la carrera, el salto y la escalada.

Validez estructural: Se refiere al grado en que las puntuaciones de una medida de resultado son un reflejo adecuado de la dimensión o factor del constructo que se mide. (5) Puede medirse realizando un análisis factorial cuyo resultado demuestre que si >50% de los datos se refieren a un factor, esto confirma que la medida de resultado está midiendo un factor / dimensión. Cualquier cifra inferior indica que se está evaluando más de un factor. El análisis de Rasch también puede utilizarse cuando el resultado mide la unidimensionalidad, es decir, si mide uno o más factores o dimensiones.

  • Wong y col. (2013) informaron de los resultados del análisis factorial realizado en la escala de equilibrio de Berg. Los resultados mostraron que el 70% de los datos se explicaban en el modelo relacionado con una dimensión, es decir, la capacidad de equilibrio (17).
  • Franchignoni y col. (2007) utilizaron el modelo de Rasch en un Locomotor Capability Index modificado para confirmar una buena validez estructural cuando se combinaron las respuestas de las categorías de nivel 1 y 2 y se eliminaron 4 ítems debido a un ajuste excesivo o insuficiente (18). El índice modificado resultante se conoce como LCI-5 y muchos médicos lo utilizan en la actualidad

Validez de constructo: Es el grado en que las puntuaciones de una medida de resultados son coherentes con hipótesis predefinidas (a priori) que esbozan relaciones con las puntuaciones de otros instrumentos, o diferencias entre grupos. Si > 75% de las hipótesis se demuestran, esto indica una buena validez. (19) .
También puede denominarse: Validez concurrente – mostrar la capacidad de distinguir entre grupos (por ejemplo, amputados de miembros inferiores mayores y jóvenes), lo que suele medirse mediante la comprobación de hipótesis, o; Validez convergente – mostrando que las medidas que deberían estar relacionadas lo están, lo que también puede medirse utilizando el coeficiente de correlación intraclase (CCI), valores altos indicando una buena validez.

  • Major y col. (2013) hipotetizaron relaciones positivas entre las puntuaciones de la escala de Berg y la escala Activities-specific Balance Confidence (ABC), la escala de movilidad del Prosthetic Evaluation Questionnaire (PEQ (ms), el Frenchay Activities Index (FAI) y el 2MWT y una relación negativa con el L test (20). Todos ellos fueron probados.
  • Para evaluar la validez concurrente y convergente del L test, Deathe y Miller (2005) pidieron a los sujetos que completaran pruebas de marcha: TUG, prueba de marcha de 10 metros y 2MWT, seguidas de medidas autoinformadas: escala ABC, FAI y PEQ (ms). La validez concurrente fue alta (ICC = 0,86-0,97) entre los datos del L test y las demás pruebas de marcha, y de regular a moderada (ICC = 0,22 – 0,54) para las medidas de autoinforme. Se observaron tiempos medios más altos en los sujetos que:
  1. eran mayores
  2. utilizaron dispositivos de ayuda para la marcha
  3. tenían que concentrarse en cada paso que daban
  4. tenían una amputación por causa vascular y
  5. tenían una amputación transfemoral.

Por lo tanto, se demostró que el L test era capaz de discriminar entre todos los grupos según la hipótesis planteada. (13)

Validez de criterio: Es el grado en que las puntuaciones de una medida de resultados son un reflejo adecuado de una medida de referencia. Sin embargo, hay muy pocas situaciones en la rehabilitación en las que exista una medida de referencia. Si no se dispone de una medida de referencia, puede ser conveniente probar relaciones hipotéticas con medidas de comparación.
La estimación de la validez de criterio depende del tipo de datos. Las correlaciones intraclase se utilizan si ambos instrumentos (instrumento de resultado y comparador) tienen puntuaciones continuas (por ejemplo, tiempo, distancia, etc.) y los resultados deben ser preferiblemente superiores a 0,70. Si el instrumento de resultado tiene una puntuación continua pero el comparador tiene una puntuación dicotómica (por ejemplo, Sí / No), el área bajo la característica operada por el receptor (ROC, por sus siglas en inglés) es el método de preferencia. De nuevo, se sugiere un criterio de 0,70 (19).

  • Gremeauxet y col. (2012) presentaron curvas ROC para el 2MWT. Se utilizó la escala de Houghton modificada para estratificar a los pacientes en dos grupos: los que no tenían problemas de movilidad (puntuación 20/20) y los que tenían una puntuación inferior a 20, lo que indicaba una limitación funcional. Según el análisis ROC, los valores de corte de 130 m o 150 m estaban muy asociados a la existencia de limitaciones funcionales (21).

Sensibilidad(edit | edit source)

La sensibilidad interna es la capacidad de una medida para cambiar a lo largo de un periodo de tiempo determinado. Dependerá de la población concreta que se estudie, del tratamiento o intervención que tenga lugar durante el periodo de tiempo y de la medida de resultado utilizada para determinar cualquier cambio (5).
El tamaño estándar del efecto es la diferencia entre las puntuaciones medias basales y las de seguimiento, dividida por la desviación estándar (DE) basal. Si hay una gran variabilidad en las puntuaciones iniciales en relación con las puntuaciones medias de cambio, el tamaño del efecto será pequeño y la capacidad de la medida de resultado para detectar cambios significativos también será pequeña. Un efecto pequeño será de 0,2, lo que representa un cambio de aproximadamente 1/5 de la DE basal; 0,5 se considera moderado y cualquier efecto superior a 0,8, o un cambio de al menos 4/5 de la DE basal, se considera grande. (22) .
La paired-t-test es una prueba estadística que puede utilizarse para detectar el cambio en las puntuaciones medias en dos momentos, pero depende del tamaño de la muestra y de la variabilidad/fiabilidad de la medida de resultado utilizada(15).
En un estudio de Devlinet y col (2004), el tamaño del efecto calculado para el cambio en las puntuaciones medias de la escala de Houghton, desde el alta hasta el seguimiento, fue de 0,60, lo que indica una diferencia moderada(23).

  • Los hallazgos de Brooks y col. (2001) indicaron que la 2MWT era «sensible a los cambios durante la rehabilitación». Se observaron mejoras significativas en las medias y DE de las distancias caminadas entre el valor basal y el alta y el seguimiento (24). Sin embargo, no se calcularon los tamaños del efecto.

Otras consideraciones( editar | editar fuente )

Otras consideraciones (medidas de resultados) pueden entrar en juego a la hora de decidir qué medida de resultados utilizar:
Consideraciones financieras:

  • ¿Cuál es el coste de esta prueba?
  • ¿Es necesaria una licencia?
  • ¿Se necesita equipamiento?

Aplicación del terapeuta:

  • ¿Es la medida fácil de realizar para un clínico?
  • ¿Se requiere/se dispone de formación especial?
  • ¿Existen instrucciones claras y estandarizadas sobre cómo realizar y puntuar la medida?
  • ¿Cuánto tiempo se tarda en llevar a cabo la medida?
  • ¿Cuánto se tarda en registrar los resultados?

Recursos:

  • ¿Se necesitan equipos o formularios especiales?
  • ¿Hay espacio suficiente para llevar a cabo esta medida?

Paciente:

  • ¿Cuánto tiempo tarda la persona en completarlo?
  • ¿Es difícil la tarea?
  • ¿Es necesaria la privacidad?

Medidas de resultados informadas por el paciente (PROM):

  • ¿Es necesario el contacto cara a cara o puede completarse esta medida en la sala de espera?
  • ¿Abarca el cuestionario cuestiones personales delicadas?
  • ¿Se requiere un nivel de lectura específico?
  • ¿La medida está disponible en otras lenguas?

Lista de medidas de resultados validadas para su uso con personas amputadas de miembros inferiores( editar | editar fuente )

Antes de utilizar una medida de resultados, recuerda tener en cuenta las preguntas anteriores.

Post-amputación(edit | edit source)

  • Predictor de movilidad del amputado sin prótesis (AMPnoPRO, por sus siglas en inglés)
  • Basic Amputee Mobility Score (BAMS) – se trata de una medida de resultados desarrollada recientemente que evalúa cuatro actividades básicas de movilidad de personas que han sufrido amputaciones importantes de miembros inferiores.

Rehabilitación protésica( editar | editar fuente )

Las siguientes medidas de resultados están incluidas en la versión más reciente (2014) de la British Association of Chartered Physiotherapists in Amputee Rehabilitation (BACPAR) Outcome Measures Toolbox.

Personas amputadas con alto nivel de actividad( editar | editar fuente )

Las medidas de resultado enumeradas anteriormente pueden utilizarse con personas amputadas con un alto nivel de actividad, pero debe tenerse en cuenta que pueden observarse efectos techo, es decir, que la persona amputada alcanzará puntuaciones máximas cuando se utilicen escalas ordinales, ya sean observadas o autoinformadas.

Se desarrolló el Comprehensive High-Level Activity Mobility Predictor (CHAMP, por sus siglas en inglés) para evaluar a los pacientes con pérdida de extremidades que necesitan volver a realizar actividades de alto nivel. Se comprobó que esta medida de resultados era segura y fiable con militares heridos en el Centro Médico Walter Reed, con alta nivel de movilidad y amputaciones traumáticas de miembros inferiores. (25)

Período preprotésico y/o postoperatorio inmediato( editar | editar fuente )

Una revisión narrativa fue llevada a cabo por el BACPAR Outcome Measures Project Group, que analiza las pruebas científicas para el uso de medidas de resultados para amputados de miembros inferiores en la fase aguda o preprotésica. La revisión se presentó en la Spring 2014 BACPAR Journal bacpar.csp.org.uk/. Una búsqueda en MEDLINE, CINAHL y PsychINFO en mayo de 2013 utilizando términos de búsqueda como «Acute Care» y «Outcome Measures» con «Lower-limb Amputees» OR «Lower-limb Amputation» dio como resultado un total de 26 artículos que, tras la selección, produjeron dos artículos que merecían una lectura adicional. De estos artículos sólo se identificó la Medida de independencia funcional (MIF) como de interés potencial y se realizó una búsqueda adicional añadiendo el título específico de la MIF. Aunque hay pruebas de que la MIF se utiliza en la fase aguda y/o de rehabilitación temprana con las personas amputadas de miembros inferiores y puede demostrar una mejora entre el ingreso y el alta, las pruebas eran débiles. No hubo pruebas de que la puntuación total de la MIF fuera eficaz como herramienta de predicción, pero en un estudio se observó una buena correlación entre la subescala motora y el resultado protésico.

Cuando se actualizó la «caja de herramientas» en octubre de 2014, se decidió no incluir la MIF ni ninguna otra medidas de resultados específicas en la «caja de herramientas» para esta población, ya que las pruebas actuales no eran lo suficientemente sólidas. Las demás medidas de resultados incluidas en la «caja de herramientas» tenían todas buenas pruebas con tamaños de muestra más grandes. Además, la MIF requiere formación antes de utilizarla y se recomienda como herramienta multidisciplinar, por lo que no se ajusta a los criterios de «fácil de usar».

Recursos(edit | edit source)

Referencias(edit | edit source)

  1. Condie ME, McFadyen AK, Treweek S, Whitehead L. The trans-femoral fitting predictor: a functional measure to predict prosthetic fitting in transfemoral amputees–validity and reliability. Arch Phys Med Rehabil 2011 08;92(8):1293-1297.
  2. Raya M, A., Gailey R, S., Gaunaurd I, A., Ganyard H, Knapp-Wood J, McDonough K, et al. Amputee Mobility Predictor-Bilateral: A performance-based measure of mobility for people with bilateral lower-limb loss. J Rehabil Res Dev 2013 11;50(7):961-968.
  3. Hafner BJ, Willingham LL, Buell NC, Allyn KJ, Smith DG. Evaluation of function, performance, and preference as transfemoral amputees transition from mechanical to microprocessor control of the prosthetic knee. Archives of Physical Medicine & Rehabilitation 2007 02;88(2):207-217.
  4. Rau B, Bonvin F, de Bie R. Short-term effect of physiotherapy rehabilitation on functional performance of lower limb amputees. Prosthet Orthot Int 2007;31(3):258-270.
  5. 5.0 5.1 5.2 5.3 Mokkink LB, Terwee CB, Patrick DL, Alonso J, Stratford PW, Knol DL, et al. The COSMIN study reached international consensus on taxonomy, terminology, and definitions of measurement properties for health-related patient-reported outcomes. J Clin Epidemiol 2010;63(7):737-745.
  6. Kirshner B, Guyatt G. A methodologicalframework for assessing health indices. J Chronic Dis 1985;38(1):27-36.
  7. Streiner DL. Clinimetrics vs. psychometrics: an unnecessary distinction. J Clin Epidemiol 2003 12;56(12):1142-1145.
  8. Galea M. Introducing Clinimetrics. Australian Journal of Physiotherapy 2005;51(3):139-140.
  9. 9.0 9.1 Spaan MH, Vrieling AH, van de Berg P, Dijkstra PU, van Keeken HG. Predicting mobility outcome in lower limb amputees with motor ability tests used in early rehabilitation. Prosthetics and orthotics international. 2017 Apr;41(2):171-7.
  10. Shrout PE(1), Fleiss JL. Intraclass correlations: Uses in assessing rater reliability. Psychol Bull 1979 / 03 / 01 /;86(2):420-428.
  11. Brooks D, Hunter JP, Parsons J, Livsey E, Quirt J, Devlin M. Reliability of the two-minute walk test in individuals with transtibial amputation. Arch Phys Med Rehabil 2002 11;83(11):1562-1565
  12. Stratford P, W., Riddle D, L. When Minimal Detectable Change Exceeds a Diagnostic Test-Based Threshold Change Value for an Outcome Measure: Resolving the Conflict. Phys Ther 2012 10;92(10):1338-1347.
  13. 13.0 13.1 Deathe AB, Miller WC. The L test of functional mobility: measurement properties of a modified version of the timed «up & go» test designed for people with lower-limb amputations. Phys Ther 2005 07;85(7):626-635
  14. Resnik L, Borgia M. Reliability of outcome measures for people with lower-limb amputations: distinguishing true change from statistical error. Phys Ther 2011 04;91(4):555-565.
  15. 15.0 15.1 Streiner DL, Norman GR. Health measurement scales : a practical guide to their development and use / David L. Streiner and Geoffrey R. Norman. : Oxford : Oxford University Press, 2003; 3rd ed; 2003.
  16. Miller WC, Deathe AB, Speechley M. Psychometric properties of the Activities-Specific Balance Confidence Scale among individuals with a lower-limb amputation. Arch Phys Med Rehabil 2003 05;84(5):656-661.
  17. 17.0 17.1 Wong C, Kevin, Chen C, C., Welsh J. Preliminary Assessment of Balance With the Berg Balance Scale in Adults Who Have a Leg Amputation and Dwell in the Community: Rasch Rating Scale Analysis. Phys Ther 2013 11;93(11):1520-1529.
  18. Franchignoni F, Giordano A, Ferriero G, Muñoz S, Orlandini D, Amoresano A. Rasch analysis of the Locomotor Capabilities Index-5 in people with lower limb amputation. Prosthet Orthot Int 2007 12;31(4):394-404.
  19. 19.0 19.1 Terwee CB, Bot SDM, de Boer M,R., van der Windt D,A.W.M., Knol DL, Dekker J, et al. Quality criteria were proposed for measurement properties of health status questionnaires. J Clin Epidemiol 2007 01;60(1):34-42.
  20. Major MJ, Fatone S, Roth EJ. Validity and reliability of the berg balance scale for community-dwelling persons with lower-limb amputation. Arch Phys Med Rehabil 2013 11;94(11):2194-2202.
  21. Gremeaux V, Damak S, Troisgros O, Feki A, Laroche D, Perennou D, et al. Selecting a test for the clinical assessment of balance and walking capacity at the definitive fitting state after unilateral amputation: a comparative study. Prosthet Orthot Int 2012 12;36(4):415-422.
  22. Kazis LE, Anderson JJ, Meenan RF. Effect sizes for interpreting changes in health status. Med Care 1989 / 03 / 01 /;27(3):S178-189.
  23. Devlin M, Pauley T, Head K, Garfinkel S. Houghton Scale of prosthetic use in people with lower-extremity amputations: reliability, validity, and responsiveness to change. Arch Phys Med Rehabil 2004 08;85(8):1339-1344.
  24. Brooks D, Parsons J, Hunter JP, Devlin M, Walker J. The 2-minute walk test as a measure of functional improvement in persons with lower limb amputation. Arch Phys Med Rehabil 2001 10;82(10):1478-1483.
  25. Gailey RS, Gaunaurd IA, Raya MA, Roach KE, Linberg AA, Campbell SM, Jayne DM, Scoville C. Development and reliability testing of the Comprehensive High-Level Activity Mobility Predictor (CHAMP) in male servicemembers with traumatic lower-limb loss. WALTER REED ARMY MEDICAL CENTER WASHINGTON DC; 2013 Jan.


Desarrollo profesional en tu idioma

Únete a nuestra comunidad internacional y participa en cursos online para todos los profesionales de la rehabilitación.

Ver cursos disponibles