|
La palabra test procede del latín
"testa" que quiere decir prueba, de alli su amplia difusión
como término que identifica las herramientas y los procedimientos
de evaluación. Es el instrumento utilizado para poner a prueba o
de manifiesto determinadas capacidades o cualidades o características
de un individuo. No tiene otra misión que la de medir. (A.P. Teleña)
"El uso de los test nació debido
a la necesidad de adquirir instrumentos de apreciación objetiva de
diferentes facultades individuales." (E. Planchard)
Pero a cualquier instrumento de medida (test)
hay que exigirle una serie de características, que se reflejan en
el concepto de autenticidad científica.
Validez
¿Para qué es válido
un test? ¿Para quién es válido un test? Un test es
válido cuando responde a estas preguntas y cuando mide lo que realmente
se propone. "Es el grado en el cual el test mide aquello que quiere
medir ". (J. Litwin - G. Férnandez) Un test es válido
cuando demuestra que mide aquello que se presuponía o se pretendía
que midiese.
La validez de un test no está en
función de si mismo, sino de la aplicación que va a realizarse
de él. Por ello los procedimientos existentes para determinar la
validez de un test, se basan en establecer la relación de sus resultados
y otros hechos que podamos observar y que estén en relación
directa con el tipo de capacidad que intentamos evaluar.
La validación de un test se realiza
mediante la aplicación o realización de su "coeficiente
de validez", a través de la realización de la correlación
entre las dos series de resultados, el del test y el de la prueba de comprobación.
Un alto coeficiente de correlación en la validez de un test nos permitirá,
predecir un tipo de conducta o capacidad partiendo exclusivamente de la
aplicación del test. La correlación (r) es la correspondencia
más o menos importante entre dos valores, basada en un conjunto de
cálculos de aplicación estadística.
Se estima que si los coeficientes de correlación presentan los
siguientes valores de r pueden interpretarse como:
- Menos de 0.69, la r es baja o dudosa
- 0.70 a 0.74, la r es moderada o débil
- 0.75 a 0.84, la r es aceptable o buena
- 0.85 a 0.94, la r es alta o muy buena
- 0.95 a 0.99, la r es excelente
Una r de 1 es perfecta, y significa que las dos variables medidas se
corresponden en sus valores y variaciones en forma absoluta. (M. Grosser
- H. Barrow)
Podemos distinguir distintos tipos de validez:
La validez de contenido o lógica
se expresa cuando el test representa el mejor criterio para evaluar la capacidad
en estudio y se basa en el análisis de los items que integran la
prueba, su grado de dificultad, su estabilidad para medir lo pretendido
y la relación con el objetivo de la evaluación. La medición
precisa de una capacidad motora exige el más completo aislamiento
de las otras capacidades, lo que evidentemente no siempre resulta fácil.
La validez predictiva, está
en relación con el grado de probabilidad que presenta un test para
predecir cual será un resultado futuro de un individuo en relación
a una determinada conducta o capacidad. Normalmente este tipo de comprobación
nos lleva mucho tiempo ya que es necesario una serie amplia de medidas.
La validez referida a los criterios o
empírica, puede realizarse correlacionando los valores del test
con los de otro test reconocido como ya válido (prueba paralela)
o correlacionando los valores del test con un criterio exterior, como una
competencia.
La validación factorial se
utiliza para la comparación entre test. Si la correlación
es alta, ambos test tienen una alta correspondencia, y si la correlación
es baja o nula, cada test mide un aspecto diferente.
Para que los contenidos de un test motor sean válidos es necesario
que:
- Los ejercicios sean familiares a los alumnos.
- La técnica de ejecución sea dominada.
- Los contenidos sean de uso o práctica habitual.
- Sean estables a través de las edades.
- Midan capacidades motoras importantes y útiles.
- No sean excesivos cuantitativa ni cualitativamente. (A.P. Teleña)
Confiabilidad (Fiabilidad)
 Se refiere al hecho
de la precisión de la medida, independientemente de los aspectos
que se pretenden medir. Es la capacidad de un test para demostrar estabilidad
y consistencia en sus resultados. Un test es confiable cuando al aplicarlo
dos o más veces a un individuo, en circunstancias similares obtenemos
resultados análogos o similares. La confiabilidad debe controlar
la distorsión o variación que diversos factores producen al
aplicarlo, alguno de ellos pueden ser:
- El clima
- La hora del día
- Las instalaciones
- El equipo de medición
- El estado de ánimo del evaluado.
Para calcular la confiabilidad de un test podemos aplicar el procedimiento
de "test-retest", donde la misma prueba es aplicada a un grupo,
en dos oportunidades, luego de un corto intervalo, y el coeficiente de correlación
obtenido nos demuestra la seguridad y precisión del test. (Coeficiente
de confiabilidad)
Objetividad
Una prueba de evaluación (test) es
objetiva cuando sus resultados son independientes de la actitud o apreciación
personal del observador. Es el grado de uniformidad con que varios individuos
pueden aplicar un mismo test. Para ello se buscan instrumentos precisos,
tiempo - cronómetro, distancia - cinta métrica, etc. La objetividad
garantiza la confiabilidad de un test.
La objetividad debe observarse en:
- Objetividad de realización, en la construcción,
aplicación, explicación, descripción e instrucciones
del test.
- Objetividad de evaluación, puede ser métrica (sistema
internacional de medidas) o calificadora (evaluación subjetiva)
- Objetividad de interpretación, los grados de valoración
del rendimiento obtenidos en las pruebas dependen también si la
prueba es en si misma objetiva o cuando incide más el margen de
interpretación, o sea en las pruebas subjetivas.
Cuando al menos 2 evaluadores utilizan el mismo test con el mismo grupo
y en intervalos reducidos, podemos calcular el coeficiente de correlación
de objetividad. El test será objetivo si los resultados obtenidos
por ambos evaluadores son análogos, mostrando una r significativa.
Estos criterios de calidad principales para
la aplicación de un test (validez, confiabilidad y objetividad)
se acompañan de una serie de criterios secundarios, pero de gran
importancia para su aplicación práctica. (M. Grosser)
Normalización
Consiste en la transformación del
valor del test (intangible) en una ubicación con relación
a una norma. Esto lleva a la realización de escalas de medida, que
se elaboran a través de estudios estadísticos poblacionales,
con el objetivo de la confección de las normas.
Estandarización
Para que sea válida la comparación
de resultados recogidos sobre diferentes grupos, o sobre el mismo grupo
en períodos diferentes, es necesario uniformizar (estandarizar) las
técnicas de administración de los test. Una pequeña
variación en las normas de realización de una prueba puede
alterar el resultado y su valoración posterior.
Economización
Se considerará una prueba económica
aquella que es realizable en poco tiempo, que precisa poco material y aparatos,
que es fácil de manejar y que puede ser interpretada fácilmente
sin muchos cálculos.
Utilidad
Se considera útil un test que analiza
una conducta o capacidad para cuyo conocimiento hay una necesidad práctica
y un auténtico interés de conocimiento.
Probabilidad
El test debe poder ser realizado con éxito
por el 90% de los alumnos, que hayan seguido regularmente el proceso de
aprendizaje. (A.P. Teleña)
BIBLIOGRAFIA SUGERIDA
- Evaluación y estadísticas aplicadas a la educación
física y el deporte, Julio Litwin y Gonzalo Fernández, Stadium,
Argentina.
-
- Evaluación en la Educación Física y los deportes,
Augusto Pila Teleña, Ed. A.P. Teleña.
- Teoría y práctica de la evaluación de las actividades
físicas y deportivas, Bernard Macario, Lidium.
- Evaluar en educación física, Domingo Blazquez Sánchez,
INDE.
- La evaluación en la Educación Física, Roberto
Velazques Buendìa, Revistas de Pedagogía.
- Test de la Condición Física, Herbert Haag y col., Hispano
Europea.
- Test deportivo motores, Friedrich Fetz y col., Kapeluz.
- Valutazione delle capacitá motorie, Enzo Betazzi, CONI.
- Test de la Condición física, Manfred Grosser, Martinez
Roca.
- Test y pruebas físicas, James D. George y col., Paidotribo.
- La evaluación en educación física y deportes,
Claude Pineau, Stadium.
- Avaliacao & Prescripcao de atividade física, Joao C. Bouzas
Marins y col., Shape.
- Testes em Ciencias do esporte, Victor Matsudo, CELAFICS.
- Measurement in Physical Education, Donald Mathews, Saunders
Recopilación: Prof. Gabriel Molnar |
|