Evaluación Criterial y Normativa

Todas las propuestas de definición de evaluación ponen una observación central en la noción de criterio. Un criterio es un "principio al que nos referimos, y que nos permite distinguir lo verdadero de lo falso.", o más precisamente "es una característica o una propiedad de un sujeto u objeto, de acuerdo al cual formulamos sobre él un juicio de apreciación". (G. De Landsheere).

Esto significa que un criterio nos permite referirnos a una acción o comportamiento, comparativamente en relación a otro, que enuncia las reglas del primero y autoriza su evaluación.

En forma recíproca evaluar equivale a determinar criterios con el objetivo de discriminar la información. Por ello los criterios nos permitirán la obtención de información (índices), dirigidas hacia aquello que queremos evaluar. Los índices son la materialización y objetivación explícita de los criterios.

Según J.M. De Ketele, existen 4 momentos en los referente a la acción coherente entre la recolección de información y los criterios enunciados.

· Establecer claramente el objetivo de la evaluación.

· Determinar el criterio o los criterios relacionados al objetivo.

· Confrontar los criterios seleccionados previamente con las informaciones recogidas en la evaluación.

· Formular conclusiones para la toma de decisiones.

Las informaciones obtenidas pertenecen al sujeto u objeto evaluado; el criterio es externo, es aquello que determina que información (índices) hay que observar, extraer o recolectar.

Los criterios que definen los logros pueden ser cualitativos o cuantitativos. Un criterio cualitativo se expresa en función del "todo o nada", el logro es o no es, no hay grados, mientras que los cuantitativos aceptan una gradualización o expresión de porcentaje. (B. Maccario) Cuanto mayor es la complejidad de los proceso cognitivos, afectivos y psicomotores de la tarea a ser evaluada, más difícil será la definición de los criterios. Sumado a esto que muchas veces existen normas o criterios preimpuestos. (G. De Landsheere).

Evaluación Normativa

Evaluar en referencia a una norma, significa comparar el resultado del individuo con los resultados de una población o grupo a los que pertenece.

Esto exige el establecimiento de una norma o escala de referencia, confeccionada después de estudios estadísticos de rendimiento, con el objetivo de obtener una calificación. En este ámbito normativo, el criterio es externo, en la medida que se utiliza una escala que es mas o menos "ajena" al sujeto evaluado, sin tener en cuenta las condiciones de trabajo, nivel inicial, aprendizaje, etc. (B. Maccario) Por esta razón este tipo de evaluación se utiliza para ubicar a los alumnos en escalas de rendimiento y puntaje, atribuir un lugar dentro de los grupos, certificar los niveles en función de la norma o el grupo y predecir futuros resultados.

Evaluación Criterial

Evaluar en referencia a un criterio, busca la comparación del alumno con sus propios rendimientos o resultados, en las mismas pruebas o en relación a un criterio fijado de antemano.

Se valora principalmente el progreso realizado por el alumno, independientemente de escalas y se valora el proceso realizado por el alumno hacia el objetivo propuesto. En el ámbito criterial se evalúa el avance del alumno hacia el objetivo propuesto y la distancia que lo separa de él. Esta distancia constituye las bases de la información a partir de la cual se ha de tomar una decisión. Esto nos aproxima a una "pedagogía por objetivos", donde existe una necesidad de expresar los objetivos en términos operativos (el alumno será capaz de ... ), luego de haber analizado las necesidades y posibilidades del alumno o grupo.

"El docente deberá determinar el nivel mínimo deseable de las aptitudes que deben adquirir todos los alumnos ... y la evaluación de los resultados; con relación a los objetivos por alcanzar y a partir de la situación inicial; reunirá la noción de evolución y la participación de el o los alumnos." (B. Maccario)

Las funciones que cumple este tipo de evaluación son: establecer un balance con los objetivos propuestos, realizar un diagnóstico de las dificultades y determinar si la estrategia es o no pertinente. Estos conceptos nos remiten a los fundamentos de la evaluación formativa.

"Para ayudar al alumno importa más enseñarle hasta donde lo han conducido sus esfuerzos en el proceso de aprendizaje, que el lugar que ocupa con relación a sus compañeros o una escala." (G. De Landsheere). Desde este punto de vista el criterio es interno, en la medida que no es ajeno al alumno.

Las "herramientas" de evaluación deben ser generales y flexibles, para permitir su variación en función de la situación a resolver y los diversos aspectos del alumno a partir del alumno mismo.

Recopilación: Prof. Gabriel Molnar

Evaluación del Alumno y del Docente

¿Qué evaluamos?

El alumno no es el único implicado en el acto de evaluar, por ello la respuesta a esta pregunta depende de la función que le atribuimos a la evaluación.

La evaluación del alumno

Todos los objetivos educativos, pueden, con más o menos facilidad, con más o menos éxito, ser evaluados.

El ámbito cognitivo, la adquisición de conocimientos, de habilidades y las aptitudes intelectuales: el saber y el saber hacer.
El ámbito afectivo, el desarrollo de actitudes en relación al contenido pedagógico, con relación al grupo: el saber ser, ver, sentir y reaccionar.
El ámbito psicomotriz, en el enriquecimiento de las conductas motoras: las habilidades motoras.
El ámbito social, en el relacionamiento permanente en todos los niveles: cooperar y competir.

"Esta clasificación analítica, aunque artificial, nos permite ver los efectos del proceso educativo. Por ello el objetivo de la evaluación es hacer aparecer esos efectos, volverlos transparentes, en forma indirecta, por medio de una metodología adecuada" (B. Maccario)

La evaluación del docente

"En el papel mediador de la acción pedagógica, el docente no es neutro, ya que se compromete por entero en la situación pedagógica, con lo que cree, con lo que dice, con lo que hace, con lo que es. Según el tono que adopta, la mirada que emite, el gesto que realiza, su mensaje adquiere un valor específico, para el conjunto de los alumnos y una resonancia especial para alguno de ellos ... " (M. Postic)

El docente debe efectuar su evaluación en las siguientes áreas:

Estudio de sus características personales (aptitudes, motivaciones, hábitos, conocimientos)
Observación de sus comportamientos (rasgos de conducta y relacionamiento social)
Estudio de los efectos del proceso educativo seleccionado sobre los alumnos. (B. Maccario)

El docente debe evaluar su "estrategia pedagógica", entendida "como la ciencia y/o arte de combinar y coordinar acciones para alcanzar un objetivo.

Corresponde a una planificación para llegar a un resultado proponiendo objetivos que se quieren lograr y los medios que se disponen para lograrlos." (G. Mialaret)

La noción de estrategia, más que la de método, destaca la interdependencia entre la elección de los medios y las fases previas de formulación de los objetivos, de identificación de las características de los alumnos, del análisis de los recursos y de las dificultades. (P. Brunswing - G. Berger )

Para ello es necesario cuestionarnos acerca de:

La coherencia entre los objetivos y el resultado.
La adaptación de los objetivos a las posibilidades de cada alumno.
Si las exigencias están adaptadas a los intereses del alumno.
Si las situaciones de aprendizaje y su presentación tienen relación con las actividades a desarrollar.
Si la relación entre los recursos y las dificultades es explotada al máximo.
Si el comportamiento del docente (nosotros) fue el adecuado.

"Actuar conscientemente es saber a donde se quiere ir, es tener preparada su acción, es saber si se han alcanzado los objetivos, es, aun más, cuestionar y reajustar su acción teniendo en cuenta la distancia entre los resultados esperados y los resultados posibles." (L. D. D'Hainaut)

Recopilación: Prof. Gabriel Molnar

Requesitos de un Test

La palabra test procede del latín "testa" que quiere decir prueba, de alli su amplia difusión como término que identifica las herramientas y los procedimientos de evaluación. Es el instrumento utilizado para poner a prueba o de manifiesto determinadas capacidades o cualidades o características de un individuo. No tiene otra misión que la de medir. (A.P. Teleña)

"El uso de los test nació debido a la necesidad de adquirir instrumentos de apreciación objetiva de diferentes facultades individuales." (E. Planchard)

Pero a cualquier instrumento de medida (test) hay que exigirle una serie de características, que se reflejan en el concepto de autenticidad científica.

Validez

¿Para qué es válido un test? ¿Para quién es válido un test? Un test es válido cuando responde a estas preguntas y cuando mide lo que realmente se propone. "Es el grado en el cual el test mide aquello que quiere medir ". (J. Litwin - G. Férnandez) Un test es válido cuando demuestra que mide aquello que se presuponía o se pretendía que midiese.

La validez de un test no está en función de si mismo, sino de la aplicación que va a realizarse de él. Por ello los procedimientos existentes para determinar la validez de un test, se basan en establecer la relación de sus resultados y otros hechos que podamos observar y que estén en relación directa con el tipo de capacidad que intentamos evaluar.

La validación de un test se realiza mediante la aplicación o realización de su "coeficiente de validez", a través de la realización de la correlación entre las dos series de resultados, el del test y el de la prueba de comprobación. Un alto coeficiente de correlación en la validez de un test nos permitirá, predecir un tipo de conducta o capacidad partiendo exclusivamente de la aplicación del test. La correlación (r) es la correspondencia más o menos importante entre dos valores, basada en un conjunto de cálculos de aplicación estadística.

Se estima que si los coeficientes de correlación presentan los siguientes valores de r pueden interpretarse como:

Menos de 0.69, la r es baja o dudosa
0.70 a 0.74, la r es moderada o débil
0.75 a 0.84, la r es aceptable o buena
0.85 a 0.94, la r es alta o muy buena
0.95 a 0.99, la r es excelente

Una r de 1 es perfecta, y significa que las dos variables medidas se corresponden en sus valores y variaciones en forma absoluta. (M. Grosser - H. Barrow)

Podemos distinguir distintos tipos de validez:

La validez de contenido o lógica se expresa cuando el test representa el mejor criterio para evaluar la capacidad en estudio y se basa en el análisis de los items que integran la prueba, su grado de dificultad, su estabilidad para medir lo pretendido y la relación con el objetivo de la evaluación. La medición precisa de una capacidad motora exige el más completo aislamiento de las otras capacidades, lo que evidentemente no siempre resulta fácil.

La validez predictiva, está en relación con el grado de probabilidad que presenta un test para predecir cual será un resultado futuro de un individuo en relación a una determinada conducta o capacidad. Normalmente este tipo de comprobación nos lleva mucho tiempo ya que es necesario una serie amplia de medidas.

La validez referida a los criterios o empírica, puede realizarse correlacionando los valores del test con los de otro test reconocido como ya válido (prueba paralela) o correlacionando los valores del test con un criterio exterior, como una competencia.

La validación factorial se utiliza para la comparación entre test. Si la correlación es alta, ambos test tienen una alta correspondencia, y si la correlación es baja o nula, cada test mide un aspecto diferente.

Para que los contenidos de un test motor sean válidos es necesario que:

Los ejercicios sean familiares a los alumnos.
La técnica de ejecución sea dominada.
Los contenidos sean de uso o práctica habitual.
Sean estables a través de las edades.
Midan capacidades motoras importantes y útiles.
No sean excesivos cuantitativa ni cualitativamente. (A.P. Teleña)

Confiabilidad (Fiabilidad)

Se refiere al hecho de la precisión de la medida, independientemente de los aspectos que se pretenden medir. Es la capacidad de un test para demostrar estabilidad y consistencia en sus resultados. Un test es confiable cuando al aplicarlo dos o más veces a un individuo, en circunstancias similares obtenemos resultados análogos o similares. La confiabilidad debe controlar la distorsión o variación que diversos factores producen al aplicarlo, alguno de ellos pueden ser:

El clima
La hora del día
Las instalaciones
El equipo de medición
El estado de ánimo del evaluado.

Para calcular la confiabilidad de un test podemos aplicar el procedimiento de "test-retest", donde la misma prueba es aplicada a un grupo, en dos oportunidades, luego de un corto intervalo, y el coeficiente de correlación obtenido nos demuestra la seguridad y precisión del test. (Coeficiente de confiabilidad)

Objetividad

Una prueba de evaluación (test) es objetiva cuando sus resultados son independientes de la actitud o apreciación personal del observador. Es el grado de uniformidad con que varios individuos pueden aplicar un mismo test. Para ello se buscan instrumentos precisos, tiempo - cronómetro, distancia - cinta métrica, etc. La objetividad garantiza la confiabilidad de un test.

La objetividad debe observarse en:

Objetividad de realización, en la construcción, aplicación, explicación, descripción e instrucciones del test.
Objetividad de evaluación, puede ser métrica (sistema internacional de medidas) o calificadora (evaluación subjetiva)
Objetividad de interpretación, los grados de valoración del rendimiento obtenidos en las pruebas dependen también si la prueba es en si misma objetiva o cuando incide más el margen de interpretación, o sea en las pruebas subjetivas.

Cuando al menos 2 evaluadores utilizan el mismo test con el mismo grupo y en intervalos reducidos, podemos calcular el coeficiente de correlación de objetividad. El test será objetivo si los resultados obtenidos por ambos evaluadores son análogos, mostrando una r significativa.

Estos criterios de calidad principales para la aplicación de un test (validez, confiabilidad y objetividad) se acompañan de una serie de criterios secundarios, pero de gran importancia para su aplicación práctica. (M. Grosser)

Normalización

Consiste en la transformación del valor del test (intangible) en una ubicación con relación a una norma. Esto lleva a la realización de escalas de medida, que se elaboran a través de estudios estadísticos poblacionales, con el objetivo de la confección de las normas.

Estandarización

Para que sea válida la comparación de resultados recogidos sobre diferentes grupos, o sobre el mismo grupo en períodos diferentes, es necesario uniformizar (estandarizar) las técnicas de administración de los test. Una pequeña variación en las normas de realización de una prueba puede alterar el resultado y su valoración posterior.

Economización

Se considerará una prueba económica aquella que es realizable en poco tiempo, que precisa poco material y aparatos, que es fácil de manejar y que puede ser interpretada fácilmente sin muchos cálculos.

Utilidad

Se considera útil un test que analiza una conducta o capacidad para cuyo conocimiento hay una necesidad práctica y un auténtico interés de conocimiento.

Probabilidad

El test debe poder ser realizado con éxito por el 90% de los alumnos, que hayan seguido regularmente el proceso de aprendizaje. (A.P. Teleña)

BIBLIOGRAFIA SUGERIDA

Evaluación y estadísticas aplicadas a la educación física y el deporte, Julio Litwin y Gonzalo Fernández, Stadium, Argentina.

Evaluación en la Educación Física y los deportes, Augusto Pila Teleña, Ed. A.P. Teleña.
Teoría y práctica de la evaluación de las actividades físicas y deportivas, Bernard Macario, Lidium.
Evaluar en educación física, Domingo Blazquez Sánchez, INDE.
La evaluación en la Educación Física, Roberto Velazques Buendìa, Revistas de Pedagogía.
Test de la Condición Física, Herbert Haag y col., Hispano Europea.
Test deportivo motores, Friedrich Fetz y col., Kapeluz.
Valutazione delle capacitá motorie, Enzo Betazzi, CONI.
Test de la Condición física, Manfred Grosser, Martinez Roca.
Test y pruebas físicas, James D. George y col., Paidotribo.
La evaluación en educación física y deportes, Claude Pineau, Stadium.
Avaliacao & Prescripcao de atividade física, Joao C. Bouzas Marins y col., Shape.
Testes em Ciencias do esporte, Victor Matsudo, CELAFICS.
Measurement in Physical Education, Donald Mathews, Saunders

Recopilación: Prof. Gabriel Molnar