15 ejemplos de evaluaciones formales
La evaluación formal es una forma de medir la cantidad de conocimiento que los estudiantes han retenido. Dado que todos los estudiantes toman exactamente la misma forma de prueba, el maestro puede hacer comparaciones entre los estudiantes.
Para los profesores, la evaluación formal da como resultado una puntuación que se registra en el archivo del alumno y se usa como parte de su calificación general del curso (en otras palabras, a menudo también es una evaluación sumativa).
Para escuelas o distritos escolares, las pruebas estandarizadas se administran a todos los estudiantes para que se utilicen con fines comparativos. Los administradores escolares pueden determinar cómo les está yendo a sus estudiantes en comparación con otras escuelas y distritos. Esto les permite identificar sus fortalezas y áreas que necesitan mejorar.
Definición de evaluación formal
Una evaluación formal se puede definir de múltiples maneras. Generalmente, lo definimos en contraste con la evaluación informal.
Por ejemplo, Barker (2004, p. 9) define la evaluación formal e informal así:
"En un evaluación formal se enfatiza algún tipo de estructura. Por lo general, esto ha sido planeado y estudiado cuidadosamente, generalmente a través de la investigación”.
“En un evaluación informal la información se recopila mediante métodos menos estructurados, quizás incluso desordenados”.
Ejemplos de evaluación formal
- Examen universitario de fin de trimestre: Al final de cada término, el maestro de historia administra un examen de opción múltiple y verdadero/falso de 50 elementos.
- Pruebas estandarizadas: Para recibir fondos federales, un distrito escolar administra una prueba estandarizada de rendimiento a todos los estudiantes al final del año académico.
- Pruebas de acceso a la universidad: Las universidades exigen que todos los solicitantes tomen el SAT o Act para que el comité de admisiones pueda determinar cómo se compara su nivel de preparación con el de otros solicitantes.
- Pruebas de acreditación docente: Antes de obtener una licencia de enseñanza, la mayoría de los estados de EE. UU. requieren que los aspirantes a maestros tomen los exámenes de la Serie Praxis.
- Pruebas de admisión a la facultad de derecho: Las facultades de derecho de los EE. UU. requieren que todos los solicitantes tomen el LSAT como parte del proceso de solicitud.
- Examen de registro de posgrado: El Graduate Record Exam (GRE) está diseñado para medir la capacidad de un estudiante para desempeñarse bien en la escuela de posgrado, especialmente en ciencias sociales.
- Pruebas acumulativas: Los estudiantes de un curso de nutrición tienen que analizar el perfil nutricional del almuerzo escolar al final de cada mes como un componente de su calificación general.
- IELTS: El examen IELTS es una prueba formal del idioma inglés que da como resultado puntajes de lectura, escritura y comprensión que son utilizados por gobiernos como Canadá en las evaluaciones de inmigración.
- Inspecciones Sanitarias: Si un inspector de salud llega a un restaurante y verifica su limpieza, la evaluación afectará el resultado de la acreditación del restaurante. Por lo tanto, esta es una evaluación formal.
- Cuestionarios finales: Una maestra de matemáticas les da a sus alumnos un examen rápido todos los lunes. Los puntajes se sumarán y se informarán a los padres al final del período.
Enfoques de la evaluación formal
1. Pruebas adaptativas por computadora (CAT)
El uso de pruebas de papel y lápiz está desapareciendo gradualmente. Debido a los problemas medioambientales relacionados con los residuos y la capacidad de calificar rápidamente los exámenes automáticamente, las pruebas a través de computadoras e Internet se están convirtiendo en algo común.
Una prueba adaptativa por computadora (CAT) agrega una característica adicional. La computadora ajustará la dificultad de las preguntas según el desempeño del examinado en cada elemento.
La respuesta a cada pregunta determina el nivel de dificultad del ítem subsiguiente. Si el examinado responde correctamente, entonces el siguiente elemento es un poco más difícil. Si la persona que realiza el examen responde incorrectamente, el siguiente elemento tendrá un nivel de dificultad igual o inferior.
Este tipo de ajuste en tiempo real hace que la prueba sea más precisa:
“A lo largo de varias décadas, la investigación ha demostrado repetidamente que CAT es más eficiente que las pruebas de papel y lápiz, con una precisión de medición igual o mejor” (Seo, 2017, pág. 8).
2. Evaluación multimétodo
Algunos estudiantes son muy buenos para tomar ciertos tipos de exámenes. Por ejemplo, los estudiantes con altas habilidades verbales son buenos para escribir respuestas cortas y ensayos. Sin embargo, otros estudiantes pueden ser aprendices cinéticos, por lo que desempeñarán mejor sus habilidades o demostrarán su comprensión a través de la acción.
Por lo tanto, los maestros deben implementar procedimientos formales de evaluación que utilicen una variedad de métodos de prueba. El puntaje final de un estudiante en un curso debe estar compuesto por sus puntajes en varios tipos de pruebas.
La puntuación final podría provenir de una evaluación basada en el desempeño, como presentaciones orales o el diseño de infografías. El aprendizaje basado en proyectos podría demostrarse trabajando en equipo para construir un objeto 3D o producir un póster.
Cuando hay múltiples métodos de evaluación formal, le da a cada estudiante la oportunidad de hacerlo bien de acuerdo con sus características únicas.
3. El SAT rediseñado
El College Board, que diseña y administra el SAT, rediseñó la prueba en 2016. La prueba se rediseñó para reflejar mejor el contenido de las escuelas secundarias y los conocimientos y habilidades básicos que son necesarios para tener éxito en el nivel universitario.
Sin embargo, para que la prueba sea útil, debe poseer validez predictiva. Eso significa que los puntajes en la prueba tomada después de graduarse de la escuela secundaria deben estar altamente correlacionados con los GPA de los estudiantes el primer año de universidad (FYGPA).
Un estudio de Westrick et al. (2019) del College Board incluyó 171 universidades y una muestra total de más de 200,000 estudiantes. La información demográfica indicó que la muestra era heterogénea y relativamente representativa de la población general.
Según los investigadores, “Los hallazgos del estudio actual afirman el valor y la efectividad del SAT como una herramienta para que las instituciones la utilicen para informar las decisiones relacionadas con la admisión…” (pág. 20).
Más específicamente, “Los puntajes del SAT predicen fuertemente el rendimiento universitario: los estudiantes con puntajes más altos en el SAT tienen más probabilidades de obtener calificaciones más altas en la universidad” (pág. 20).
4. Pruebas con referencia a normas
Conocer el puntaje de uno en una prueba es más informativo si se puede comparar con otros. Una puntuación aislada revela poca información sobre el nivel de conocimientos o habilidades de la persona que rinde el examen.
Una prueba con referencia a normas es una prueba estandarizada que se aplica a una muestra grande de individuos. Una puntuación en la prueba se puede comparar con el desempeño de otros que tomaron la misma prueba.
Por ejemplo, recibir una puntuación del 83 % puede sonar mediocre. Sin embargo, si el puntaje más alto en la población fue 85%, entonces, de repente, el 85 parece impresionante. Quizás la prueba fue excepcionalmente difícil y nadie pudo lograr una puntuación en los 90.
Para proporcionar información de comparación más exacta, las calificaciones de las pruebas estandarizadas generalmente se informan en términos de percentiles. Además de revelar la puntuación absoluta del examinado, el rendimiento se expresa en términos del porcentaje de personas a las que les fue igual o mejor.
Por ejemplo, un examinado que obtuvo un puntaje de 96el percentil significa que obtuvieron una puntuación igual o mejor que el 96 % de los examinados.
5. Pruebas con referencia a criterios
A veces, los maestros o las agencias de certificación utilizan la evaluación formal para determinar si los examinados han adquirido cierto nivel de conocimiento. Las puntuaciones no se comparan con otras, sino que se comparan con un conjunto de estándares.
Los criterios ya están establecidos y definidos de manera muy específica y precisa. Ellos representan lo que se espera que los examinados sepan o sean capaces de realizar.
Por lo tanto, si una persona que rinde el examen logra un determinado puntaje de corte, entonces aprueba. Esto significa que la persona que rinde el examen puede pasar a la siguiente etapa de estudios académicos o recibir un certificado o licencia.
Las pruebas referidas a criterios también se utilizan en el aprendizaje basado en la competencia, que se refiere a una filosofía de educación basada en que los estudiantes demuestren maestría de conocimientos o habilidades.
A los examinados que alcanzan un cierto nivel de competencia en el dominio designado se les permite progresar académicamente. Sin embargo, si el examinado no logra demostrar el dominio, se le brinda apoyo adicional hasta que pueda alcanzar el nivel de desempeño esperado.
Conclusión
La evaluación formal es una prueba que se utiliza para determinar cuánto ha aprendido un estudiante. En el salón de clases, esto puede involucrar la calificación de un estudiante en un curso que se compone de exámenes de papel y lápiz, tareas de aprendizaje basadas en proyectos o demostraciones de aprendizaje basadas en el desempeño (como en el caso de una evaluación auténtica).
Los distritos escolares usan pruebas estandarizadas para comprender cómo se comparan sus distritos con otros en el estado o la nación. Esto les permite comprender en qué son buenos y las áreas a las que deben apuntar para mejorar.
Las universidades utilizan evaluaciones formales como SAT y GRE para medir la probabilidad de que un solicitante esté preparado para estudios académicos más avanzados.
Referencias
Barker, PJ (2004). Evaluación en enfermería psiquiátrica y de salud mental: en busca de la persona integral. Los Ángeles: Nelson Thornes.
Brookhart, SM (2004). Teoría de la evaluación para las aulas universitarias. Nuevas direcciones para la enseñanza y el aprendizaje, 100, 5-14. https://doi.org/10.1002/tl.165
Seo, DG (2017). Descripción general y gestión actual de las pruebas adaptativas computarizadas en los exámenes de licencia/certificación. Revista de Evaluación Educativa para Profesiones de la Salud, 14. https://doi.org/10.3352/jeehp.2017.14.17
Kane, MT (2006) Validación. En R. Brennan (Ed.), Medición Educativa, 4ª Edición (págs. 17-64). Washington, DC: Consejo Estadounidense de Educación.
Westrick, P. Marini, J., Young, L., Ng, H., Shmueli, D. y Shaw, E. (2019). Validez del SAT® para Predecir Calificaciones de Primer Año y Retención al Segundo Año.
Deja una respuesta