10 ejemplos de validez concurrente
La validez concurrente es un tipo de medida de validez en la investigación en ciencias sociales. Ofrece una forma de establecer la validez de una prueba comparándola con otra prueba similar que se sabe que es válida. Si las dos pruebas se correlacionan, se cree que el nuevo estudio también es válido.
El término “concurrente” significa 'simultáneo'. Tanto la nueva prueba como la prueba validada se realizan al mismo tiempoo 'al mismo tiempo'.
El grado de validez concurrente está determinado por la correlación entre las puntuaciones de la nueva prueba y la prueba establecida.
Cuanto más fuerte sea la correlación, mejor será la validez concurrente. El valor de la correlación debe estar entre 0 y 1; cuanto más cerca de 1, mejor.
¿Por qué realizar una prueba de validez concurrente?
Hay dos razones para realizar una prueba de validez concurrente. El primero es asegurarse de que su medida esté midiendo el constructo que cree que está midiendo.
La segunda es reemplazar la prueba original.
Si la nueva prueba tiene una excelente validez concurrente con una prueba de criterio ya aceptada, entonces puede usarse como sustituto.
Por ejemplo, si la prueba concurrente es más corta, más simple o menos costosa que la prueba de criterio, entonces puede ser beneficioso usarla en su lugar.
La validez concurrente es un subtipo de validez de criterio.
Ejemplos de validez concurrente
1. Calificaciones de los estudiantes sobre autoestima y juicios de los maestros
Resumen: La antigua prueba de autoestima de los estudiantes requería la participación del maestro. El nuevo solo requiere la participación de los estudiantes, lo que le ahorrará tiempo al maestro. Para ver si esta prueba nueva y más simple es válida, los investigadores realizan ambas pruebas a la vez y ven si los resultados de la nueva prueba se correlacionan con los resultados de la prueba anterior. Si es así, la prueba anterior se puede descartar y la nueva se convierte en la norma. Tiene validez concurrente.
Un investigador quiere establecer la validez concurrente de una escala de autoestima para 8el calificadores En investigaciones anteriores, la mayoría de los estudios piden a los profesores que califiquen el nivel de autoestima de sus alumnos. Esto se considera una práctica aceptable y se considera una evaluación válida.
Sin embargo, los maestros tardan mucho tiempo en proporcionar estas calificaciones y muchos maestros se muestran reacios debido a sus horarios increíblemente ocupados. Por lo tanto, puede ser valioso desarrollar una prueba para que los estudiantes la tomen ellos mismos.
Por lo tanto, el investigador dedica un tiempo considerable a escribir preguntas que sean apropiadas para la edad y completas. Ahora está listo para administrar su escala de autoestima a los estudiantes y pedir respetuosamente a sus maestros que también proporcionen calificaciones.
Cuando se recopilan las calificaciones, ingresa los datos en SPSS y calcula la correlación entre las dos medidas. Los resultados muestran una correlación de .89. Esto significa que su nueva escala tiene una fuerte validez concurrente.
2. Simulación de trabajo y competencia de enfermería
Resumen: La forma antigua de evaluar la competencia de enfermería era preguntarle al supervisor de enfermería. Se establece un nuevo método que involucra a profesionales externos experimentados que observarán a las enfermeras en el trabajo en lugar de depender de la información del supervisor. Las dos pruebas se realizan simultáneamente, pero los resultados muestran que el supervisor y los expertos externos llegan a conclusiones diferentes sobre la competencia de las enfermeras. Se encuentra que la prueba carece de validez concurrente.
Hinton et al. (2017) realizaron un interesante estudio de validez concurrente con enfermeras.
Primero, cada enfermera participó en varios escenarios médicos simulados con maniquíes en un laboratorio muy realista. Su desempeño fue observado y calificado por profesionales más experimentados.
Para evaluar la validez concurrente, las puntuaciones de la simulación se correlacionaron con las valoraciones de los supervisores sobre el desempeño de las enfermeras en el trabajo.
Desafortunadamente, las puntuaciones en los escenarios simulados “…no estaban bien correlacionados con las encuestas de autoevaluación y evaluación del supervisor” (pág. 455).
Esto indica que la prueba simulada no tiene validez concurrente con las calificaciones de los supervisores sobre el desempeño laboral de las enfermeras. A veces, los resultados de un estudio son decepcionantes y no respaldan los objetivos de los investigadores.
3. Prueba y calificaciones de biología
Resumen: Se crea una nueva prueba de biología. Una vez que se administra la prueba, los investigadores comparan los resultados de la prueba con los GPA actuales de los estudiantes en las clases de biología. Si los GPA de biología se correlacionan con los resultados de esta prueba, se establece la validez concurrente.
Un investigador ha desarrollado una prueba integral de conocimiento en biología. El objetivo es tener una forma eficiente de evaluar el conocimiento de los estudiantes, que luego se puede utilizar para identificar áreas en el plan de estudios que necesitan mejoras.
Entonces, la prueba se administra a todos los recién graduados del programa de biología en la universidad. Al mismo tiempo, también se obtienen los promedios académicos de dichos egresados. Al calcular la correlación entre la prueba y el GPA, se puede evaluar la validez concurrente.
Cuanto más cercana sea la correlación a 1, más fuerte será la validez concurrente. Sin embargo, si la correlación es cercana a 0, entonces la prueba no tiene validez concurrente.
4. Liderazgo observado y calificaciones en el trabajo
Resumen: Para establecer la validez de una prueba de aptitud de liderazgo, una empresa compara los resultados de la prueba con las evaluaciones de los supervisores de los participantes de la investigación.
Debido a que una empresa puede tardar varios años en identificar cuáles de sus empleados tienen potencial de liderazgo, el departamento de recursos humanos está interesado en encontrar un método más rápido y eficiente.
Desarrollan un conjunto de actividades experienciales que simulan diversos escenarios laborales que involucran habilidades de liderazgo. Un grupo de empleados seleccionados al azar participa en los escenarios y sus rasgos de liderazgo son evaluados por observadores capacitados.
Luego, el departamento de recursos humanos compara las calificaciones de su desempeño en las actividades experienciales con su potencial de liderazgo según la calificación de su supervisor. Los resultados revelan una correlación de .45, lo que indica una asociación moderadamente fuerte entre las dos medidas. Por lo tanto, el departamento de recursos humanos concluye que los escenarios simulados tienen una validez concurrente aceptable con las calificaciones de los supervisores.
5. Programación Talento
Resumen: Se crea un desafío de programación informática para los solicitantes de empleo. Para ver si es válido, la empresa consigue que el personal actual haga el desafío y compara los resultados con las evaluaciones de los supervisores sobre el desempeño de cada miembro del personal.
Una empresa de ciberseguridad acaba de obtener un contrato muy grande que durará años. Entonces, la empresa necesitará contratar aproximadamente 150 programadores.
Dado que entrevistar a cientos de solicitantes es ineficiente y potencialmente muy impreciso, desarrollan una serie de desafíos de programación que imitan los tipos de tareas requeridas en el contrato.
Para determinar si los desafíos de programación ayudarán a identificar buenos programadores, realizan una evaluación de validez concurrente.
Primero, todos los programadores existentes de la compañía intentan los desafíos. Su desempeño se califica objetivamente y luego se compara con las evaluaciones anuales de desempeño de los supervisores.
Si los puntajes de los desafíos están altamente correlacionados con las evaluaciones de los supervisores, entonces la empresa puede ahorrar mucho tiempo y dinero al pedirles a los solicitantes de empleo que tomen los desafíos de programación en línea. Los que aprueben serán contactados para una entrevista.
6. Neuroimagen y Ansiedad
Resumen: Se crea una escala de ansiedad autoadministrada. Para ver si es válido, los investigadores escanean la amígdala de cada participante de la investigación. Las personas con puntajes altos de ansiedad en el examen escrito también deberían tener la amígdala más activa, lo que indica que la prueba, de hecho, evalúa el nivel de ansiedad de una persona.
El cerebro es una estructura bastante asombrosa. No es muy grande, pero seguro que hace mucho. La investigación que utiliza neuroimagen ha revelado que un área del cerebro, la amígdala, está relacionada con la ansiedad.
Para las personas que sufren de ansiedad, a veces la amígdala es demasiado reactiva. Tiene una respuesta exagerada a situaciones que pueden crear sentimientos de ansiedad.
En lugar de confiar en pruebas de neuroimagen costosas y que consumen mucho tiempo, sería mejor desarrollar una medida de ansiedad breve y simple con papel y lápiz.
Para lograr este objetivo, los investigadores podrían usar una escala de ansiedad existente, administrarla a una muestra de participantes y también realizar un análisis de neuroimagen de su amígdala.
Si las puntuaciones de la escala se correlacionan con los niveles de actividad de la amígdala, entonces la escala tiene una buena validez convergente. Esto significa que, en algunas situaciones, la escala se puede utilizar en lugar del costoso análisis de neuroimagen.
7. Pruebas de movilidad para adultos mayores
Resumen: Se construye una nueva prueba de movilidad para adultos mayores. Para garantizar que sea válido, los resultados de esta prueba se comparan con otra prueba de movilidad más establecida que sabemos que es válida.
Desafortunadamente, uno de los inconvenientes de envejecer es perder movilidad. Nos pasa a todos. Sin embargo, los trabajadores de la salud necesitan un método preciso y objetivo para evaluar la movilidad. Si solo le pide a una persona que se califique a sí misma, es posible que se dé una calificación más alta de la que se merece.
Según Weber et al. (2018), muchas pruebas actualmente en uso tienen el defecto fundamental de ser demasiado fáciles. Eso significa que mucha gente obtiene una puntuación muy alta.
“Esto hace que las pruebas de equilibrio y movilidad actualmente disponibles sean menos adecuadas cuando el objetivo es determinar la elegibilidad de la intervención destinada a prevenir la disminución del equilibrio y la movilidad en una etapa temprana”. (Weber et al., 2018, pág. 2).
Entonces, Weber y sus colegas decidieron desarrollar una prueba de movilidad más desafiante. Realizaron un estudio que involucró a adultos mayores que tomaron varias pruebas de movilidad diferentes. Los puntajes en todas esas pruebas luego se correlacionaron entre sí.
Los resultados indicaron que la prueba de Weber se correlacionó con las otras pruebas, pero también fue más desafiante. Por lo tanto, la prueba de Weber tiene validez concurrente y es mejor para evaluar un rango más amplio de movilidad que otras pruebas.
8. Rendimiento del curso de conducción para conductores de autobús
Resumen: Cuando se desarrolla una prueba de manejo de RV, se debe establecer la validez concurrente comparando los resultados de la prueba de RV con los resultados de la prueba de manejo de la vida real. Si las personas que realizaron ambas pruebas obtienen la misma puntuación en cada prueba, entonces hemos establecido la validez concurrente.
Una gran ciudad ha decidido que necesita mejorar su proceso de contratación para identificar mejor a los conductores que serán seguros y cautelosos. Entonces, contratan a una empresa de TI para diseñar una simulación de realidad virtual de un curso de manejo desafiante.
La simulación parece muy realista y contiene muchos escenarios potencialmente peligrosos que ocurren en toda la ciudad, incluidos caminos helados, peatones y conductores descuidados.
El programa califica automáticamente el desempeño en la simulación, por lo que la evaluación es objetiva y estandarizada.
Luego, la compañía requiere que todos sus conductores actuales tomen la prueba de simulación. Luego, los puntajes de la prueba se comparan con los registros de seguridad reales de los conductores que se encuentran en sus archivos personales.
En este ejemplo, los datos de las pruebas de simulación se recopilan al mismo tiempo que los datos de los archivos de personal para evaluar la validez concurrente. Si los puntajes de conducción y los registros de seguridad reales están altamente correlacionados, entonces la prueba de realidad virtual tiene validez concurrente.
9. La prueba de situaciones extrañas de Ainsworth
Resumen: Se crea una nueva prueba de estilos de apego que es más fácil que la prueba de situaciones extrañas de Ainsworth. Para asegurarse de que sea válido, las personas que hicieron la prueba de situaciones extrañas de Ainsworth también hacen la nueva prueba en papel. Si los resultados se correlacionan, de ahora en adelante podemos hacer la prueba más fácil y no molestarnos con la más larga.
La prueba de situaciones extrañas es una serie de 8 situaciones que involucran a un padre (generalmente la madre) y al niño. Al observar el comportamiento del niño en cada situación, los observadores capacitados identifican el estilo de apego del niño.
La prueba es algo artificial, requiere observadores ampliamente capacitados, y el cuidador y el niño deben viajar al laboratorio de pruebas, lo que puede llevar mucho tiempo y ser inconveniente.
¿No sería mejor si hubiera una manera más fácil de evaluar el apego del niño? Afortunadamente, Deneault et al. (2020) han estado desarrollando el Escalas de calificación de apego preescolar (PARAS). El PARS es una medida de papel y lápiz del estilo de apego de un niño que es mucho más fácil de usar y calificar.
Para determinar la idoneidad del uso de la escala como herramienta de evaluación sustituta, sería necesario administrarla a los cuidadores casi al mismo tiempo que participaban en la prueba de situaciones extrañas. Si el PARS tiene validez concurrente, entonces las puntuaciones en ambas evaluaciones deberían estar altamente correlacionadas.
10. Implantes de zapatos con monitor de actividad física
Resumen: Para ver si funciona un nuevo contador de pasos implantado en un zapato, una empresa de calzado hace que los participantes de la investigación usen los zapatos de conteo de pasos y un reloj de conteo de pasos simultáneamente. Luego, miran los dos resultados separados para ver si se correlacionan.
Una empresa de calzado quiere desarrollar un rastreador de actividad física en sus zapatos. En lugar de que las personas tengan que amarrarse el teléfono al brazo cuando salen a correr todos los días, todo lo que tienen que hacer es presionar un botón en su zapato.
La empresa de calzado contrata a tres empresas tecnológicas para desarrollar los implantes. Luego, el rastreador de cada compañía se implanta en diferentes zapatos. Luego, los sujetos de prueba son reclutados para correr en una cinta rodante durante 5 minutos mientras usan los zapatos con los implantes. Al mismo tiempo, un observador utiliza un contador digital para contar el número de zancadas.
Luego, los datos de los rastreadores se comparan con las cuentas de los contadores digitales; se calcula una correlación para determinar la validez concurrente.
Conclusión
La validez concurrente implica administrar dos pruebas al mismo tiempo. Cuanto mayor sea la correlación entre la prueba n.º 1 y la prueba n.º 2, la prueba de criterio, mejor. Esto significa que la prueba 1 tiene validez concurrente y puede utilizarse como sustituto del criterio.
Esto es deseable si el método habitual de evaluar el criterio es defectuoso, requiere mucho tiempo o es costoso.
Por ejemplo, desarrollar una medida de ansiedad con papel y lápiz puede ser una mejor opción que realizar un costoso análisis de neuroimagen. Usar un curso de manejo basado en VR puede ser más realista y preciso que un curso de manejo en un estacionamiento.
Hay muchas formas de evaluar la validez de una prueba, la validez concurrente es solo una. Idealmente, durante un período de tiempo, una prueba se someterá a muchos tipos de pruebas de validez.
Referencias
Ainsworth, MDS y Bell, SM (1970). Apego, exploración y separación: ilustrado por el comportamiento de niños de un año en una situación extraña. Desarrollo infantil, 4149-67.
Cohen, RJ y Swerdlik, ME (2005). Pruebas y evaluación psicológicas: una introducción a las pruebas y la medición (6ª ed.). Nueva York: McGraw-Hill.
Deneault, AA, Bureau, JF, Yurkowski, K. y Moss, E. (2020). Validación de la Escalas de calificación de apego preescolar con díadas hijo-madre e hijo-padre. Apego y Desarrollo Humano, 22(5), 491–513. https://doi.org/10.1080/14616734.2019.1589546
Drevets, W. (2001). Estudios de neuroimagen y neuropatológicos de la depresión: implicaciones para las características cognitivo-emocionales de los trastornos del estado de ánimo. Opinión actual en neurobiología, 11(2), 240-249. https://doi.org/10.1016/S0959-4388(00)00203-8
Hinton, J., Mays, M., Hagler, D., Randolph, P., Brooks, R., DeFalco, N., Kastenbaum, B. y Miller, K. (2017). Prueba de competencia de enfermería: validez y confiabilidad del perfil de desempeño de enfermería. Revista de Medición de Enfermería, 25(3), 431. https://doi.org/10.1891/1061-3749.25.3.431
Weber, M., Van Ancum, J., Bergquist, R., Taraldsen, K., Gordt, K., Mikolaizak, AS, Nerz, C., Pijnappels, M., Jonkman, NH, Maier, AB, Helbostad, JL, Vereijken, B., Becker, C. y Schwenk, M. (2018). Validez y confiabilidad concurrente de la escala Community Balance and Mobility en adultos jóvenes-mayores. BMC Geriatría, 18(1), 156. https://doi.org/10.1186/s12877-018-0845-9
Deja una respuesta