9 tipos de validez en la investigación

La validez se refiere a si una prueba o un experimento realmente está haciendo lo que se supone que debe hacer.

La validez se asienta sobre un espectro. Por ejemplo:

  • Baja Validez: La mayoría de la gente ahora sabe que la prueba de coeficiente intelectual estándar en realidad no mide la inteligencia ni predice el éxito en la vida.
  • Alta Validez: Por el contrario, una prueba de embarazo estándar tiene una precisión de aproximadamente el 99%, lo que significa que tiene una validez muy alta y, por lo tanto, es una prueba muy confiable.

Hay muchas maneras de determinar la validez. La mayoría de ellos se definen a continuación.

Índice()

    Tipos de Validez

    1. Validez nominal

    La validez aparente se refiere a si una escala "parece" medir lo que se supone que debe medir. Es decir, haz las preguntas. parece ser relacionado lógicamente con el constructo en estudio.

    Por ejemplo, una escala de personalidad que mide la inteligencia emocional debe tener preguntas sobre la autoconciencia y la empatía. No debe tener preguntas sobre matemáticas o química.

    Una forma común de evaluar la validez aparente es pedirle a un panel de expertos que examine la escala y califique su idoneidad como herramienta para medir el constructo. Si los expertos están de acuerdo en que la escala mide aquello para lo que ha sido diseñada, entonces se dice que la escala tiene validez aparente.

    Si una escala, o una prueba, no tiene validez aparente, entonces las personas que la toman no serán serias.

    Conbach lo explica de la siguiente manera:

    “Cuando un paciente pierde la fe en el medicamento que le receta su médico, éste pierde gran parte de su poder para mejorar su salud. Puede omitir dosis y, al final, decidir que los médicos no pueden ayudarlo y dejar que el tratamiento termine por completo. Por razones similares, cuando se selecciona una prueba, se debe considerar cuán valioso le parecerá al participante que lo toma y a otros profanos que verán los resultados”. (Cronbach, 1970, pág. 182).

    2. Validez del contenido

    La validez de contenido se refiere a si una prueba o escala mide todos los componentes de un constructo dado. Por ejemplo, si hay cinco dimensiones de inteligencia emocional (EQ), entonces una escala que mide EQ debe contener preguntas sobre cada dimensión.

    Al igual que la validez aparente, la validez de contenido se puede evaluar pidiendo a expertos en la materia (SME) que examinen la prueba. Si los expertos están de acuerdo en que la prueba incluye ítems que evalúan cada dominio del constructo, entonces la prueba tiene validez de contenido.

    Por ejemplo, la parte de matemáticas del SAT contiene preguntas que requieren habilidades en muchos tipos de matemáticas: aritmética, álgebra, geometría, cálculo y muchos otros. Dado que hay preguntas que evalúan cada tipo de matemática, entonces la prueba tiene validez de contenido.

    El desarrollador de la prueba podría pedir a las PYME que califiquen la validez de construcción de la prueba. Si todas las PYMES otorgan calificaciones altas a la prueba, entonces tiene validez de constructo.

    3. Validez de constructo

    La validez de construcción es la medida en que una herramienta de medición realmente evalúa aquello para lo que ha sido diseñada.

    Existen dos métodos principales para evaluar la validez de constructo: validez convergente y discriminante.

    La validez convergente implica tomar dos pruebas que se supone que miden el mismo constructo y administrarlas a una muestra de participantes. Cuanto mayor sea la correlación entre las dos pruebas, mayor será la validez de constructo.

    Con validez divergente, se administran dos pruebas que miden constructos completamente diferentes a la misma muestra de participantes. Dado que las pruebas miden diferentes constructos, debería haber una correlación muy baja entre los dos.

    4. Validez Interna

    La validez interna se refiere a si los resultados de un experimento se deben o no a la manipulación de las variables independientes o de tratamiento. Por ejemplo, un investigador quiere examinar cómo la temperatura afecta la voluntad de ayudar, por lo que hace que los participantes de la investigación esperen en una habitación.

    Hay diferentes habitaciones, una tiene la temperatura establecida en normal, una moderadamente cálida y la otra muy cálida.

    Durante la siguiente fase del estudio, se pide a los participantes que donen a una organización benéfica local antes de participar en el resto del estudio. Los resultados mostraron que a medida que aumentaba la temperatura de la habitación, disminuían las donaciones.

    En la superficie, parece que el estudio tiene validez interna: la temperatura ambiente afectó las donaciones. Sin embargo, aunque el experimento involucró tres habitaciones diferentes configuradas a diferentes temperaturas, cada habitación tenía un tamaño diferente. La habitación más pequeña era la más cálida y la habitación con temperatura normal era la más grande.

    Ahora, no sabemos si las donaciones se vieron afectadas por la temperatura o el tamaño de la habitación. Por lo tanto, el estudio tiene una validez interna cuestionable.

    5. Validez externa

    La validez externa se refiere a si los resultados de un estudio se generalizan al mundo real o a otras situaciones. Muchos estudios psicológicos tienen lugar en un laboratorio universitario. Por lo tanto, el escenario no es muy realista.

    Esto crea un gran problema con respecto a la validez externa. ¿Podemos decir que lo que sucede en un laboratorio sería lo mismo que sucedería en el mundo real?

    Por ejemplo, un estudio sobre atención plena involucra al investigador que asigna aleatoriamente a diferentes participantes de la investigación para usar una de las tres aplicaciones de atención plena en sus teléfonos en casa todas las noches durante 3 semanas. Al final de las tres semanas, se mide su nivel de estrés con algunos equipos de EEG de alta tecnología.

    Este estudio tiene validez externa porque los participantes usaron aplicaciones reales y estaban en casa cuando usaban esas aplicaciones. Las aplicaciones y el entorno del hogar son realistas, por lo que el estudio tiene validez externa.

    6. Validez Concurrente

    La validez concurrente es un método para evaluar la validez que implica comparar una prueba nueva con una prueba ya existente o con un criterio ya establecido.

    Por ejemplo, será necesario validar una prueba de matemáticas recientemente desarrollada para el SAT antes de dársela a miles de estudiantes. Por lo tanto, la nueva versión de la prueba se administra a una muestra de estudiantes universitarios de matemáticas junto con la versión anterior de la prueba.

    Las puntuaciones de las dos pruebas se comparan calculando una correlación entre las dos. Cuanto mayor sea la correlación, más fuerte será la validez concurrente de la nueva prueba.

    7. Validez predictiva

    La validez predictiva se refiere a si los puntajes en una prueba están asociados con el desempeño en un criterio dado. Es decir, ¿puede la puntuación de una persona en la prueba predecir su desempeño en el criterio?

    Por ejemplo, una empresa de TI necesita contratar a docenas de programadores para un próximo proyecto. Pero realizar entrevistas con cientos de solicitantes requiere mucho tiempo y no es muy preciso para identificar programadores expertos.

    Entonces, la empresa desarrolla una prueba que contiene problemas de programación similares a las demandas del nuevo proyecto. La empresa evalúa la validez predictiva de la prueba haciendo que sus programadores actuales tomen la prueba y luego comparen sus puntajes con sus evaluaciones de desempeño anuales.

    Los resultados indican que los programadores con notas altas en sus evaluaciones también lo hicieron muy bien en la prueba. Por lo tanto, la prueba tiene validez predictiva.

    Ahora, cuando los nuevos solicitantes toman la prueba, la compañía puede predecir qué tan bien les irá en el trabajo en el futuro. Las personas que obtienen buenos resultados en la prueba de la variable predictora más probable hacerlo bien en el trabajo.

    8. Validez de la conclusión estadística

    La validez de la conclusión estadística se refiere a si las conclusiones extraídas por los autores de un estudio están respaldadas por los procedimientos estadísticos.

    Por ejemplo, ¿el estudio aplicó los análisis estadísticos correctos, se implementaron procedimientos de muestreo adecuados, el estudio utilizó herramientas de medición válidas y confiables?

    Si todas las respuestas a esas preguntas son "sí", entonces el estudio tiene validez de conclusión estadística. Sin embargo, si algunas o todas las respuestas son “no”, entonces se cuestionan las conclusiones del estudio.

    Usar análisis estadísticos incorrectos o basar las conclusiones en tamaños de muestra muy pequeños hace que los resultados sean cuestionables. Si los resultados se basan en procedimientos defectuosos, las conclusiones no pueden aceptarse como válidas.

    9. Validez del criterio

    La validez de criterio a veces se denomina validez predictiva. Se refiere a qué tan bien se asocian los puntajes en un dispositivo de medición con los puntajes en un dominio de desempeño dado (el criterio).

    Por ejemplo, ¿qué tan bien predicen los puntajes del SAT el GPA universitario? O, ¿en qué medida están relacionadas las medidas de confianza del consumidor con la economía?

    Un ejemplo de baja validez de criterio es cómo el desempeño atlético deficiente en el Combinado de la NFL en realidad predice el desempeño en el campo el día del partido. Hay docenas de pruebas por las que pasan los atletas, pero alrededor del 99% de ellas no tienen relación con qué tan bien les va en los juegos.

    Sin embargo, la nutrición y el ejercicio están muy relacionados con la longevidad (el criterio). Estos constructos tienen validez de criterio porque cientos de estudios han identificado que la nutrición y el ejercicio están directamente relacionados con vivir una vida más larga y saludable.

    Conclusión

    Hay tantos tipos de validez porque la precisión de la medición de los conceptos abstractos es difícil de discernir. También puede haber confusión y desacuerdo entre los expertos sobre la definición de constructos y cómo deben medirse.

    Por estas razones, los científicos sociales han dedicado un tiempo considerable a desarrollar una variedad de métodos para evaluar la validez de sus herramientas de medición. A veces, esto revela formas de mejorar las técnicas y, a veces, revela la falacia de tratar de predecir el futuro basándose en procedimientos de evaluación defectuosos.

    Referencias

    Cook, TD y Campbell, DT (1979) Cuasiexperimentación: problemas de diseño y análisis para entornos de campo. Houghton Mifflin, Boston.

    Cohen, RJ y Swerdlik, ME (2005). Pruebas y evaluación psicológicas: una introducción a las pruebas y la medición (6ª ed.). Nueva York: McGraw-Hill.

    Cronbach, LJ (1970). Fundamentos de las pruebas psicológicas. Nueva York: Harper & Row.

    Cronbach, LJ y Meehl, PE (1955) Validez de constructo en pruebas psicológicas. Boletín Psicológico, 52281-302.

    Simms, L. (2007). Métodos Clásicos y Modernos de Construcción de Escalas Psicológicas. Brújula Psicología Social y Personalidad, 2(1), 414 – 433. https://doi.org/10.1111/j.1751-9004.2007.00044.x

    Califica esta Publicación

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

    Subir

    Usamos cookies Política de Cookies