10 ejemplos de validez de constructo (¡y formas de probarlo!)
La validez de constructo es un tipo de validez que analiza si una prueba mide lo que se supone que debe medir.
Las ciencias sociales implican el estudio de muchos fenómenos que no se pueden observar directamente, como la inteligencia emocional y la autoestima. ¡No puedes poner estas construcciones abstractas en una balanza y medir su peso!
Los investigadores deben ser muy creativos en el desarrollo de formas de medir válidamente estos constructos abstractos.
Para medir la validez de constructo, los científicos sociales utilizan tres intentos de pruebas de validez de constructo, que se describen a continuación.
3 tipos de pruebas de validez de constructo
1. Una prueba de validez convergente
Las escalas de calificación de autoestima examinan un constructo que es bastante abstracto: la autoestima. Para determinar la validez de construcción de una escala de calificación de autoestima, puede compararla con otras escalas de calificación de autoestima establecidas para ver si se correlacionan. A esto lo llamamos una prueba de validez convergente.
Construir: Autoestima
Medida de validez de constructo: Prueba de validez convergente
En términos generales, la autoestima se define como si una persona se gusta a sí misma o si siente que es una persona valiosa. Hay muchas escalas de calificación de autoestima disponibles (Rosenberg et al., 1995; Coopersmith, 2002).
Cada escala de calificación de autoestima define la autoestima de forma ligeramente diferente. Sin embargo, la mayoría de las escalas son conceptualmente muy similares.
Establecer la validez de constructo de cualquiera de estas escalas implicaría simplemente administrar la escala de interés (escala de autoestima n.° 1) con una de las otras (escala de autoestima n.° 2). Entonces, el investigador solo necesita calcular una correlación entre las puntuaciones de las dos pruebas.
Si la correlación es cercana a 1, entonces se podría decir que la escala 1 de autoestima tiene validez de constructo. Este tipo de validez de constructo se denomina validez convergente. Se trata de evaluar el grado de similitud entre dos escalas que miden el mismo constructo.
2. Pruebas de validez divergente
También podría determinar la validez de construcción de una escala de calificación de autoestima comparándola con escalas de calificación diferentes para ver si se correlacionan. Aquí queremos ver bajo correlación porque están probando cosas diferentes. A esto lo llamamos una prueba de validez divergente.
Construir: Autoestima
Medida de validez de constructo: Prueba de validez divergente
Para establecer la validez de constructo de una escala de autoestima, un investigador también podría intentar demostrar que no mide lo mismo que una escala que mide un constructo diferente. Este tipo de validez de constructo se conoce como validez divergente.
Para este ejemplo, podríamos comparar una escala de calificación de autoestima con una escala de calificación de introvertido/extrovertido. Con suerte, estas escalas no se correlacionan.
Para realizar esta evaluación simplemente se requiere administrar ambas escalas a la misma población y luego calcular la correlación entre los puntajes en cada escala.
Idealmente, habría una correlación muy baja (cerca de 0) entre los dos porque están midiendo dos constructos teóricamente distintos.
3. Análisis factorial exploratorio (AFE)
El análisis factorial exploratorio (AFE) es un procedimiento estadístico para evaluar las preguntas individuales en una escala de medición. Implica comparar preguntas que miden un componente para ver si todas las respuestas a estas preguntas se correlacionan, lo que demuestra una alta validez de constructo.
Construir: Extraversión
Medida de validez de constructo: Análisis factorial exploratorio
Por ejemplo, si un investigador desea desarrollar una medida de extraversión, comenzaría identificando los componentes teóricos de ese constructo. Pueden ser:
- Amabilidad
- simpatía
- Sociabilidad
- alegría
Dado que el constructo tiene cuatro componentes, la escala debe contener múltiples preguntas que evalúen cada uno de los componentes, quizás 8 preguntas por componente para un total de 32 preguntas.
De las 8 preguntas sobre 'amabilidad', deberíamos ver que los encuestados brindan respuestas similares para las ocho. En este caso, las preguntas tienen un alto grado de relación entre sí y probablemente tengan una alta validez de constructo.
Si la escala tiene una buena validez de constructo, entonces este patrón debería mantenerse para cada componente.
Sin embargo, algunas preguntas pueden no estar tan relacionadas como deberían, lo que significa que no están midiendo lo mismo que las demás. Esto debilita la validez de constructo.
Ejemplos de estudios que establecen la validez de constructo
1. Intención de compra y comportamiento de compra
Podemos determinar la validez del constructo haciendo un seguimiento posterior para ver si las respuestas a un cuestionario se correlacionan con el comportamiento real. Por ejemplo, después de completar un cuestionario indicando que estás interesado en películas, ¿terminaste comprando DVD o yendo al cine?
Construir: Intención de compra
Medida de validez de constructo: Comportamiento posterior del consumidor
Un departamento de marketing quiere poder medir si los consumidores comprarán los productos de su empresa o no. Entonces, desarrollan un cuestionario que hace preguntas como: "¿Planeas comprar este producto?" El personal puede generar un total de 10 preguntas similares.
Para determinar si el cuestionario tiene validez de constructo y realmente evalúa si los consumidores tienen la intención de comprar un producto, realizan una prueba simple. Primero, crean una encuesta en línea que aparece después de que los usuarios de Internet ven un anuncio de video corto de un producto determinado. Luego hacen uso de cookies para conectar a ese usuario con compras con tarjeta de crédito durante las próximas dos semanas.
Al correlacionar las respuestas a la encuesta con los datos de ventas, el departamento de marketing puede evaluar la validez del constructo de su encuesta al demostrar que tiene una alta correlación con el comportamiento de compra real (es decir, un constructo similar).
2. Nueva prueba de aptitud matemática
Al implementar un nuevo examen escolar, se realiza una prueba para comparar los resultados de la prueba del nuevo examen con los resultados de la prueba del examen anterior. Si los estudiantes obtienen resultados similares en cada examen, es probable que el nuevo examen tenga una sólida validez de construcción.
Construir: Aptitud en matemáticas
Medida de validez de constructo: Prueba de validez convergente
El SAT contiene múltiples exámenes de materias, incluida una sección de matemáticas. Es una herramienta de evaluación bien establecida que se ha utilizado durante décadas. Sin embargo, los educadores y las juntas de admisiones universitarias consideran que la última versión de la prueba está desactualizada.
Entonces, los propietarios de la prueba (el College Board) deciden desarrollar una nueva versión de la sección de matemáticas. Después de que un equipo experimentado de maestros y desarrolladores de pruebas diseñen una nueva prueba, evalúan su validez de construcción.
Administran la nueva versión, la versión anterior y la misma sección del ACT a una gran muestra de estudiantes universitarios de matemáticas seleccionados al azar.
La validez de constructo se determina correlacionando las puntuaciones entre las tres pruebas. Si la nueva versión tiene validez de constructo, debería mostrar correlaciones muy altas con las otras dos pruebas de matemáticas. En este ejemplo, validez convergentey se utiliza para establecer la validez de constructo.
3. Autoestima versus amor propio
Para demostrar que dos conceptos similares son, de hecho, diferentes entre sí, puede realizar dos pruebas y explorar la correlación en los resultados. Idealmente, hay una baja correlación que demostrará la divergencia entre los conceptos.
Construcciones: Autoestima y amor propio
Medida de validez de constructo: Prueba de validez divergente
Un terapeuta y practicante de psicología positiva ha ideado una nueva teoría del amor propio que cree que está en el corazón de la depresión y la ansiedad. Su formulación para el crecimiento personal y espiritual implica una profunda autorreflexión y ejercicios de autoafirmación.
Elaboran un cuestionario de personalidad para evaluar el grado de amor propio de una persona. Sin embargo, la construcción del amor propio ha sido criticada por ser demasiado similar a la autoestima. Entonces, deciden realizar un estudio de validez divergente para demostrar que los dos constructos son distintos.
Ambas escalas se distribuyen a una muestra muy grande, seleccionada al azar, de estudiantes universitarios y adultos que trabajan. Los resultados indican que la correlación entre las dos escalas ronda el .29, lo que significa que los dos constructos están relacionados, pero no son idénticos.
4. Dimensiones de las habilidades matemáticas
La validez de constructo de una prueba de matemáticas que explora la aritmética, el álgebra y el cálculo se puede evaluar a través de un análisis factorial exploratorio. Los diseñadores de la prueba seleccionarían todas las preguntas relacionadas con el cálculo y se asegurarían de que los estudiantes tuvieran aproximadamente resultados similares para todas las preguntas de "cálculo", lo que indica que cada pregunta parece estar probando el mismo concepto.
Construcciones: Autoaritmética, Álgebra, Geometría, Cálculo, Estadística
Medida de validez de constructo: Análisis factorial exploratorio
Las matemáticas consisten en aritmética básica, álgebra, geometría, cálculo y estadística y probabilidad, solo por nombrar algunas áreas.
Para desarrollar una prueba de matemáticas integral, se deben evaluar todos los tipos de matemáticas. En aras de la explicación, comencemos con los cinco dominios mencionados anteriormente. Para demostrar que nuestra prueba de matemáticas tiene validez de constructo, generamos 25 preguntas que cubren cada dominio.
Después de administrar la prueba a una gran muestra de estudiantes universitarios de último año seleccionados al azar con especialización en matemáticas, llevamos a cabo un análisis factorial exploratorio (AFE). Si nuestra prueba tiene validez de constructo, entonces todas las preguntas que se supone que evalúan las habilidades de álgebra mostrarán un alto grado de relación entre sí.
Si una o dos preguntas de la parte de álgebra de la prueba no están relacionadas con las otras preguntas, eso nos dice que hay algo mal con esos elementos; están midiendo otra cosa. Cuanto más se relacionan entre sí los ítems de cada dominio, más sólida es la validez del constructo.
5. Rendimiento del curso de conducción para conductores de autobús
Cuando se desarrolla una prueba de manejo de RV, la validez del constructo debe establecerse comparando los resultados de la prueba de RV con los resultados de la prueba de manejo de la vida real. Si las personas que realizaron ambas pruebas obtienen la misma puntuación en cada prueba, entonces hemos establecido la validez de constructo.
Construir: Habilidad de conducir
Medida de validez de constructo: Prueba de validez convergente
Una gran ciudad ha decidido actualizar sus procedimientos de contratación mediante el desarrollo de una versión VR de su prueba de manejo. Anteriormente, a los posibles empleados se les presentaba un sólido desafío de conducción en un gran estacionamiento. El desempeño fue observado por profesionales capacitados y cada solicitante recibió una puntuación en una escala de 0 a 100.
La nueva versión del curso de conducción utiliza un auricular VR y un asiento especial conectado a sensores e hidráulicos para que se mueva y se mueva como un autobús real.
Para establecer la validez de constructo de la nueva prueba de realidad virtual, la empresa de autobuses utiliza un validez convergente metodología. Por lo tanto, a todos los conductores de autobuses actuales se les pide que tomen ambos exámenes de manejo. Los puntajes de cada uno se correlacionan luego usando SPSS.
Las dos pruebas tienen una correlación de .79 entre sí, que es bastante alta y dice que ambas pruebas miden el mismo constructo. Por lo tanto, la prueba VR tiene validez de constructo.
6. Integridad personal y egocentrismo
Para garantizar que una prueba analice la integridad personal, podemos compararla con una prueba que analice el egocentrismo. La prueba de integridad personal debe tener una correlación muy baja con el egocentrismo para mostrar validez de constructo. Este es otro ejemplo del método de prueba de validez divergente.
Construcciones: Integridad personal y egocentrismo
Medida de validez de constructo: Prueba de validez divergente
La integridad personal se puede definir como la honestidad, la justicia y el cumplimiento de las promesas. El egocentrismo se puede definir como el egocentrismo y la preocupación por aprovechar las situaciones sin importar las consecuencias para los demás.
Entonces, parecería que estos dos constructos consisten en características diametralmente opuestas. Esta es una situación perfecta para evaluar la validez de constructo de las escalas utilizando la metodología de validez divergente.
Después de que un equipo de investigadores haya generado un conjunto de preguntas que evalúan ambos constructos, las dos escalas se entregan a una gran muestra de ejecutivos corporativos y trabajadores de organizaciones benéficas seleccionados al azar.
Se calcula una correlación entre las dos escalas, que revela una correlación de .05. Esto significa que las dos escalas miden de hecho dos constructos completamente diferentes.
7. Escala de Inteligencia Emocional
Para probar la validez de constructo de una prueba de inteligencia emocional (EQ), se puede realizar un análisis factorial exploratorio para ver si las preguntas de EQ sobre habilidades sociales se correlacionan.
Construir: Inteligencia emocional
Medida de validez de constructo: Análisis factorial exploratorio
La inteligencia emocional (EQ) consta de cinco dimensiones: autoconciencia, habilidades sociales, toma de decisiones, autorregulación y empatía. Aunque estos conceptos son bastante abstractos, es posible desarrollar una aplicación que pueda evaluar estos rasgos.
Entonces, un pequeño equipo de investigación realiza una lluvia de ideas durante un par de horas y genera una lista de 10 preguntas para cada dimensión. Luego colocan la encuesta en línea y la envían a todos sus amigos y familiares. A cada una de esas personas se le pide que envíe el enlace de la encuesta a por lo menos tres de sus amigos o familiares.
Después de recibir las respuestas de más de 200 personas, los datos se ingresan en SPSS y se realiza un análisis factorial exploratorio (AFE).
Los resultados revelan que los ítems relacionados con la dimensión de habilidades sociales están todos relacionados entre sí, pero menos relacionados con las otras dimensiones. Este patrón es válido para todas las dimensiones. Esto se considera evidencia sólida para la validez de constructo.
Conclusión
La validez de construcción se refiere principalmente a si una herramienta de medición está midiendo lo que pretende medir. Hay tres formas principales de evaluar la validez de constructo: validez convergente, validez divergente y análisis factorial exploratorio (AFE).
Evaluar la validez de un dispositivo de medición es de suma importancia para los psicólogos y otros investigadores de las ciencias sociales. Debido a que los fenómenos bajo estudio son abstractos, la medición es inexacta y difícil.
Sin embargo, mediante el uso de una variedad de métodos, los investigadores pueden desarrollar y refinar sus técnicas de medición y eventualmente lograr un nivel razonable de confianza en la validez de esas herramientas.
Referencias
Cohen, RJ y Swerdlik, ME (2005). Pruebas y evaluación psicológicas: una introducción a las pruebas y la medición (6ª ed.). Nueva York: McGraw-Hill.
Coopersmith, S. (2002). manual de inventario de autoestima de coopersmith revisado. Redwood City: Jardín mental.
Cronbach, LJ y Meehl, PE (1955) Validez de constructo en pruebas psicológicas. Boletín Psicológico, 52281-302.
Fabrigar, LR, Wegener, DT, MacCallum, RC y Strahan, EJ (1999). evaluando el
uso del análisis factorial exploratorio en la investigación psicológica. Métodos psicológicos, 4272–299.
Rosenberg, M., Schooler, C., Schoenbach, C. y Rosenberg, F. (1995). Autoestima global y autoestima específica: diferentes conceptos, diferentes resultados. Revista Sociológica Americana, 60(1), 141–156.
Simms, L. (2007). Métodos Clásicos y Modernos de Construcción de Escalas Psicológicas. Brújula Psicología Social y Personalidad, 2(1), 414 – 433. https://doi.org/10.1111/j.1751-9004.2007.00044.x
Deja una respuesta