10 ejemplos de validez de contenido

La validez de contenido es un término que se utiliza para describir si un estudio examina completamente el constructo que está diseñado para medir. Es importante que una prueba sea exhaustiva y cubra todo el dominio del constructo.

Por ejemplo, si un investigador quiere estudiar la inteligencia emocional y hay cinco dimensiones de inteligencia emocional, entonces la escala debe tener múltiples preguntas que evalúen cada dimensión.

Si solo explora un aspecto de la inteligencia emocional e ignora los otros cuatro, entonces no tendría validez de contenido.

Índice()

    Diferencia entre contenido y validez de construcción

    A veces puede haber cierta confusión entre contenido y construir validez.

    La diferencia entre los dos conceptos es sutil:

    • Validez de constructo se preocupa por si la prueba mide lo que se supone que debe medir
    • Validez de contenido se centra más en si los ítems de la prueba cubren todo el dominio conceptual de lo que se está midiendo.

    Ejemplos de validez de contenido

    1. Examen final en un curso universitario

    Suponga que está tomando un curso de historia europea. El libro de texto consta de 15 capítulos.

    El profesor informa a los alumnos que el examen final será completo, es decir, cubrirá toda la materia desde el principio hasta el final del curso.

    A medida que se acerca la fecha del examen final, comienzas a releer el libro y a estudiar tus apuntes. Por supuesto, dedicas un tiempo considerable a prepararte para el final y cuando llega la fecha del examen, te sientes completamente preparado.

    Sin embargo, para su sorpresa, el examen solo cubre los capítulos impares. No hay preguntas en los capítulos 2, 4, 6, etc.

    En este ejemplo, el examen final obviamente carece de validez de contenido.

    2. Prueba de licencia de conducir

    Las pruebas de manejo a menudo solo lo evalúan en buenas condiciones. No evalúa si puede conducir bajo la lluvia, la nieve o en calles concurridas. Por lo tanto, la mayoría de las pruebas de manejo carecen de validez de contenido.

    Conducir es más peligroso de lo que la mayoría de la gente cree. Ponerse al volante de una masa de acero de 2,000 libras que viaja a 50 mph puede provocar lesiones graves si el conductor no presta atención, carece de la coordinación mano-ojo adecuada o se excita con demasiada facilidad.

    Sin embargo, la prueba típica de la licencia de conducir del estado incluirá conducir una ruta simple y sin estrés alrededor de un estacionamiento, tal vez un intento de estacionamiento en paralelo y un examen que evalúe el conocimiento de las reglas y regulaciones básicas de tránsito.

    Ese procedimiento de evaluación apenas cubre todo el dominio de las habilidades necesarias para conducir en el mundo real. Por lo tanto, el examen de la licencia de conducir del estado puede ser una de las pruebas más importantes en la vida de una persona que tiene la menor validez de contenido.

    3. Preguntas de la entrevista de trabajo

    A menudo, estudiamos todo lo que hay que estudiar sobre un trabajo antes de la entrevista, solo para llegar a la entrevista y nos hacen muy pocas preguntas, ¡y ciertamente no las suficientes para evaluar qué tan bueno será en el trabajo!

    Todos sabemos que una pregunta que a los empleadores les encanta hacer es durante una entrevista de trabajo: "¿dónde te ves en 5 años?"

    También hay muchas otras preguntas, como: ¿cuáles son tus fortalezas y debilidades, cómo manejas el estrés y qué dirían tus amigos sobre ti?

    Si bien esas preguntas pueden brindarle al empleador cierta información sobre sus habilidades verbales y su capacidad para crear una impresión favorable, ninguna de ellas puede relacionarse con los requisitos específicos del trabajo.

    No solo eso, sino que la calificación es completamente subjetiva y probablemente más una función del estado de ánimo del empleador en ese momento en particular que de las respuestas del solicitante.

    Una evaluación más precisa, basada en la validez del contenido, implicaría el diseño de tareas de simulación de trabajo que reflejen las tareas que realmente se realizan en el trabajo.

    Cada solicitante pasaría por la simulación y su desempeño sería observado y evaluado por un panel de expertos en la materia (SME).

    4. La combinación de la NFL

    El combinado de la NFL es una prueba de qué tan preparados estarían los futbolistas universitarios para la NFL. Desafortunadamente, no es muy preciso porque las pruebas no son lo suficientemente completas.

    Todos los años, los atletas universitarios participan en el combinado de la NFL con la esperanza de convertirse en profesionales (y tramos impositivos sustancialmente más altos). Los entrenadores en jefe, gerentes y exploradores de cada equipo viajan desde todo el país para asistir.

    El evento involucra a los atletas que participan en varios ejercicios y pruebas físicas que se supone deben predecir el desempeño futuro en el campo. Una muestra de algunas de estas evaluaciones incluyen la carrera de 40 yardas, el press de banca con 220 libras, el salto vertical y algo llamado el ejercicio de los tres conos.

    Desafortunadamente, el contenido de estas pruebas está muy lejos de ser representativo de los requisitos del trabajo. Por ejemplo, el liniero ofensivo y defensivo probablemente pasará una temporada completa y nunca necesitará correr 40 yardas a toda velocidad.

    La investigación sobre el Combinado también revela que el rendimiento en este evento tiene poca similitud con las demandas laborales el día del partido (Kuzmits & Adams, 2008). Haga clic aquí para una breve explicación.

    5. Pruebas de coeficiente intelectual

    Quizás uno de los mejores ejemplos de una prueba que carece de validez de contenido es la prueba de coeficiente intelectual estándar. Una prueba de 1 hora ni siquiera puede arañar la superficie para identificar qué tan inteligente es una persona.

    Aunque existen numerosas versiones, como la Escala de inteligencia para adultos de Wechsler para adultos y las Escalas de inteligencia de Stanford-Binet, existe un debate considerable sobre si las preguntas de la prueba representan realmente la inteligencia en todas sus formas.

    Hay muchos aspectos diferentes de la inteligencia, diferentes tipos de inteligencia y diferentes formas en que se puede expresar la inteligencia. Es difícil imaginar que una prueba de papel y lápiz pueda ser lo suficientemente completa como para cubrir todo el dominio de contenido.

    Por esta razón, la validez de contenido de las pruebas estandarizadas siempre está abierta a debate.

    6. Jefe de cocina

    Para probar si alguien está listo para ser jefe de cocina, debe ser experto en cocina y liderazgo. Probar solo uno de estos y no el otro conduciría a una falla de validez de contenido.

    Con un trabajo tan orientado a las habilidades como ser el jefe de cocina de un restaurante exclusivo, uno pensaría que el contenido del proceso de contratación consistiría en una demostración de habilidades prácticas. De hecho, esto es a menudo el caso.

    Se puede invitar a un solicitante a la cocina y pedirle que prepare una variedad de platos, incluidos platos principales y postres. También puede haber una prueba de papel y lápiz que evalúe el conocimiento de varios códigos y regulaciones de salud, así como cuestiones relacionadas con los aspectos comerciales de administrar una cocina, como el manejo del presupuesto.

    En este caso, para que la evaluación tenga validez de contenido, debe contener dos componentes, uno práctico y otro basado en conocimientos.

    7. Contratación de un profesor de economía

    La docencia tiene dos ramas: el conocimiento y la enseñanza. Puedes ser un gran conocedor y un pésimo maestro. Para contratar al maestro, debe poder probar ambos aspectos.

    La economía puede ser una materia difícil de enseñar. Hay muchos conceptos técnicos que pueden involucrar fórmulas estadísticas sofisticadas.

    En este ejemplo, una escuela va a contratar a un nuevo profesor de economía. Desarrollan una prueba integral que cubre los principios micro y macroeconómicos. La escuela quiere asegurarse de que su maestro sepa lo que hace.

    El siguiente paso del proceso de contratación consiste en entrevistar a cada solicitante. A los solicitantes se les hace una amplia gama de preguntas sobre economía y los miembros del panel de contratación califican el desempeño general de cada solicitante.

    Luego, el panel de contratación toma una decisión y contrata a uno de los solicitantes. Aunque la persona contratada por la escuela tiene muchos conocimientos de economía, resulta que no son muy buenos para enseñarla a otros.

    La validez de contenido del proceso de contratación en este ejemplo no cubrió completamente todos los dominios de la enseñanza de la economía, como la enseñanza.

    8. Panel de Expertos

    Una forma de determinar si una prueba tiene validez de contenido o no es hacer que la examine un panel de expertos.

    El panel puede constar de 2 a más de 20 expertos en el dominio de interés. Cada miembro del panel recibe una copia de la prueba o cuestionario y se le pide que califique cada ítem en términos de si representa el dominio de estudio o no.

    Esas calificaciones luego son examinadas por los desarrolladores de la prueba. Los elementos de prueba individuales que recibieron calificaciones bajas por parte del panel se omiten de la versión final de la prueba. Eventualmente, después de que se hayan eliminado todos los elementos defectuosos, la prueba tendrá validez de contenido.

    9. Relación de validez de contenido de Lawshe

    El índice de validez de contenido (CVR) es un método estadístico para medir el grado de acuerdo entre los expertos en la materia (SME) con respecto a la idoneidad de los ítems individuales de una prueba o escala de personalidad.

    Después de entregar una copia completa de la herramienta de medición, Lawshe (1975, p. 567) afirmó que cada PYME debería responder a la pregunta: "¿Es la habilidad o el conocimiento medido por este elemento 'esencial', 'útil, pero no esencial' o 'no necesario' para el desempeño del trabajo?"

    Los datos se introducen en un programa estadístico como SPSS y se calcula el CVR. El valor de CVR variará de -1 (total desacuerdo) a +1 (totalmente de acuerdo). Cuanto más cerca esté el valor de CVR de +1, más sólida será la validez del contenido.

    10. Casarse demasiado pronto

    El problema de encontrar una pareja romántica es que nunca tenemos suficiente información para saber si realmente es "la pareja" hasta que invertimos mucho tiempo y esfuerzo en ello. ¡Esta es la razón por la que muchas parejas salen durante un largo período de tiempo antes de casarse!

    En el mundo de las citas, muchos solteros solo están interesados ​​en una cosa: encontrar a su alma gemela. Puede ser un viaje arduo. Una persona puede tener que tener muchas citas, durante años, antes de encontrar al hombre/mujer de sus sueños.

    Debido a que nadie realmente quiere perder mucho tiempo, muchas personas en el grupo de citas han desarrollado sus propios criterios de evaluación para determinar si su cita es el Sr. o la Sra. Derecha. Esto puede incluir observar cuidadosamente cómo su cita trata a los meseros en un restaurante, los hábitos de aseo o estimar el potencial de ganancias de por vida.

    Desafortunadamente, la mayoría de estos criterios no logran captar la verdadera esencia del matrimonio. Los atributos necesarios para un matrimonio exitoso no se evaluarán en una cena de 90 minutos.

    Quizás si las personas en el juego de las citas tomaran un curso sobre la validez del contenido, podrían desarrollar procedimientos de evaluación más aplicables al matrimonio.

    Conclusión

    La validez de contenido se refiere a si los ítems de una prueba o una escala de personalidad evalúan todo el dominio del tema de interés. Una buena prueba tendrá preguntas que cubran todos los aspectos del constructo que se está midiendo.

    Podemos ver muchos ejemplos de validez de contenido en el mundo real. Las pruebas de la licencia de conducir generalmente carecen de validez de contenido porque la parte de conducción se lleva a cabo en un estacionamiento y no imita las condiciones reales de conducción.

    El combinado de la NFL puede ser uno de los ejemplos más famosos de un proceso de prueba con muchos desafíos individuales que prácticamente no se parecen a los requisitos del trabajo el día del partido.

    Lo mismo puede decirse de las entrevistas de trabajo. Las preguntas formuladas durante el proceso de contratación a menudo no representan aspectos del trabajo.

    Aunque el concepto de validez de contenido es bastante simple, obtenerlo en situaciones de la vida real puede ser bastante desafiante.

    Referencias

    Cronbach, LJ (1970). Fundamentos de las pruebas psicológicas. Nueva York: Harper & Row.

    Haynes, SN, Richard, DCS y Kubany, ES (1995). Validez de contenido en evaluación psicológica: un enfoque funcional de conceptos y métodos. Evaluación psicológica. 7, 238–247.

    Hinkin, TR y Tracey, JB (1999). Un enfoque de análisis de varianza para la validación de contenido. Métodos de investigación organizacional, 2(2), 175–186. https://doi.org/10.1177/109442819922004

    Johnston, M., Dixon, D., Hart, J., Glidewell, L., Schröder, C. y Pollard, B. (2014). Validez de contenido discriminante: una metodología cuantitativa para evaluar el contenido de las medidas basadas en la teoría, con aplicaciones ilustrativas. Revista británica de psicología de la salud, 19(2), 240-257. https://doi.org/10.1111/bjhp.12095

    Koller, I., Levenson, MR y Glück, J. (2017). ¿Qué crees que estás midiendo? Un procedimiento de métodos mixtos para evaluar la validez de contenido de los elementos de prueba y la escala basada en la teoría. Fronteras en Psicología, 8126. https://doi.org/10.3389/fpsyg.2017.00126

    Kuzmits, FE y Adams, AJ (2008). El combinado de la NFL: ¿predice el rendimiento en la Liga Nacional de Fútbol Americano? Diario de investigación de fuerza y ​​​​acondicionamiento, 22(6), 1721–1727. https://doi.org/10.1519/JSC.0b013e318185f09d

    Lawshe, CH (1975). Un enfoque cuantitativo de la validez de contenido. Psicología del Personal, 28563-575.

    Mason, J., Classen, S., Wersal, J. y Sisiopiku, VP (2020). Establecimiento de la validez aparente y de contenido de una encuesta para evaluar las percepciones de los usuarios sobre los vehículos automatizados. Registro de investigación de transporte: Diario de la Junta de Investigación de Transporte, 2674(9), https://doi.org/10.1177/0361198120930225

    Mussio, SJ y Smith, MK (1973). Validez de contenido: un manual de procedimiento. Asociación Internacional de Personal, Chicago.

    Polit, DF, Beck, CT y Owen, SV (2007). ¿Es el CVI un indicador aceptable de validez de contenido? Evaluación y recomendaciones. Investigación en Enfermería y Salud, 30(4), 459-467. https://doi.org/10.1002/nur.20199

    Yao, G., Wu, CH y Yang, CT (2008). Examinar la validez de contenido del WHOQOL-BREF desde la perspectiva de los encuestados mediante métodos cuantitativos. Investigación de Indicadores Sociales, 85(3), 483-498.

    Califica esta Publicación

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

    Subir

    Usamos cookies Política de Cookies