Refuerzo contingente: definición y ejemplos
El refuerzo contingente es cuando se proporciona un estímulo positivo después de un comportamiento deseado específico. Por ejemplo, un refuerzo contingente por hacer sus tareas es recibir dinero de bolsillo.
En algunos casos, también puede significar la eliminación de un estímulo aversivo después de un comportamiento específico (provocando una sensación de alivio).
La intención es aumentar la probabilidad de que el comportamiento objetivo se repita en el futuro.
El refuerzo contingente a menudo se compara con el refuerzo no contingente:
- Refuerzo contingente: Cuando se proporciona un reforzador de la conducta después de exhibir una conducta deseada, por ejemplo, cuando un maestro brinda una recompensa a los estudiantes al final de la clase si se quedan quietos durante una lección de 50 minutos.
- Refuerzo no contingente: Cuando se proporciona un reforzador del comportamiento independientemente de las acciones del sujeto y, a menudo, antes de que ocurra el comportamiento para evitar que suceda, como cuando un maestro les da a los estudiantes descansos de movimiento de 20 minutos para evitar la probabilidad de un mal comportamiento durante los 50 minutos. lección.
El refuerzo contingente ha sido una herramienta valiosa para mejorar el comportamiento en una amplia gama de dominios. Por ejemplo, en contextos educativos, el refuerzo contingente ha ayudado a los estudiantes a mantener un comportamiento centrado en la tarea, ha aumentado el comportamiento adaptativo de los estudiantes disruptivos y ha ayudado a los niños con problemas de aprendizaje.
Orígenes del refuerzo contingente
El refuerzo contingente tiene sus raíces en la teoría del aprendizaje de Skinner conocida como condicionamiento operante (Skinner, 1965).
De acuerdo con el condicionamiento operante, las consecuencias de un comportamiento determinan la probabilidad de que vuelva a ocurrir. Los comportamientos que se refuerzan tienen más probabilidades de repetirse, mientras que los comportamientos que se castigan tienen menos probabilidades de repetirse.
Aunque a Skinner se le atribuye el desarrollo del condicionamiento operante, la teoría tiene sus raíces en la Ley del efecto de Edward Thorndike (1898; 1905).
La Ley del Efecto establece que:
“Las respuestas que producen un efecto satisfactorio en una situación particular tienen más probabilidades de ocurrir nuevamente en esa situación, y las respuestas que producen un efecto incómodo tienen menos probabilidades de ocurrir nuevamente en esa situación” (Gray, 2007, p. 106).
Horarios de Refuerzo Contingente
Skinner estudió extensamente el reforzamiento contingente e identificó diferentes programas de reforzamiento.
Hay dos horarios principales: continuo y variable.
El refuerzo continuo es cuando el comportamiento objetivo se refuerza todas y cada una de las veces que ocurre. El refuerzo variable es cuando el comportamiento objetivo a veces se refuerza ya veces no.
Existen diferentes versiones de la armadura variable: relación fija y relación variable. Cada uno produce un patrón de comportamiento ligeramente diferente.
1. Horario de Razón Fija
El programa de razón fija significa que el reforzamiento se presenta después de que la conducta objetivo haya ocurrido un número específico de veces.
Por ejemplo, un programa FR-10 significa que se entregará una recompensa después de que el comportamiento objetivo se haya exhibido 10 veces.
El programa FR conduce a la adquisición rápida del comportamiento, lo que significa que la persona comenzará a exhibir el comportamiento objetivo rápidamente.
Después de estar en este horario durante algún tiempo, la tasa de comportamiento es fuerte y constante.
Un patrón notable en este programa es la pausa posterior al refuerzo. La tasa de la conducta objetivo se detendrá un poco después de cada refuerzo.
Si el refuerzo se detiene por completo, la conducta objetivo también se detendrá. Esto se llama extinción.
Poco tiempo después de haber terminado el reforzamiento, la persona puede exhibir un estallido de extinción. Eso es un aumento repentino en el comportamiento objetivo.
2. Horario de Razón Variable
El programa de razón variable implica la presentación de refuerzo después de un número variado de veces que se ha exhibido el comportamiento objetivo. En lugar de que el refuerzo se entregue después de un número específico de comportamientos objetivo, el número varía.
Por ejemplo, un programa VR-10 significa que, en promedio, el comportamiento debe exhibirse 10 veces para que se entregue el reforzador.
El comportamiento puede ser recompensado después de 3 ocurrencias, luego 12, luego 7 y así sucesivamente. Aunque el número cambia, el promedio durante un período de tiempo será 10.
El programa de razón variable puede producir una adquisición rápida si la razón entre comportamiento y recompensa es alta. El individuo se da cuenta rápidamente de la contingencia entre la conducta y el reforzador.
Una vez finalizada la recompensa, la extinción será lenta. Al individuo le toma un tiempo darse cuenta de que el comportamiento objetivo ya no es recompensado.
En muchos escenarios, se implementa un programa continuo de refuerzo al principio para que el individuo comience a exhibir el comportamiento objetivo rápidamente.
Una vez que se ha adquirido el comportamiento objetivo, el cronograma se reduce, lo que significa que la cantidad de comportamientos objetivo necesarios para la recompensa aumenta gradualmente.
Ejemplos de refuerzo contingente
- Trabajo de granja (Proporción fija): Los trabajadores de una granja generalmente son recompensados en función de la cantidad de canastas que llenan. Existe un vínculo directo entre cada cesta llena y el pago.
- Hacer tareas (proporción variable): Aunque los padres quieren que sus hijos hagan sus tareas sin esperar una recompensa, algunos padres ocasionalmente ofrecen algún tipo de recompensa para reforzar el comportamiento.
- La economía de los conciertos (Relación variable): Es posible que un profesional independiente deba solicitar 15 trabajos antes de obtener uno. Pero luego, de repente, los siguientes tres que solicitan tienen éxito.
- Comprobación de Me gusta en FB (Relación variable): Cuando una persona publica un nuevo video, a menudo irá a su cuenta y verificará si tiene "me gusta" o no. A veces, cuando comprueban su comportamiento, serán recompensados porque hay "me gusta". Sin embargo, a veces, cuando comprueban, es posible que no haya "me gusta" en absoluto.
- en baloncesto (Relación variable): Ningún entrenador quiere malcriar a sus jugadores. Por lo tanto, no ofrecerán elogios cada vez que el jugador haga algo bien, como hacer un buen pase.
- Comisiones de Ventas (Ratio Fijo): Muchos trabajos en ventas implican recompensar al vendedor con una comisión. En algunos puestos se entrega la comisión por cada venta realizada, mientras que en otros puestos se puede entregar una comisión luego de cumplir un número específico.
- Lectura de libros gratificantes (proporción fija): Para alentar a un niño a leer más, algunos padres ofrecerán un incentivo en efectivo por cada libro leído, o por cada tres libros leídos, o alguna variación.
- Máquinas Tragamonedas (Ratio Variable): La mayoría de las máquinas tragamonedas recompensan el comportamiento objetivo (es decir, poner monedas en la tragamonedas) de manera impredecible. La recompensa es completamente impredecible.
- Videojuegos (Ratio fijo): Muchos tipos de videojuegos recompensan al jugador cada vez que se involucra en un comportamiento objetivo específico, como obtener puntos por cada ícono golpeado o cada monstruo asesinado.
- Pesca (Ratio Variable): No se sabe cuántas veces se necesita cebar el anzuelo y tirar la línea para que haya un bocado. Parece que algunos días, cada vez que la línea entra, muerde un pez. En otros días, puede parecer que la línea ha sido lanzada cien veces antes de recibir un solo bocado.
- Solicitud de empleo (ratio variable): Enviar un currículum a veces resultará en una entrevista... y otras veces no..
Aplicaciones del refuerzo contingente
1. En economías de fichas
Una economía de fichas utiliza fichas como recompensas que pueden intercambiarse por artículos o privilegios deseados. Es una técnica de modificación del comportamiento comúnmente utilizada en hospitales psiquiátricos, centros correccionales, programas de tratamiento de abuso de sustancias y aulas.
Por ejemplo, LePage et al. (2003) implementaron una economía de fichas para pacientes hospitalizados en una unidad psiquiátrica. Los pacientes recibieron sellos por tomar medicamentos, asistir a sus citas y ducharse.
Posteriormente, los sellos se pueden canjear por pases, películas o varios refrigerios. Se quitaron los sellos por golpear a otros o destruir la propiedad.
Un seguimiento de 2 años indicó una disminución significativa en las lesiones paciente-paciente (48%) y las lesiones paciente-empleado (21%).
Maggin et al. (2003), realizó una revisión de la literatura y concluyó que aunque la investigación sobre economías simbólicas en entornos escolares no cumplió con los estándares basados en evidencia, la evidencia fue de apoyo.
Soare et al. (2016) realizaron un metanálisis de economías de tokens que involucraban aplicaciones de un solo caso y encontraron que las economías de tokens eran más efectivas para las edades de 6 a 15 años que para las de 3 a 5 años.
Reitman et al. (2021) señalaron que implementar una economía de fichas efectiva requiere compromiso organizacional, comunicación y capacitación adecuada del personal.
2. En Programas de Recompensas
Una empresa ofrece un programa de recompensas que recompensa a los clientes por compras o uso de un servicio. Las tarjetas de crédito y las aerolíneas ofrecen dos programas de recompensas muy conocidos.
Cada vez que un cliente usa una tarjeta de crédito, es recompensado con puntos o devolución de efectivo. Con las aerolíneas, cuantas más millas vuele un cliente con una aerolínea en particular, más puntos acumula, que se pueden canjear por vuelos o productos gratis.
Este tipo de programas utilizan refuerzo contingente. En última instancia, el objetivo es aumentar el comportamiento de compra, la interacción con la marca y ayudar a desarrollar la lealtad a la marca.
3. En Análisis Conductual Aplicado (ABA)
El análisis de comportamiento aplicado (ABA) es una estrategia de modificación del comportamiento que utiliza los principios del condicionamiento clásico y operante para disminuir el comportamiento indeseable y aumentar el comportamiento deseable (Madden, 2012).
A menudo se implementa con un pequeño número de estudiantes (en muchos casos solo uno) que sufren una discapacidad de aprendizaje como el autismo o tienen perfiles de aprendizaje típicos.
Riley et al. (2011) se enfocaron en los comportamientos de en la tarea y fuera de la tarea de dos estudiantes de escuela primaria (ambos de 7 años) con perfiles de aprendizaje típicos que tenían dificultades para mantenerse enfocados.
El maestro elogió el comportamiento en la tarea o redirigió el comportamiento fuera de la tarea, lo que resultó en "... aumentar los comportamientos en la tarea de ambos estudiantes participantes" (p. 159).
Eikeseth (2009) realizó una revisión de las intervenciones psicoeducativas para niños autistas menores de seis años y concluyó que ABA está bien establecido y es efectivo.
Eldevik et al. (2010) declaró:
"Revisiones narrativas y metaanalíticas recientes sugieren que la EIBI (intervención conductual intensiva temprana) puede cumplir con los criterios como una intervención "bien establecida"... Los tamaños del efecto para el cociente de inteligencia (CI) y los resultados del comportamiento adaptativo están en el rango medio a grande" ( pág. 17).
Warren et al. (2011) realizaron una revisión exhaustiva de los estudios publicados y concluyeron que ABA y otras terapias ayudan a mejorar el rendimiento cognitivo, las habilidades lingüísticas y el comportamiento adaptativo.
Sin embargo, también notaron que la fuerza de la evidencia es baja y que los estudios que muestran efectividad pueden deberse a que algunos niños muestran una mejora significativa, mientras que otros no.
También hay críticas a ABA. Como describe Solomon (2008), algunos miembros de la comunidad autista creen que ABA tiene sus raíces en una perspectiva filosófica que no acepta sus verdaderas personalidades.
En lugar de tratar de hacer que los niños autistas sean "normales", se debe defender una perspectiva que se base en la aceptación social de los rasgos autistas inofensivos.
Conclusión
El refuerzo contingente aplica el condicionamiento operante para aumentar un comportamiento objetivo específico. Cuando se muestra el comportamiento objetivo, se recompensa, lo que aumenta la probabilidad de que vuelva a ocurrir.
Con un programa continuo de reforzamiento, la conducta objetivo se refuerza cada vez que ocurre. Con un horario parcial, a veces se refuerza el comportamiento ya veces no.
Hay dos tipos de horarios parciales y cada uno produce un patrón de comportamiento diferente.
El refuerzo contingente se puede ver en la vida cotidiana en una amplia gama de escenarios prácticos. Los hospitales y escuelas psiquiátricos a menudo implementan economías simbólicas para recompensar el comportamiento deseado y disminuir el comportamiento indeseable.
ABA utiliza el refuerzo contingente y ha demostrado ser al menos parcialmente efectivo para ayudar a los niños autistas a mejorar sus habilidades lingüísticas, su comportamiento adaptativo y sus habilidades cognitivas.
Las compañías de tarjetas de crédito y las aerolíneas ofrecen a los clientes programas de recompensas basados en contingencias para aumentar las compras y fomentar la lealtad a la marca.
Referencias
Eikeseth, S. (2009). Resultado de intervenciones psicoeducativas integrales para niños pequeños con autismo. Investigación en discapacidades del desarrollo, 30(1), 158-178.
Eldevik, S., Jahr, E., Eikeseth, S., Hastings, RP y Hughes, CJ (2010). Resultados conductuales cognitivos y adaptativos de la intervención conductual para niños pequeños con discapacidad intelectual. Modificación de comportamiento, 34(1), 16-34.
Ferster, CB y Skinner, BF (1957). Horarios de refuerzo. Nueva York: Appleton-Century-Crofts.
Gris, P. (2007). Psicología (6el ed.). Worth Publishers, Nueva York.
LePage, JP, DelBen, K., Pollard, S., McGhee, M., VanHorn, L., Murphy, J., … & Mogge, N. (2003). Reducción de las agresiones en una unidad psiquiátrica de agudos utilizando una economía de fichas: un seguimiento de 2 años. Intervenciones Conductuales: Teoría y Práctica en Residencial y Comunitario‐Programas Clínicos Basados, 18(3), 179-190.
Madden, GJ (2012). Manual de análisis de la conducta de la APA (Manuales de psicología de la APA).
Maggin, DM, Chafouleas, SM, Goddard, KM y Johnson, AH (2011). Una evaluación sistemática de las economías de fichas como una herramienta de gestión del aula para estudiantes con comportamiento desafiante. Revista de Psicología Escolar, 49(5), 529-554.
Reitman, D., Boerke, K. y Vassilopoulos, A. (2021). Economías de fichas. manual de análisis de comportamiento aplicado374.
Riley, JL, McKevitt, BC, Shriver, MD y Allen, KD (2011). Aumentar el comportamiento en la tarea usando la atención del maestro entregada en un horario fijo. Revista de educación conductual, 20(3), 149-162.
Skinner, BF (1965). La ciencia y el comportamiento humano.. Nueva York: Prensa libre.
Soares, DA, Harrison, JR, Vannest, KJ y McClelland, SS (2016). Tamaño del efecto para el uso de la economía de fichas en entornos de aula contemporáneos: un metanálisis de la investigación de un solo caso. Revisión de psicología escolar, 45(4), 379-399.
Salomón, A. (2008). El movimiento por los derechos del autismo. Revista de Nueva York, 252008.
Staddon, JE y Cerutti, DT (2003). Condicionamiento operante. Revisión anual de psicología, 54(1), 115-144.
Thorndike, EL (1898). Inteligencia animal: un estudio experimental de los procesos asociativos en animales. The Psychological Review: suplementos de monografías, 2(4), yo.
Thorndike, EL (1905). Los elementos de la psicología.. Nueva York: AG Seiler.
Reitman, D., Boerke, K. y Vassilopoulos, A. (2021). Economías de fichas. manual de análisis de comportamiento aplicado374.
Warren, Z., McPheeters, ML, Sathe, N., Foss-Feig, JH, Glasser, A. y Veenstra-VanderWeele, J. (2011). Una revisión sistemática de la intervención intensiva temprana para los trastornos del espectro autista. Pediatría, 127(5), e1303-e1311.
Watson, TL, Skinner, CH, Skinner, AL, Cazzell, S., Aspiranti, KB, Moore, T. y Coleman, M. (2016). Prevención del comportamiento disruptivo a través de la gestión del aula: Validación del sistema de rueda de colores en las aulas de jardín de infantes. Modificación de comportamiento, 40(4), 518-540.
Watson, JB (1913). La psicología como el conductista ve. revisión psicológica, 20(2), 158.
Deja una respuesta