10 ejemplos de refuerzo continuo
El refuerzo continuo es un programa de refuerzo del comportamiento en el que el comportamiento objetivo se recompensa cada vez que ocurre. Se yuxtapone al refuerzo parcial donde la recompensa o el castigo ocurren de forma intermitente.
El refuerzo positivo continuo de un comportamiento hace que sea más probable que vuelva a ocurrir, mientras que el refuerzo negativo continuo desincentiva su recurrencia.
Este concepto es parte de los principios de condicionamiento operante de BF Skinner (1965). Se usa con mayor frecuencia al principio, como en la infancia o con cachorros, para que el animal o la persona muestre el comportamiento objetivo lo más rápido posible, lo que se conoce como adquisición rápida.
Definición de refuerzo continuo
El refuerzo continuo se refiere a situaciones en las que un comportamiento se refuerza con una recompensa positiva o negativa cada vez que ocurre.
Se basa en la idea de que el refuerzo puede ayudar a moldear comportamientos. Las recompensas aumentan la probabilidad de que vuelva a suceder, mientras que los desincentivos disminuyen las posibilidades de que se repita.
Como argumenta Gray:
“Las respuestas que producen un efecto satisfactorio en una situación particular tienen más probabilidades de ocurrir nuevamente en esa situación, y las respuestas que producen un efecto incómodo tienen menos probabilidades de ocurrir nuevamente en esa situación” (Gray, 2007, p. 106).
Una vez que se ha adquirido el comportamiento objetivo y se repite cada vez que se solicita, el refuerzo continuo puede eliminarse gradualmente y reemplazarse con un programa de refuerzo parcial.
El reforzamiento parcial se refiere a instancias en las que el reforzamiento de los comportamientos no ocurre siempre, pero puede ocurrir en una proporción (relación fija y proporción variable) o intervalo de tiempo (intervalo fijo e intervalo variable).
Sin embargo, si el refuerzo cesa durante un programa de refuerzo continuo, el comportamiento también cesará rápidamente, lo que se conoce como extinción rápida.
Ejemplos de refuerzo continuo
- Estrellas doradas por ortografía correcta: Al revisar las pruebas de ortografía de los estudiantes, el maestro coloca una calcomanía con una estrella dorada al lado de cada palabra escrita correctamente.
- Comisiones de ventas: Una empresa le da una pequeña comisión al vendedor por cada venta que realiza.
- Juego de fonética en línea: Cada vez que el jugador elige la opción correcta, aparece una campana de colores brillantes y suena unos segundos.
- Recompensa por abrir una aplicación: Cada vez que una persona hace clic en una aplicación específica para usar en su teléfono, se le recompensa con tokens que se pueden usar para realizar compras.
- Voz alegre al contestar: Una empresa entrena a todos los representantes de servicio al cliente para responder cada llamada telefónica con una voz alegre y agradable.
- Máquinas expendedoras: Cada compra es recompensada con un producto, lo que refuerza el comportamiento y aumenta las posibilidades de que vuelva a suceder.
- Saludar a los demás con una sonrisa: Las personas amigables a menudo saludan a los demás con una sonrisa, lo que crea una impresión favorable y hace que las personas quieran interactuar con ellos con más frecuencia.
- Venta de Bienes Raíces: Los agentes inmobiliarios reciben un porcentaje del precio de venta de una casa.
- Después de leer un libro: Los padres han decidido premiar a sus hijos con $5 por cada libro de historia que lean.
- Dar un gran choca esos cinco: Cada vez que un estudiante en esta clase de jardín de infantes levanta la mano y responde bien una pregunta, el maestro se acerca a ellos y les da un gran choca esos cinco.
Refuerzo Parcial vs Refuerzo Continuo
Criterios | Refuerzo Parcial | Refuerzo Continuo |
Definición | Un programa de refuerzo donde una respuesta solo se refuerza algunas veces, en lugar de cada vez que ocurre. | Un programa de refuerzo donde una respuesta se refuerza cada vez que ocurre. |
Tipos | Relación fija, relación variable, intervalo fijo, intervalo variable | N / A |
Velocidad de aprendizaje | Aprendizaje inicial más lento, ya que el refuerzo no es consistente. | Aprendizaje inicial más rápido, debido al refuerzo constante. |
Resistencia a la extinción | Mayor resistencia a la extinción, ya que la conducta aprendida persiste incluso cuando ya no se proporciona refuerzo. | Menor resistencia a la extinción, ya que es más probable que el comportamiento cese cuando ya no se proporciona refuerzo. |
Ejemplos | Máquinas tragamonedas (proporción variable), concursos sorpresa (intervalo variable) | Entrenar a un perro para que se siente dándole una golosina cada vez que se sienta |
Solicitud | Útil para mantener un comportamiento a largo plazo y promover la persistencia, a menudo visto en los hábitos de juego, ventas y estudio. | Eficaz para enseñar nuevos comportamientos y garantizar la rápida adquisición de habilidades, a menudo visto en el entrenamiento de animales y en las primeras etapas de aprendizaje. |
Efecto psicológico | Puede conducir a una mayor persistencia y una mayor resistencia a la extinción debido a la imprevisibilidad del refuerzo. | Puede conducir a una fuerte asociación entre el comportamiento y el refuerzo, pero también puede resultar en una menor persistencia cuando ya no se proporciona el refuerzo. |
Casos de Estudio de Refuerzo Continuo
1. Juego de videojuegos
Una de las razones por las que los videojuegos son tan divertidos es porque le brindan al jugador muchos tipos diferentes de recompensas. En juegos simples, cuando el jugador toca un ícono, es recompensado con puntos. Cuantos más íconos golpeen, más puntos serán recompensados. Esta es una aplicación sencilla de refuerzo continuo.
Este refuerzo continuo se puede superponer para que diferentes tipos de iconos se asocien con diferentes cantidades de puntos.
Estas recompensas sirven como fuertes refuerzos para que los jugadores sigan jugando.
De hecho, puede haber una base neurológica de estas recompensas. Por ejemplo, Lorenz et al. (2015) resumen los estudios de neuroimagen en jugadores de videojuegos:
“estos estudios muestran que es probable que los procesos neuronales asociados con los videojuegos estén relacionados con alteraciones del procesamiento neuronal en el VS, el área central del procesamiento de recompensas” (p. 2).
Esto indica que los centros de recompensa en el cerebro se activan al jugar videojuegos, lo que aumenta las posibilidades de que vuelva a jugar.
Cada ícono golpeado activa los centros de recompensa en el cerebro.
2. Programas de recompensas de tarjetas de crédito
Todas las principales tarjetas de crédito ofrecen programas de recompensas. Todos funcionan con la misma estructura básica: cuanto más gastas, más recompensas recibes. Existe una correlación directa entre el gasto y la recompensa. La recompensa podría ser en forma de millas aéreas, puntos o devolución de efectivo.
No importa la forma de la recompensa, el objetivo es el mismo: aumentar el uso de la tarjeta por parte de los clientes.
Pero queda una pregunta: ¿funciona la recompensa?
Banerji y Farooqi (2017) realizaron una encuesta de clientes en Delhi India para examinar el impacto relativo de cinco factores en el uso de los programas de recompensas por parte de los consumidores: conveniencia, valor aspiracional, valor en efectivo, elección de canje y relevancia.
Los investigadores afirman:
“Estos factores representan un total del 68,2 % de la variación”, pero esa “Conveniencia” surgió como la dimensión más importante para el Programa de recompensas de tarjetas de crédito, que explica el 19,28 % de la variación”.
Por lo tanto, parece que el refuerzo en forma de incentivos en efectivo no fue el factor más importante que impulsó el comportamiento del consumidor, sino que la conveniencia fue lo más importante.
3. Programas de fidelización
Un programa de fidelización está diseñado para aumentar el comportamiento de compra de los clientes existentes. Los programas de lealtad existen en muchas industrias impulsadas por el consumidor, como aerolíneas y hoteles, además de restaurantes y marcas de moda y cosméticos de alta gama.
Aunque hay algunas variaciones, muchas veces la estructura de recompensas está en un programa de refuerzo continuo: cada vez que el cliente realiza una compra, recibe una recompensa.
Algunos programas utilizan un cronograma de proporción fija, de modo que el cliente alcance un cierto umbral de gasto antes de recibir una recompensa. Cada empresa adapta su sistema a su perfil único de cliente.
David Feldman escribe:
“La moneda real de cualquier programa de fidelización radica en su capacidad para impulsar cambios en el comportamiento del consumidor”.
Según Feldman, la mayoría de las empresas utilizan varias estrategias subyacentes para aumentar la frecuencia de las visitas, realizar mayores compras por visita y mejorar la afinidad con la marca.
4. Refuerzo Continuo en el Aula
Los programas de refuerzo pueden ser particularmente efectivos cuando se aplican en el aula con niños que tienen dificultades de aprendizaje.
El video de arriba muestra a un maestro trabajando con un niño en edad de jardín de infantes con una discapacidad de aprendizaje. El La lección es sobre los colores. El maestro coloca dos hojas de papel de colores frente al niño y le pide que "entregue" uno de los colores.
La respuesta correcta del niño es recompensada en un horario continuo. Es decir, cada vez que el niño selecciona el papel correcto, el maestro lo premia con elogios verbales y un enérgico gesto de contacto físico.
El refuerzo también se aplica después de otros comportamientos objetivo deseados, como renunciar a los juguetes durante un descanso para que la instrucción pueda continuar.
5. Refuerzo Continuo y Saciedad del Hambre
Skinner realizó gran parte de su investigación sobre el condicionamiento operante utilizando varios animales como ratas y palomas. Diseñó una Caja de Skinner que le permitiría cambiar el programa de refuerzo y examinar los efectos en el comportamiento.
En el video anterior, se demuestran los efectos de la saciedad del hambre. Una rata tiene hambre y la otra rata está saciada.
Cuando se colocan en dos cajas de Skinner separadas, el comportamiento de las dos ratas es bastante diferente. La rata hambrienta es muy activa y explora los alrededores. La rata saciada está letárgica y no explora.
Después de varios minutos, la rata hambrienta presiona una barra y descubre que se le entregará comida. Toma algunas repeticiones, pero la rata aprende rápidamente que presionar la barra ofrece una recompensa.
El comportamiento de presionar la barra se recompensa con un programa de refuerzo continuo. El comportamiento se adquiere rápidamente una vez que la rata percibe la contingencia.
Conclusión
El refuerzo continuo se refiere a entregar una recompensa después de cada instancia de un comportamiento objetivo. Esto conduce a una rápida adquisición del comportamiento.
El refuerzo continuo de la conducta se produce en la vida cotidiana, como cuando una persona amable saluda a los demás con una sonrisa o cuando los padres recompensan a sus hijos por leer.
Los maestros aplican un refuerzo continuo cuando los estudiantes se desempeñan bien en las pruebas de ortografía, dan respuestas correctas en clase o cuando trabajan con niños con problemas de aprendizaje.
Resulta que los estudios de neuroimagen han revelado que jugar videojuegos activa áreas de recompensa en el cerebro, lo que puede explicar en parte por qué son tan adictivos.
Muchas industrias de consumo implementan programas de refuerzo continuo para recompensar el comportamiento del consumidor, aumentar el gasto y generar lealtad a la marca.
Referencias
Banerji, R. y Farooqi, R. (2017). Factores importantes del programa de recompensas de tarjetas de crédito: la perspectiva de los consumidores en la nueva economía. Revisión comercial de GD Goenka, 2, 20-27. https://doi.org/10.2139/ssrn.3039327
Ferster, CB y Skinner, BF (1957). Horarios de refuerzo. Nueva York: Appleton-Century-Crofts.
Gris, P. (2007). Psicología (6el ed.). Worth Publishers, Nueva York.
Jablonsky, SF y DeVries, DL (1972). Principios del condicionamiento operante extrapolados a la teoría de la gestión. Comportamiento Organizacional y Desempeño Humano, 7(2), 340-358.
Lorenz, R., Gleich, T., Gallinat, J. y Kühn, S. (2015). Entrenamiento de videojuegos y el sistema de recompensas. Fronteras en la neurociencia humana, 9, artículo 40, 1-9. https://doi.org/10.3389/fnhum.2015.00040
Skinner, BF (1965). La ciencia y el comportamiento humano.. Nueva York: Prensa libre.
Thorndike, EL (1898). Inteligencia animal: un estudio experimental de los procesos asociativos en animales. The Psychological Review: suplementos de monografías, 2(4)
Thorndike, EL (1905). Los elementos de la psicología.. Nueva York: AG Seiler.
Deja una respuesta