Refuerzo Parcial: Ejemplos y Definición (Psicología)
El reforzamiento parcial es un programa en el que la conducta objetivo deseada se recompensa solo una parte del tiempo.
Un programa parcial o “intermitente” tiende a ser más resistente a la extinción que un programa de refuerzo continuo.
Por ejemplo, si un niño espera un regalo cada vez que obtiene una A en su tarea, puede perder el entusiasmo por los regalos porque la respuesta al estímulo se convierte en una expectativa en lugar de un regalo.
Pero si reciben el regalo solo algunas veces obtienen una A, la emoción existirá cada vez, lo que significa que se mantiene la respuesta al estímulo (excitación).
Definición de refuerzo parcial
El refuerzo parcial es parte de los principios de condicionamiento operante de BF Skinner (1965) y se utiliza para moldear o modificar la conducta. Se refiere a un reforzamiento intermitente que sigue a un comportamiento deseado (a diferencia del reforzamiento regular).
El programa de refuerzo parcial a menudo se usa después de que ya se ha adquirido un comportamiento para mantener la respuesta al estímulo (como con el ejemplo de regalo anterior). El reforzamiento parcial fortalece el comportamiento deseado y lo hace menos susceptible a la extinción.
Los principios del condicionamiento operante de Skinner se basaron en la Ley del efecto de Edward Thorndike (1898; 1905). Gray (2007) proporciona una excelente definición de la Ley del Efecto:
“Las respuestas que producen un efecto satisfactorio en una situación particular tienen más probabilidades de volver a ocurrir en esa situación, y las respuestas que producen un efecto incómodo tienen menos probabilidades de volver a ocurrir en esa situación” (p. 106).
Ejemplos de refuerzo parcial
- A veces dando estrellas doradas por el comportamiento correcto: Un maestro quiere recompensar a sus alumnos por su buen comportamiento, pero no quiere que ellos esperen una recompensa por actuar como deberían. Entonces, las estrellas doradas se otorgan en un horario parcial.
- Comisiones de ventas: Una empresa otorga una comisión al final de cada mes o trimestre en función del volumen de ventas del vendedor durante ese período de tiempo.
- Pruebas sorpresa: Cuando un maestro da pruebas aleatorias, está recompensando a los estudiantes por estudiar en un horario parcial porque los estudiantes a veces estudian y otras veces no.
- Atraer clics en línea: Cada miembro del equipo de marketing recibe una pequeña bonificación por cada 10.000 clics en el anuncio publicitario de la empresa.
- Café Gratis: Una cafetería entrega a cada cliente una tarjeta para realizar un seguimiento de sus compras. Después de 10 cafés, obtienen uno gratis.
- Sueldo quincenal: A muchos trabajadores de comida rápida se les paga cada dos semanas. Por lo tanto, su comportamiento no es recompensado continuamente, sino solo después de que haya transcurrido un cierto período de tiempo.
- Comprobación de "Me gusta" en FB: A veces, se recompensa comprobar la publicación de FB de uno en busca de "me gusta", pero a veces no.
- Comprobación del acondicionamiento de los atletas: Un entrenador hace que los jugadores entren durante la temporada baja de 4 meses en momentos aleatorios para verificar su acondicionamiento.
- Tarea gratificante: Algunos padres recompensan a sus hijos por hacer la tarea en momentos aleatorios durante la semana para mantenerlos alerta.
- Hacer preguntas en clase: Un profesor tiene la costumbre de dirigir preguntas a estudiantes seleccionados al azar durante la clase. Esto significa que a veces son recompensados por estar preparados y otras veces no.
- Venta de galletas Girl Scout: A veces, varias casas seguidas comprarán una caja o dos de galletas y, a veces, parece que una cuadra entera no está interesada.
Tipos de refuerzo parcial
1. Refuerzo de relación fija (FR)
En un programa de refuerzo de proporción fija, una respuesta se refuerza con una recompensa o un castigo después de que se haya producido un número determinado de respuestas.
Por ejemplo, con una proporción fija de 4, cada 4 veces que ocurra el comportamiento, se proporcionará una recompensa. Esto sucede comúnmente en las cafeterías, donde los clientes leales obtienen sus 10el café gratis.
Como se muestra en el ejemplo anterior, los refuerzos de proporción fija recompensan la consistencia, la confiabilidad y la lealtad.
2. Refuerzo de proporción variable (VR)
En un programa de reforzamiento de razón variable, una respuesta se refuerza después de que haya ocurrido un número impredecible en lugar de establecido de instancias del comportamiento.
Este tipo de refuerzo se usa comúnmente en las máquinas tragamonedas, donde el jugador gana después de un número incierto de intentos. La incertidumbre mantiene a la persona que presiona el botón esperando que “¡la próxima vez gane!”.
3. Refuerzo de intervalo fijo (FI)
Los refuerzos de intervalo se refieren a refuerzos que ocurren después de que ha pasado una cantidad de tiempo en lugar de una cantidad de instancias del comportamiento. Por ejemplo, ocurrirían después de X cantidad de días.
En un programa de reforzamiento de intervalo fijo, la respuesta se refuerza con una recompensa después de que haya pasado una cantidad determinada de tiempo desde el último reforzamiento. Un buen ejemplo de esto es un aumento de sueldo anual en el trabajo. Los empleados sabrían que esto viene cada 1 de enero.calle (¡si cumplen con sus KPI!)
Este refuerzo es más predecible que el de intervalo variable, que se explica a continuación.
4. Refuerzo de intervalo variable (VI)
En un programa de reforzamiento de intervalo variable, una respuesta se refuerza después de una cantidad de tiempo impredecible para mantener a la persona (o al animal) alerta.
El intervalo entre refuerzos tiende a variar, pero a menudo se mantiene dentro de un rango promedio.
Un ejemplo de este tipo de refuerzo parcial son los exámenes sorpresa. El profesor puede decirles a los estudiantes que pronto habrá un examen sorpresa, pero los estudiantes no saben cuándo será el próximo examen, por lo que deben estar preparados en todo momento.
Refuerzo Parcial vs Refuerzo Continuo
Criterios | Refuerzo Parcial | Refuerzo Continuo |
Definición | Un programa de refuerzo donde una respuesta solo se refuerza algunas veces, en lugar de cada vez que ocurre. | Un programa de refuerzo donde una respuesta se refuerza cada vez que ocurre. |
Tipos | Relación fija, relación variable, intervalo fijo, intervalo variable | N / A |
Velocidad de aprendizaje | Aprendizaje inicial más lento, ya que el refuerzo no es consistente. | Aprendizaje inicial más rápido, debido al refuerzo constante. |
Resistencia a la extinción | Mayor resistencia a la extinción, ya que la conducta aprendida persiste incluso cuando ya no se proporciona refuerzo. | Menor resistencia a la extinción, ya que es más probable que el comportamiento cese cuando ya no se proporciona refuerzo. |
Ejemplos | Máquinas tragamonedas (proporción variable), concursos sorpresa (intervalo variable) | Entrenar a un perro para que se siente dándole una golosina cada vez que se sienta |
Solicitud | Útil para mantener un comportamiento a largo plazo y promover la persistencia, a menudo visto en los hábitos de juego, ventas y estudio. | Eficaz para enseñar nuevos comportamientos y garantizar la rápida adquisición de habilidades, a menudo visto en el entrenamiento de animales y en las primeras etapas de aprendizaje. |
Efecto psicológico | Puede conducir a una mayor persistencia y una mayor resistencia a la extinción debido a la imprevisibilidad del refuerzo. | Puede conducir a una fuerte asociación entre el comportamiento y el refuerzo, pero también puede resultar en una menor persistencia cuando ya no se proporciona el refuerzo. |
Casos de Estudio de Refuerzo Parcial
1. Máquinas tragamonedas
Las máquinas tragamonedas pueden ser uno de los mejores ejemplos de un programa de refuerzo parcial que fortalece el comportamiento y lo hace altamente resistente a la extinción. La probabilidad de un pago está programada con una precisión asombrosa.
Aunque cada máquina se puede programar de forma independiente, por lo general se adhieren a un relación variable (VR) programa de refuerzo.
Esto significa que se necesita un número impredecible de palancas para obtener una recompensa.
Por ejemplo, una máquina puede configurarse en un programa VR-120. Eso significa que, en promedio, producirá un pago por cada 120 veces jugadas.
Sin embargo, debido a que es un programa de razón variable, la cantidad real de veces que se necesita para obtener un pago cambiará. Una vez podría estar en 90, una vez podría estar en 55 y otra vez podría estar en 155.
Pero, el promedio de todos a largo plazo será igual a 120.
2. Mantener a los jóvenes estudiantes enfocados
Los estudiantes siempre tienen problemas para mantener el enfoque. Esto es especialmente cierto cuando se trata de jóvenes estudiantes. Los niños pequeños se distraen tan fácilmente que a veces parece casi imposible mantenerlos concentrados.
Riley et al. (2011) aplicaron un programa de reforzamiento parcial denominado programa de intervalo fijo (FT) a dos estudiantes identificados por su maestro por tener un tiempo especialmente difícil para mantenerse enfocados.
El programa de intervalo fijo significa que el comportamiento objetivo se refuerza después de que haya transcurrido un período de tiempo específico.
En primer lugar, los investigadores registraron los comportamientos de los niños dentro y fuera de la tarea durante un período de referencia. A continuación, el profesor aplicaba refuerzos al final de cada 5 minutos.
Este refuerzo tomó la forma de ofrecer elogios por el comportamiento en la tarea o redirigir la atención del estudiante por el comportamiento fuera de la tarea.
Los autores concluyeron que:
“Este estudio demuestra que la prestación de atención FT puede ser una estrategia eficaz que se utiliza para aumentar los comportamientos en la tarea y disminuir los comportamientos fuera de la tarea de los estudiantes con un desarrollo típico” (p. 159).
3. Tasas de éxito de los depredadores
La tasa de éxito de algunos de los depredadores más feroces del planeta es bastante baja. Mientras que la tasa de éxito de las criaturas más dóciles, como el gato doméstico, es bastante alta.
Desde una perspectiva de condicionamiento operante, la recompensa opera en un programa de razón variable (VR). El número de intentos de ganar comida variará.
Por ejemplo, un guepardo puede tener que perseguir a su presa 20 veces antes de ser finalmente recompensado. Pero luego, la próxima vez, tienen éxito.
Dado que el guepardo no tiene forma de predecir cuándo tendrá éxito o no, debe esforzarse cada vez. Lo mismo ocurre con todos los animales salvajes porque el éxito está en un programa de refuerzo parcial.
4. Ayudar a los niños con trastornos emocionales y del comportamiento
Los niños con trastornos emocionales y conductuales graves suelen ser colocados en un programa de tratamiento diurno especializado o en un hospital. Esto les permite recibir la atención adicional y la instrucción que necesitan.
Rasmussen y O'Neill (2006) implementaron un programa de reforzamiento de tiempo fijo (FT) para disminuir el comportamiento disruptivo de los niños en estos programas.
FT significa que el comportamiento fue recompensado solo después de que transcurrió un período de tiempo específico.
El estudio incluyó a tres niños de 8 a 12 años de edad que formaban parte de un salón de clases de tratamiento diurno con otros siete a nueve estudiantes.
El salón de clases contenía un maestro de educación especial y dos técnicos psiquiátricos.
Los estudiantes participaron en actividades académicas regulares como escritura, matemáticas o estudios sociales durante tres o cuatro sesiones de 10 minutos cada día, 5 días a la semana.
El maestro principal brindaba elogios verbales o una palmadita en el brazo cada 10 o 20 segundos cuando el estudiante mostraba el comportamiento deseado. Los comportamientos disruptivos fueron ignorados.
El impacto en el comportamiento disruptivo fue significativo:
“La implementación de los cronogramas FT resultó en disminuciones inmediatas, sustanciales y estables para todos los participantes” (p. 455).
5. Hábitos de trabajo del Congreso de EE.UU.
El Congreso de los EE. UU. trabaja en un horario de intervalo fijo (FI). Tienen vacaciones en momentos específicos durante el año, lo que les sirve como recompensa.
Una característica interesante de este horario se conoce como el "patrón festoneado" de comportamiento. Simplemente significa que después de cada recompensa, el comportamiento disminuye ligeramente y luego aumenta a medida que se acerca el siguiente intervalo de recompensa.
Critchfield et al. (2003) analizó el comportamiento del Congreso de los Estados Unidos durante un período de 52 años, de 1949 a 2000.
Resulta que la productividad aumentó a medida que se acercaba el tiempo de vacaciones. Después de regresar de las vacaciones, la productividad era baja y luego aumentaba gradualmente a medida que se acercaba el próximo período de vacaciones.
“En todos los años encuestados, se promulgaron pocos proyectos de ley durante los primeros meses de cada sesión, y el total acumulado tendió a acelerarse positivamente a medida que se acercaba el final de la sesión. A lo largo de más de medio siglo, entonces, se han promulgado proyectos de ley en un patrón festoneado distinto en cada sesión de cada Congreso” (p. 468).
Conclusión
Un programa de refuerzo parcial implica entregar una recompensa después de un período de tiempo o número de comportamientos impredecible. Esto generalmente resulta en una lenta adquisición del comportamiento, pero una vez establecido, es altamente resistente a la extinción.
Los programas de refuerzo parcial aparecen de muchas formas en nuestra vida cotidiana. Por ejemplo, los maestros y los padres a veces premian a los niños por ser buenos, pero no siempre.
Las empresas a menudo pondrán a su personal de ventas en un horario parcial que los recompensará al final de cada mes o trimestre. Esto motiva al personal a trabajar duro para ganar una comisión o bonificación.
Las máquinas tragamonedas y los depredadores operan en un programa parcial conocido como proporción variable porque el próximo pago es impredecible.
Los niños con y sin problemas de aprendizaje pueden beneficiarse al ser colocados en un horario parcial de refuerzo. Cuando su maestro premia el comportamiento positivo, es más probable que esos comportamientos vuelvan a ocurrir.
Referencias
Critchfield, TS, Haley, R., Sabo, B., Colbert, J. y Macropoulis, G. (2003). Medio siglo de festoneado en los hábitos de trabajo del Congreso de los Estados Unidos. Revista de análisis de comportamiento aplicado, 36(4), 465-486.
Ferster, CB y Skinner, BF (1957). Horarios de refuerzo. Nueva York: Appleton-Century-Crofts.
Gris, P. (2007). Psicología (6el ed.). Worth Publishers, Nueva York.
Jablonsky, SF y DeVries, DL (1972). Principios del condicionamiento operante extrapolados a la teoría de la gestión. Comportamiento Organizacional y Desempeño Humano, 7(2), 340-358.
Rasmussen, K. y O'Neill, RE (2006). Los efectos de los programas de refuerzo de tiempo fijo en el comportamiento problemático de los niños con trastornos emocionales y del comportamiento en un salón de clases de tratamiento diurno. Revista de análisis de comportamiento aplicado, 39453-457.
Riley, JL, McKevitt, BC, Shriver, MD y Allen, KD (2011). Aumentar el comportamiento en la tarea usando la atención del maestro entregada en un horario fijo. Revista de educación conductual, 20(3), 149-162.
Skinner, BF (1965). La ciencia y el comportamiento humano.. Nueva York: Prensa libre.
Thorndike, EL (1898). Inteligencia animal: un estudio experimental de los procesos asociativos en animales. The Psychological Review: suplementos de monografías, 2(4), yo.
Thorndike, EL (1905). Los elementos de la psicología.. Nueva York: AG Seiler.
Deja una respuesta