En la década de 1920 luego del retiro de John B. Watson del mundo de la psicología académica, los psicólogos, en particular los conductistas estaban ansiosos por plantear nuevas teorías sobre el aprendizaje diferentes a las ya planteadas por el condicionamiento clásico. La más importante entre estas nuevas teorías fue la del condicionamiento operante propuesto por Burrhus Frederic Skinner, más comúnmente conocido como B.F. Skinner.

Skinner fundó su teoría en la simple reflexión de que el comportamiento observable era más factible de estudiar que los procesos mentales internos, los cuales no eran observables.

Las ideas de Skinner fueron mucho menos extremas que los de Watson, aunque consideraba la existencia de la mente, afirmaba que era más productivo estudiar el comportamiento observable que los eventos mentales internos.

El trabajo de Skinner se basó en la visión de que el condicionamiento clásico era demasiado simplista para poder ser una explicación completa del comportamiento humano complejo. Creía que la mejor manera de entender el comportamiento era observar las causas de una acción y sus consecuencias. A este enfoque lo llamo condicionamiento operante.

El aprendizaje y el Condicionamiento operante

B.F. Skinner fue famoso por su investigación pionera en el campo del aprendizaje y el comportamiento.

Propuso una teoría para estudiar el comportamiento humano complejo mediante el estudio de las respuestas voluntarias mostradas por el organismo cuando se ubica en un entorno controlado.

Nombró dichos comportamientos como respuestas operantes. También se le reconoce como el padre del Aprendizaje por condicionamiento operante, basó su teoría en la “Ley de efecto”, descubierta por Edward Thorndike en 1905.

De acuerdo con este principio, es más probable que se repita un comportamiento si este va seguido de consecuencias agradables y menos probable que se repita si las consecuencias son desfavorables.

Skinner introdujo un nuevo término “la Ley de efecto-refuerzo.” La cual fue una modificación de la Ley de Thorndike, según la cual el comportamiento que es reforzado tiende a repetirse (fortalecerse); mientras que el comportamiento que no es reforzado tiende a extinguirse, (debilitarse).

B.F. Skinner propuso su teoría sobre el condicionamiento operante a partir de la realización de varios experimentos con animales. Para ello empleó un artilugio especial diseñado por el mismo, el cual actualmente es conocido como la “Caja Skinner”, utilizó en sus experimentos especialmente ratas de laboratorio.

Primer experimento (Refuerzo positivo)

En uno de sus primeros experimentos, colocó una rata hambrienta dentro de su “caja”.  Al principio la rata estuvo inactiva dentro de la caja, pero gradualmente, a medida que comenzó a adaptarse comenzó a explorar su entorno. Finalmente, la rata descubrió una palanca, la cual al presionarla le proporcionaba comida.

Después que el animal satisfizo su hambre, comenzó a explorar la caja de nuevo, luego de un tiempo, presionó la palanca por segunda cuando volvió a tener hambre. Este fenómeno continuó en repetidas ocasiones, después de un tiempo, la rata aprendió a presionar la palanca cada vez que quería alimentarse, en este punto Skinner consideró que el condicionamiento había sido exitoso.

En este ejemplo, la acción de presionar la palanca es una respuesta/comportamiento operante, y la comida liberada dentro de la cámara es la recompensa.

El experimento también se conoce como Aprendizaje por Condicionamiento Instrumental, ya que la respuesta es fundamental para obtener alimentos.

Este experimento también demuestra y rebela los efectos del refuerzo positivo. Al presionar la palanca, la rata hambrienta fue recompensada con alimento, que el cual satisfizo su hambre; Por lo tanto, se considera como un refuerzo positivo.

Segundo experimento (Reforzamiento negativo)

BF Skinner también realizó un experimento que trataba de explicar el refuerzo negativo.

Skinner colocó una rata en una caja con la misma configuración de la anterior, pero en lugar de emplear el hambre, sometió la caja a una corriente eléctrica desagradable.

La rata que experimentó la incomodidad por la corriente eléctrica comenzó a moverse desesperadamente alrededor de la caja y accidentalmente golpeó la palanca.

Al presionar la palanca se interrumpía inmediatamente el flujo de corriente desagradable. Después de un par de veces, la rata se había vuelto lo suficientemente inteligente como para ir directamente a la palanca para evitar el malestar.

La corriente eléctrica en este caso actuó como refuerzo negativo y escapar de la corriente eléctrica era la motivación para que la rata repitiera la conducta una y otra vez.

En este caso también, la presión de la palanca fue una respuesta operante y la interrupción completa del flujo de corriente eléctrica fue su recompensa.

De hecho, Skinner incluso enseñó a las ratas a evitar la corriente eléctrica al encender una luz justo antes de que se activara la corriente eléctrica. Las ratas pronto aprendieron a presionar la palanca cuando se encendía la luz porque sabían que con esto evitarían la corriente eléctrica.

Estas dos respuestas aprendidas se conocen también como aprendizaje por condicionamiento de escape y evitación.

Como resultado de estos experimentos Skinner identificó tres tipos de respuestas las cuales pueden seguir el comportamiento:

  • Operantes neutrales: respuestas procedentes del entorno las cuales no aumentan ni disminuyen la probabilidad que se repita un comportamiento determinado.
  • Reforzadores: son respuestas provenientes del entorno las cuales incrementan la probabilidad de repetición de un comportamiento. Los reforzadores pueden ser tanto positivos como negativos.
  • Castigos: son respuestas del entorno las cuales disminuyen la probabilidad que se repita un comportamiento. El castigo debilita el comportamiento.

El condicionamiento operante se basa en una premisa bastante simple: las acciones seguidas por una recompensa se reforzarán y es más probable que vuelvan a ocurrir en el futuro.

Por ejemplo, si alguien cuenta una historia divertida en la clase y todos se ríen es más probable que quiera volver a repetir dicha conducta en el futuro.

Si levanta la mano para realizar una pregunta y su maestro elogia su comportamiento, será más probable que levante la mano la próxima vez que tenga una pregunta o comentario.

Debido a que el comportamiento fue seguido por un refuerzo o un resultado deseable, las acciones anteriores se fortalecen.

Al contrario, aquellas acciones que resulten en castigos o consecuencias indeseables se debilitarán y será menos probable que vuelvan a ocurrir en el futuro.

Si el alumno vuelve a contar de nuevo la misma historia en otra clase pero esta ocasión nadie se ríe, será menos probable que quiera repetirla en el futuro.

Si “gritas” una respuesta en clase y el maestro te regaña, entonces es menos probable que vuelvas a interrumpir la clase.

Definición y conceptos básicos

Castigo (debilita el comportamiento)

El castigo se define como lo opuesto al refuerzo, ya que está diseñado para debilitar o eliminar una respuesta en lugar de aumentarla. Es un evento aversivo que disminuye el comportamiento que sigue.

Al igual que el refuerzo, el castigo puede funcionar ya sea aplicando directamente un estímulo desagradable como un shock eléctrico después de una respuesta o eliminando un estímulo potencialmente gratificante, como por ejemplo, rebajando el estímulo económico de alguien para castigar un comportamiento no deseado.

Algunas veces resulta dificil diferenciar entre el castigo y el refuerzo negativo.

Existen algunos inconvenientes al emplear el castigo, tales como:

  • El comportamiento castigado no se deja de lado, solo se suprime, este puede retornar cuando el castigo ya no está presente.
  • Puede aumentar la agresividad: la agresión es una forma de enfrentar los problemas para algunos organismos.
  • Genera temor el cual puede extenderse a comportamientos indeseables, como por ejemplo, miedo a la escuela.
  • No necesariamente conduce hacia el comportamiento deseado: el refuerzo nos indica qué debemos hacer, en cambio el castigo solo le señala lo qué no hay que hacer.

Extinción

Este concepto se emplea para explicar la desaparición de una respuesta aprendida debido a la eliminación del refuerzo del escenario condicionado.

Este concepto en la teoría del condicionamiento operante es similar al del condicionamiento clásico. Por ejemplo; en el experimento de Skinner, la rata podría dejar de presionar la palanca si está ya no recibe su porción de comida.

Generalización y Discriminación.

El fenómeno en el cual un organismo presenta una respuesta similar cuando reacciona a estímulos similares se conoce como generalización.

Un concepto complementario al de generalización es la discriminación, la cual explica una respuesta similar representada por un organismo debido a la diferencia en los estímulos.

Recuperación espontanea

Este concepto se explica cuando en la caja de Skinner la rata es retirada y ya no tiene que presionar la palanca, incluso después de haberla retirado de la caja durante un cierto periodo de tiempo y el comportamiento haberse extinguido, al reintroducir la rata a la caja el comportamiento presenta una recuperación espontanea.

Contenido patrocinado

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.