---
title: "La teoría del Condicionamiento operante de B. F. Skinner"
description: "La teoría del condicionamiento operante explica cómo las acciones y sus consecuencias influyen en el aprendizaje."
url: https://www.actualidadenpsicologia.com/teoria-condicionamiento-operante-skinner/
date: 2019-03-12
modified: 2024-09-26
author: "Carlos Vergara Cano"
image: https://www.actualidadenpsicologia.com/wp-content/uploads/2019/03/Condicionamiento-operante-Skinner.jpeg
categories: ["Conceptos"]
tags: ["Condicionamiento", "Conductismo", "Skinner"]
type: post
lang: es
---

# La teoría del Condicionamiento operante de B. F. Skinner

En la década de 1920 luego del retiro de Watson del mundo de la psicología académica, los psicólogos, en particular los conductistas estaban ansiosos por plantear nuevas teorías sobre el aprendizaje diferentes a las ya planteadas por el condicionamiento clásico. La más importante entre estas nuevas teorías fue la del condicionamiento operante propuesto por Burrhus Frederic Skinner, más comúnmente conocido como B.F. Skinner.

Skinner fundó su teoría en la simple reflexión de que el comportamiento observable era más factible de estudiar que los procesos mentales internos, los cuales no eran observables.

Las ideas de Skinner fueron mucho menos extremas que los de (https://www.actualidadenpsicologia.com/watson-limites-investigacion-psicologia/), aunque consideraba la existencia de la mente, afirmaba que era más productivo estudiar el comportamiento observable que los eventos mentales internos.

El trabajo de Skinner se basó en la visión de que el condicionamiento
clásico era demasiado simplista para poder ser una explicación completa del
comportamiento humano complejo. Creía que la mejor manera de entender el
comportamiento era observar las causas de una acción y sus consecuencias. A
este enfoque lo llamo condicionamiento operante.

## El aprendizaje y el Condicionamiento operante

B.F. Skinner fue famoso por su investigación pionera en el
campo del aprendizaje y el comportamiento.

Propuso una teoría para estudiar el comportamiento humano
complejo mediante el estudio de las respuestas voluntarias mostradas por el
organismo cuando se ubica en un entorno controlado.

Nombró dichos comportamientos como respuestas operantes.
También se le reconoce como el padre del Aprendizaje por condicionamiento
operante, basó su teoría en la "Ley de efecto", descubierta por
Edward Thorndike en 1905.

De acuerdo con este principio, es más probable que se repita
un comportamiento si este va seguido de consecuencias agradables y menos
probable que se repita si las consecuencias son desfavorables.

Skinner introdujo un nuevo término “la Ley de efecto-refuerzo.”
La cual fue una modificación de la Ley de Thorndike, según la cual el
comportamiento que es reforzado tiende a repetirse (fortalecerse); mientras que
el comportamiento que no es reforzado tiende a extinguirse, (debilitarse).

B.F. Skinner propuso su teoría sobre el condicionamiento operante a partir de la realización de varios experimentos con animales. Para ello empleó un artilugio especial diseñado por el mismo, el cual actualmente es conocido como la "Caja Skinner", utilizó en sus experimentos especialmente ratas de laboratorio.

### Primer experimento (Refuerzo positivo)

En uno de sus primeros experimentos, colocó una rata hambrienta dentro de su “caja”.  Al principio la rata estuvo inactiva dentro de la caja, pero gradualmente, a medida que comenzó a adaptarse comenzó a explorar su entorno. Finalmente, la rata descubrió una palanca, la cual al presionarla le proporcionaba comida.

Después que el animal satisfizo su hambre, comenzó a
explorar la caja de nuevo, luego de un tiempo, presionó la palanca por segunda cuando
volvió a tener hambre. Este fenómeno continuó en repetidas ocasiones, después
de un tiempo, la rata aprendió a presionar la palanca cada vez que quería
alimentarse, en este punto Skinner consideró que el condicionamiento había sido
exitoso.

En este ejemplo, la acción de presionar la palanca es una
respuesta/comportamiento operante, y la comida liberada dentro de la cámara es
la recompensa.

El experimento también se conoce como Aprendizaje por
Condicionamiento Instrumental, ya que la respuesta es fundamental para obtener
alimentos.

Este experimento también demuestra y rebela los efectos del
refuerzo positivo. Al presionar la palanca, la rata hambrienta fue recompensada
con alimento, que el cual satisfizo su hambre; Por lo tanto, se considera como
un refuerzo positivo.

### Segundo experimento (Reforzamiento negativo)

BF Skinner también realizó un experimento que trataba de explicar
el refuerzo negativo.

Skinner colocó una rata en una caja con la misma
configuración de la anterior, pero en lugar de emplear el hambre, sometió la caja
a una corriente eléctrica desagradable.

La rata que experimentó la incomodidad por la corriente
eléctrica comenzó a moverse desesperadamente alrededor de la caja y
accidentalmente golpeó la palanca.

Al presionar la palanca se interrumpía inmediatamente el
flujo de corriente desagradable. Después de un par de veces, la rata se había
vuelto lo suficientemente inteligente como para ir directamente a la palanca
para evitar el malestar.

La corriente eléctrica en este caso actuó como refuerzo
negativo y escapar de la corriente eléctrica era la motivación para que la rata
repitiera la conducta una y otra vez.

En este caso también, la presión de la palanca fue una
respuesta operante y la interrupción completa del flujo de corriente eléctrica fue
su recompensa.

De hecho, Skinner incluso enseñó a las ratas a evitar la
corriente eléctrica al encender una luz justo antes de que se activara la
corriente eléctrica. Las ratas pronto aprendieron a presionar la palanca cuando
se encendía la luz porque sabían que con esto evitarían la corriente eléctrica.

Estas dos respuestas aprendidas se conocen también como aprendizaje por condicionamiento de escape y evitación.

Como resultado de estos experimentos Skinner identificó tres
tipos de respuestas las cuales pueden seguir el comportamiento:

- **Operantes
neutrales:** respuestas procedentes del entorno las cuales no aumentan ni
disminuyen la probabilidad que se repita un comportamiento determinado.

- **Reforzadores:**
son respuestas provenientes del entorno las cuales incrementan la probabilidad
de repetición de un comportamiento. Los reforzadores pueden ser tanto positivos
como negativos.

- **Castigos:**
son respuestas del entorno las cuales disminuyen la probabilidad que se repita
un comportamiento. El castigo debilita el comportamiento.

El condicionamiento operante se basa en una premisa bastante simple: **las acciones seguidas por una recompensa se reforzarán y es más probable que vuelvan a ocurrir en el futuro.**

Por ejemplo, si alguien cuenta una historia divertida en la
clase y todos se ríen es más probable que quiera volver a repetir dicha conducta
en el futuro.

Si levanta la mano para realizar una pregunta y su maestro
elogia su comportamiento, será más probable que levante la mano la próxima vez
que tenga una pregunta o comentario.

Debido a que **el
comportamiento fue seguido por un refuerzo** **o un resultado deseable**, las acciones anteriores se fortalecen.

Al contrario, aquellas acciones que resulten en castigos o
consecuencias indeseables se debilitarán y será menos probable que vuelvan a
ocurrir en el futuro.

Si el alumno vuelve a contar de nuevo la misma historia en
otra clase pero esta ocasión nadie se ríe, será menos probable que quiera
repetirla en el futuro.

Si “gritas” una respuesta en clase y el maestro te regaña, entonces es menos probable que vuelvas a interrumpir la clase.

## Definición y conceptos básicos

### Castigo (debilita el comportamiento)

El castigo se define como lo opuesto al refuerzo, ya que
está diseñado para debilitar o eliminar una respuesta en lugar de aumentarla.
Es un evento aversivo que disminuye el comportamiento que sigue.

Al igual que el refuerzo, el castigo puede funcionar ya sea
aplicando directamente un estímulo desagradable como un shock eléctrico después
de una respuesta o eliminando un estímulo potencialmente gratificante, como por
ejemplo, rebajando el estímulo económico de alguien para castigar un
comportamiento no deseado.

Algunas veces resulta difícil diferenciar entre el castigo y el refuerzo negativo.

Existen algunos inconvenientes al emplear el castigo, tales
como:

- El comportamiento castigado no se deja de lado, solo
se suprime, este puede retornar cuando el castigo ya no está presente.

- Puede aumentar la agresividad: la agresión es
una forma de enfrentar los problemas para algunos organismos.

- Genera temor el cual puede extenderse a
comportamientos indeseables, como por ejemplo, miedo a la escuela.

- No necesariamente conduce hacia el
comportamiento deseado: el refuerzo nos indica qué debemos hacer, en cambio el castigo
solo le señala lo qué no hay que hacer.

### Extinción

Este concepto se emplea para explicar la desaparición de una
respuesta aprendida debido a la eliminación del refuerzo del escenario
condicionado.

Este concepto en la teoría del condicionamiento operante es
similar al del condicionamiento clásico. Por ejemplo; en el experimento de
Skinner, la rata podría dejar de presionar la palanca si está ya no recibe su porción
de comida.

### Generalización y Discriminación.

El fenómeno en el cual un organismo presenta una respuesta
similar cuando reacciona a estímulos similares se conoce como generalización.

Un concepto complementario al de generalización es la
discriminación, la cual explica una respuesta similar representada por un
organismo debido a la diferencia en los estímulos.

### Recuperación espontanea

Este concepto se explica cuando en la caja de Skinner la
rata es retirada y ya no tiene que presionar la palanca, incluso después de
haberla retirado de la caja durante un cierto periodo de tiempo y el
comportamiento haberse extinguido, al reintroducir la rata a la caja el
comportamiento presenta una recuperación espontanea.
