sábado, 1 de agosto de 2009

El neoconductismo (condicionamiento operante) de Edward Thorndike (1874-1949)

El neoconductismo (condicionamiento operante) de Edward Thorndike (1874-1949)
La idea de que el placer y el dolor, como consecuencia de nuestros actos, son determinantes importantes de la conducta humana, tiene antecedentes históricos significativos en la evolución de la Psicología.
Esta idea constituye la base de la teoría del Hedonismo, que desarrolló Jeremy Bentham, ya en el siglo pasado. Este concepto nos indica que los seres vivos pareciera que tienden a realizar aquellas cosas que proporcionan placer y a evitar las que ocasionan displacer o dolor.
Es precisamente este concepto, el punto axiomático de partida de Edward Thorndike, pionero en la experimentación con animales. El, en situación de laboratorio, le presentaba a los animales ciertos problemas estandarizados y observaba cuidadosamente como los resolvían. En 1898 publicó un trabajo llamado “Inteligencia animal”, en donde dio cuenta de dos aspectos centrales de su trabajo:
a) La cuidadosa observación controlada de la conducta animal.
b) El fortalecimiento gradual de los enlaces estimulo-respuesta, acuñando su conocida “Ley de Efecto”.
“Ley de Efecto”:el gato y el salmón rosado.
Esta Ley establecía que la fijación de las conexiones estímulo- respuesta, dependía no simplemente del hecho de que el estímulo y la respuesta se presentaran juntos (condicionamiento clásico) sino por los efectos que seguían a la respuesta.

Uno de sus estudios mas citados es el de los gatos en una jaula de experimentación: se encerró a un gato deprivado de alimentos (hambriento) dentro de una jaula y por fuera se colocó un trozo de pescado.
El gato podía abrir la puerta de la jaula si tiraba de una soga que colgaba del interior de la jaula. Al comienzo, los gatos recurrían a diversas conductas: caminar o pasearse, arañar etc., hasta que tiraba de la soga, se habría la puerta, y podía comer el pescado.
Los sucesivos ensayos, disminuían considerablemente el tiempo hasta que el gato jalaba la cuerda. Este fenómeno, no implicaba (necesariamente) la “comprensión inteligente” del problema a resolver, sino el “aprendizaje gradual de la respuesta correcta”.
Los aprendizajes se producen entonces, por las recompensas (satisfactorias o no) obtenidas.
Nuestro interés en mencionar Thorndike, es que al igual que Watson, se trata de un iniciador en la Psicología objetiva, y con su Ley del Efecto se convirtió en el primer teórico de refuerzo, aunque ciertamente su trabajo se caracterizó por la asistematicidad, ya que enunció varios postulados que no siempre guardan consistencia y coherencia entre sí.
El neoconductismo: W. F. Skinner y los reforzadores. (1904)
Skinner se opone activamente a aquellos aspectos de la teoría que implican suposiciones acerca de entidades o procesos humanos que no se puedan observar, clasificar y medir. Pone énfasis en la descripción positivista de la conducta, y en varias coacciones refleja el pensamiento de que las teorías psicológicas no debieran ser más que enunciados sobre hechos que expresan la relación experimentalmente observada entre las variables comportamentales dependientes y las variables ambientales independientes.
Rechazó la teoría hipotética deductiva, con sus axiomas explícitamente establecidos y su derivación formal de consecuencias lógicas.
El trabajo científico debiera ser, en su opinión, poder descubrir y describir leyes, nacidas de la observación experimental (método inductivo).
La descripción de las leyes del comportamiento no requieren explicaciones “mentalistas, o subjetivas”, el contenido psíquico debe ser descripto en términos de comportamiento observable.
Su rigurosa descripción del comportamiento y las contingencias que lo afectan, en combinación con su talento para la invención técnica fue una importante contribución al campo de la psicología del comportamiento, contribuyendo de este modo a un sistema de pensamiento: el neoconductismo, cuyos principios esenciales son utilizados de modo fértil en vastos campos de la vida social: el estudio de los sistemas enseñanza / aprendizaje, elementos de control social, publicidad/ propaganda, etc.

Dos tipos de conducta dos
En el análisis del comportamiento humano, Skinner distingue dos tipos de conducta:
a) La conducta respondiente.
Este tipo de conducta es producida por estímulos específicos, y está formada por las conexiones de estímulos / respuesta, denominados reflejos. El ser humano nace con cierto número de reflejos y se adquieren otros a través del proceso de condicionamiento, es decir del proceso de asociaciones de estímulos ya descripto precedentemente (condicionamiento clásico: un nuevo estímulo es apareado con aquel que ya produce la repuesta, y luego de varios apareamientos, el nuevo estímulo llega a producir la misma respuesta). El organismo produce una conducta refleja específica ante la aparición de estímulos específicos.
b) La conducta operante.
La conducta operante, es a entender de Skinner el tipo de comportamiento más general o universalizado que posee el ser humano.
Se caracteriza porque el comportamiento, opera sobre el medio ambiente. El estudio de la conducta humana desde ésta perspectiva se basa fundamentalmente en el análisis de las ralaciones recíprocas del individuo con su medio, a partir de las diversas acciones que éste ejerce sobre el mismo. Las respuestas del medio a su vez alteran la frecuencia de la conducta, orientándola en un sentido u otro.
Toda acción del individuo sobre el medio, es considerada una operante y puede ser modificada por las consecuencias que el mismo medio devuelve.
Dos tipos de reforzadores dos
El aprendizaje de la conducta operante, se produce también por un proceso de condicionamiento, en donde la consecuencia de dicha operante adquiere un rol fundamental. A estos efectos (consecuencias) Skinner los define como reforzadores. Son éstos (los reforzadores) los que modelan o condicionan la conducta humana.
Se distinguen dos tipos de reforzadores:
a) Positivos
Los reforzadores positivos, potencian o aumentan la probabilidad de que una conducta aparezca frecuentemente.
b) Negativos
Los reforzadores negativos son estímulos adversos, los que el individuo trata de evitar, y potencian o determinan la evitación o el alejamiento del estímulo producido.
Es necesario hacer notar que tanto el refuerzo positivo como el negativo, aumentan la probabilidad de aparición de una conducta, (de acercamiento en el primer caso y de evitación en el segundo).
Los reforzadores pueden clasificarse por su procedencia en:
a) Primarios. son aquellos que tienen propiedad reforzante de modo innato: alimentación (comer y beber), dolor, sexo, etc.
b) Secundarios. aquellos que tienen valor social: posesiones (materiales o espirituales) honor, estima o aprecio, etc
Debe quedar claro que los reforzadores no tienen por sí mismos, de modo intrínseco, la propiedad reforzante de modo universal, ya que cada individuo por sus particularidades que lo definen, es sensible o proclive a ser especialmente estimulado por ciertos factores y no por otros. Por ende, las conductas se potencian o no de acuerdo al efecto que produce sobre el medio y por el tipo de sujeto que la ejecuta, en la cual cumple un rol protagónico el reforzador que es como ya vemos un potenciador o debilitador de conductas.
La cajita del horror: los programas de reforzamiento
La investigación de Skinner, se realizó casi enteramente en una u otra versión de un aparato que es conocido como Caja de Skinner. Esta varía de tamaño y de forma de acuerdo con el organismo que se estudia, pero en lo fundamental es una caja (o habitáculo) que contiene un manipulador (palanca, llave o botón, etc. que el sujeto puede manipular) y un dispositivo electrónico que entrega los reforzadores cuando el manipulador es tocado o estimulado.
El mecanismo que proporciona los reforzadores (en el caso de animales) da una especie de alimentación (comida o bebida), o también la visión de otros animales, (a los cuales no se les permitió ver por bastante tiempo), o la producción o eliminación de descargas eléctricas.
El principio fundamental sobre el que opera la caja, es que las respuestas al manipulador producen reforzadores.
Estas respuestas se llaman operantes libres, dado que el sujeto de experimentación es libre de emitirlas con su velocidad propia lo que configura una tasa de respuesta (cantidad de emisiones u operantes en determinada cantidad de tiempo, ej.: tocar el manipulador diez veces por minuto).
Skinner se interesó particularmente por la tasa de emisión de operantes libres, quedando así diversos modos o formas de reforzamiento. Estos se denominan Programas de reforzamiento.
EI programa más simple es el refuerzo continuo, en el cual se da un reforzador (comida, etc.) para cada respuesta al manipulador. Este programa se utiliza generalmente cuando se entrena al sujeto en el empleo del manipulador. Después que aprendió el uso de éste, el Programa es desplazado a alguna forma de refuerzo intermitente, en el cual sólo parte o alguna de las respuestas son seguidas por el refuerzo.
Si la frecuencia con la que se presentan los reforzadores depende la tasa o cantidad de respuestas, éste se llama programa de razón.
Si depende solamente del paso del tiempo se llama Programa de Intervalo.
¿Puede programarse a un ser humano?
Ambos programas pueden ser además fijos o variables, lo que nos da cuatro tipos de programas:
Programa de razón fija: el sujeto es reforzado después de cada cierta cantidad de respuestas (ej.: reforzar toda décima o quinta u octava respuesta).
Programa de razón variable: se refuerza un promedio de respuestas según sean las características de las mismas. De éste modo, los reforzadores se aplican de acuerdo a un cierto promedio de respuestas, ej.: cada tres, cinco, o diez etc. según sea la necesidad de la experimentación
Programa de intervalo fijo: después que se entregó un reforzador, tiene que transcurrir un intervalo fijo de tiempo, antes que se entregue otro. Una vez pasado este intervalo será reforzada la primera respuesta al manipulador. De este modo el sujeto obtiene un reforzador solamente luego de haber transcurrido el tiempo estipulado, independientemente del número de respuestas al manipulador dadas en el intervalo de tiempo designado.
Programa de intervalo variable: es posible obtener el reforzador algunas veces más pronto y otras mucho tiempo después que el anterior. Ej. : en un programa de intervalo variable de dos minutos, después de la presentación de un reforzador el tiempo medio de entrega de otro sería de dos minutos, pero en cualquier ocasión particular, el intervalo puede acortarse o alargarse. Por consiguiente, el único medio para estar seguro de conseguir todos los reforzadores disponibles lo mas pronto posible, sería responder continuamente.
Hay quienes afirman que se ha demostrado que los programas variables potencian e incrementan la tasa de conductas más que los fijos. Se puede observar, como ejemplo, el caso de los “chamanes” que cantan y rezan oraciones para que llueva. Tarde o temprano va a llover y ésto refuerza la conducta de orar y cantar. Skinner sostiene que es justamente la variación en el intervalo de los refuerzos lo que produce que se incremente la emisión sostenida de conductas.
Ser hombrecillo de Indias : Intento de aplicaciones del condicionamiento operante en el campo de la comunicación visual y de la educación. ¿Mito o verdad?
La utilización de los diferentes programas de refuerzo han permitido uno de los objetivos más importantes de la corriente conductista: el moldeamiento o modelado de la conducta, que facilita producir cambios y orientar a ésta en un sentido u otro.
Skinner era un convencido que cualquier ser humano puede llegar a ser lo que es en su vida social, de relaciones, sus modos de comunicarse, trabajar, consumir etc. por el tipo de reforzamientos recibidos a lo largo de su desarrollo.
A modo de resumen (no exhaustivo) se exponen algunos de los modos utilizados a fin de producir la variación de la conducta.
Extinción: se logra extinguir una conducta determinada por medio de la supresión del refuerzo positivo que la mantenía vigente. Ej.: no responder, ni mimar, ni tocar a un bebe que llora apenas se lo acuesta; con el transcurso de una semana se producirá la extinción de la respuesta de llanto ante el hecho de ser acostado.
Imitación Social: se logra aplicando refuerzos positivos a figuras destacadas, notorias o públicas, a fin de que el sujeto imite su comportamiento bajo la expectativa de poseer o alcanzar los mismos reforzadores.
Este modo es ampliamente utilizado en los medios masivos de comunicación, en donde se observa que para lograr estatus, dinero, amor (refuerzos positivos) es necesario consumir determinado producto, o en tal caso para ser más preciso, un consumo determinado (operante libre) lleva como consecuencia obtener el refuerzo positivo (amor, dinero, fama etc.)
Aprendizaje discriminativo: utiliza refuerzos positivos para recompensar las respuestas o conductas deseadas, y refuerzos negativos para “castigar” las respuestas o conductas no deseadas.
Este modo se utiliza ampliamente en los diseños y prácticas de enseñanza a distancia, o por intermedio de maquinarias en donde las respuestas y conocimientos correctos son reforzados positivamente y los errores o desconocimiento son reforzados negativamente.
Es de mencionar también en éste orden, que gran parte de las estrategias y métodos docentes contemporáneos están aún significativamente influenciados por el modo descripto.
Modelado de la conducta por aproximación sucesiva en las psicoterapias
Método empleado para lograr que aparezcan conductas inexistentes en el repertorio conductual del sujeto, para lo cual se requieren ciertos pasos secuenciales y ordenados. Este tipo de programa implica el reforzamiento positivo de las respuestas seleccionadas que se aproximen al o los objetivos deseados, y el no reforzamiento (o reforzamiento negativo) de las que no vayan en esa dirección. Este método es ampliamente utilizado por los especialistas en el campo de la Psicología Clínica, que se proponen la instauración de conductas inexistentes en los sujetos (hablar, asearse, vestirse, etc.) que son portadores de patologías de consideración.
Condicionamiento evitativo: se basa en la extinción de la conducta no deseada (o que impida un ajuste con el medio social) a partir del uso (aplicación) de reforzadores negativos. En general todo el sistema punitivo Legal se basa en éste tipo de condicionamiento.
Si paso un semáforo en rojo con mi automóvil (conducta no deseada o desajustada), me imponen una multa económica (refuerzo negativo). Si alguien transgrede una norma de convivencia escolar o educativa (conducta no deseada), se aplican amonestaciones, o eventualmente se sufre la expulsión total de sistema (refuerzo negativo).

Consideraciones Finales :que no te laven el cerebro con Champú Skinner
Afirman que las posibilidades que se abren a partir del uso adecuado de los refuerzos positivos y negativos, son amplias y variadas. Como ya se ha percibido algunos psicólogos creen que puede ser utilizado para modelar conductas desde las instituciones pedagógicas, hasta las correctivas o carcelarias; desde el seno familiar, hasta su uso en los medios masivos de comunicación. Aseveran que toda conducta es pasible de ser modelada y/o encausada. ¿Uds. que piensan? ¿Qué noción de sujeto orienta a Skinner? Reflexionen acerca de las diferencias entre el psicoanálisis y las corrientes conductistas.
Skinner no pretendió ser un gran teórico, terreno en el cua1 se manejó con cierto sentido anárquico. Su mayor énfasis lo dirigió a controlar experimentalmente la conducta, sea humana o animal. Ese control se lograría, bajo ésta óptica, por el manejo de las contingencias ambientales (refuerzos positivos y negativos) ya mencionados.
Pese a la importante contribución en el campo de la Psicología contemporánea, hay ciertos temas, que aún habiendo sido explicados bajo su enfoque, han sido cuestionados, cuando no objetados en forma categórica, tal el caso de la génesis del lenguaje o como él le llama “comportamiento verbal”.

No hay comentarios:

Publicar un comentario