Conceptos Clave del Condicionamiento y Aprendizaje

Teoría de la Asociación

Aristóteles propuso tres principios de asociación: semejanza, contraste y frecuencia contigua de ideas.

Autocontrol

Autocontrol (frente a impulsividad): Elección de un reforzador grande demorado frente a la elección más natural de reforzadores pequeños inmediatos (impulsividad). El peso de la inmediatez de la recompensa influye normalmente más en la conducta que la magnitud del reforzador (siguiendo el principio de contigüidad temporal). Una forma de contrarrestarlo es demorar, aunque sea brevemente, el reforzador pequeño, resultando en que esperar un poco más para un premio mayor se vuelve más atractivo. El valor de los reforzadores basado en las características de magnitud y demora se puede cuantificar siguiendo un modelo hiperbólico.

Conceptos de Condicionamiento

Bloqueo: Efecto de interferencia que se produce sobre el aprendizaje de una asociación EC-EI debido a un aprendizaje previo.

Clase de estímulos: Estímulos que varían en distintas características físicas pero que tienen el mismo efecto sobre la conducta.

Clase de respuestas: Cualquier forma de ejecución de una conducta que tiene una función similar.

Condicionamiento clásico o pavloviano: Tipo de aprendizaje que se produce cuando se presentan dos estímulos con independencia de la conducta del sujeto.

Condicionamiento de orden superior: Tipo de procedimiento en el que se utiliza un estímulo previamente condicionado para condicionar un nuevo estímulo.

Condicionamiento Excitatorio: Tipo de condicionamiento en el que se da una contingencia positiva entre la aparición del EC y la aparición del EI. La presentación repetida del EI tras el EC provoca una RC similar a la RI.

Condicionamiento Inhibitorio: Tipo de condicionamiento en el que se da una contingencia negativa entre la aparición del EC y la aparición del EI, por lo que el EC no provoca una RC similar a la RI.

Conducta y Conductismo

Conducta de elección: Elegir entre dos opciones. Aplicación de programas de reforzamiento concurrentes.

Conducta elicitada: Conducta que es provocada por estímulos específicos del entorno. Este tipo de conductas pueden ser innatas o aprendidas, como sucede en el condicionamiento clásico.

Conducta supersticiosa: Explicada por Skinner mediante la idea del reforzamiento accidental o adventicio. Otros autores la atribuyen a factores filogenéticos.

Conductismo: Neoconductismo (como en C. L. Hull) y conductismo radical (B. F. Skinner), o la más actual entre conductismo molar y molecular.

Constructos y Procedimientos

Constructo hipotético: No observacional. No se pueden demostrar, no son directamente manipulables y se infieren de la observación de la conducta.

Contracondicionamiento: Tipo de procedimiento que se utiliza para variar o invertir la respuesta condicionada anterior utilizando un EI distinto al utilizado previamente.

Contraste conductual negativo: Disminución de la respuesta que tiene lugar cuando se presenta una recompensa desfavorable con respecto a una experiencia anterior con una consecuencia más favorable.

Contraste conductual positivo: Aumento de la respuesta debido a una recompensa favorable como resultado de la experiencia anterior con una recompensa menos favorable.

Control por el estímulo: Término que se refiere a cómo los estímulos que preceden una conducta pueden controlar la ocurrencia de esa conducta.

Deriva instintiva: Tendencia de algunos animales a mostrar respuestas instintivas que compiten con la respuesta requerida cuando son entrenados mediante procedimientos de condicionamiento operante.

Desplazamiento del máximo: Efecto de interacción entre el control excitatorio e inhibitorio presente en cada estímulo de prueba cuando el entrenamiento de discriminación ha sido intradimensional. El resultado es que el máximo de respuestas no se observa en presencia del E+ original sino ante otro estímulo cuyo valor en la dimensión pertinente se aleja del E+ en dirección opuesta al E-.

Devaluación del reforzador: Procedimiento que consiste en asociar al reforzador que se está utilizando un estímulo o evento de naturaleza contraria. El efecto resultante de este procedimiento es una disminución de la respuesta operante que ha sido reforzada con el reforzador devaluado, aunque esta respuesta nunca haya sido contingente al estímulo aversivo.

Efectos y Tipos de Ensayos

Efecto de tendencia central: Desplazamiento del máximo de respuestas respecto al E+ original como efecto de la distribución respecto a este de los estímulos generalizados presentados. Se observa que el sujeto responde en mayor proporción ante un valor diferente al E+ original que se acerca al valor medio de los estímulos de prueba a los que se le expone.

Ensayos discretos y Operante libre: Se considera que un estudio está utilizando ensayos discretos cuando sólo se permite que la respuesta aparezca una vez por ensayo. De esta manera el experimentador puede controlar el momento y la frecuencia de emisión de la operante. El uso de un método de operante libre implica que el sujeto pueda repetir la respuesta sin restricciones a lo largo de la sesión, sin que el experimentador intervenga al finalizar cada ensayo.

Estímulos y Respuestas

Estímulo Condicional vs. Estímulo Condicionado: Se denominan Estímulos CondicionaDOS a aquellos eventos que han adquirido alguna propiedad elicitadora por su emparejamiento con otro estímulo que ya poseía esa característica, ya sea un Estímulo Incondicionado (EI) u otro Estímulo Condicionado (EC). Los estímulos CondicionaLES, sin embargo, son eventos cuyo control sobre la conducta es operante, no Respondiente (Clásico o Pavloviano). Son aquellos eventos que modifican la función positiva o negativa de los estímulos discriminativos, es decir, los eventos que añaden un término más a la contingencia operante mínima de tres términos, convirtiéndola en condicional.

Estímulo discriminativo vs. Discriminar / Generalizar: Discriminar o generalizar son dos formas de describir el grado en el que ciertos estímulos antecedentes ejercen control sobre determinadas conductas.

Filogenia y Ontogenia: La filogénesis del comportamiento se refiere a los cambios producidos en el repertorio conductual innato de una especie debido a procesos de selección natural. La ontogénesis del comportamiento, sin embargo, alude a los cambios en el repertorio conductual de un individuo generados por su experiencia.

Funciones y Gradientes

Funciones de retroalimentación: Son descripciones de las posibles relaciones existentes entre aspectos ambientales relacionados con la ocurrencia del reforzador (por ejemplo, su frecuencia de ocurrencia) y aspectos de ejecución conductual (como puede ser, por ejemplo, la frecuencia de ocurrencia de la respuesta). Por lo general en los programas de razón se encuentran funciones lineales, mientras que en los programas de intervalo se encuentran funciones hiperbólicas. Las funciones de retroalimentación se corresponden con una explicación molar de las relaciones del ambiente con la conducta.

Gradiente de generalización: Es la representación gráfica del control de un estímulo sobre determinada conducta. Se forma a partir de la respuesta del sujeto ante estímulos que difieren del original solo en el valor de uno de sus rasgos, frecuentemente comprendiendo valores tanto superiores como inferiores. La forma del gradiente aporta información tanto de la naturaleza del control, excitatorio (U invertida) o inhibitorio (U); como de su nivel, alta generalización (plano) o baja (acusado). Los gradientes de generalización se forman a partir de la respuesta observada ante estímulos de prueba que guardan un parecido decreciente con el E+ o el E- en una dimensión (manteniéndose el resto de rasgos constantes). La forma de este gradiente (plano o puntiagudo) nos informa sobre el grado de control que ejerce el E+ o el E- sobre determinada conducta. Por tanto, nos permite determinar tanto el nivel de discriminación como de generalización.

Intervalos y Leyes

ISI e ITI: Se define como intervalo entre estímulos (inter stimulus interval, ISI) al tiempo que transcurre entre la aparición de un determinado estímulo (frecuentemente un EC) y la aparición de otro (frecuentemente un EI). El intervalo entre ensayos (inter trial interval, ITI) es el tiempo que transcurre desde la finalización de un ensayo (al cerrarse el comedero, por ejemplo) y el comienzo del siguiente. Suele ser más largo que el ISI.

Ley de igualación: Es una relación matemática que establece una equiparación entre la tasa relativa de respuesta entre las alternativas existentes en un programa concurrente y la tasa relativa de reforzamiento que acompaña la elección de dichas alternativas de respuesta. La conducta de elección predicha por la ley de igualación se ha visto influida por factores como los sesgos de respuesta y la sensibilidad a las consecuencias de reforzamiento, lo que ha llevado a su reformulación matemática dando lugar a la ley generalizada de la igualación.

Magnitud y Mejoramiento

Magnitud de la RC: Medida del tamaño, vigor o extensión de una respuesta.

Mejoramiento: Teoría propuesta para explicar la elección en programas concurrentes de reforzamiento y basada en la idea de que siempre se responderá para mejorar la tasa local de reforzamiento, dando como resultado la igualación al equipararse las tasas locales de reforzamiento fruto de que a las alternativas de respuesta se les darán respuestas, se obtendrán reforzadores y se les dedicará un tiempo que estarán en proporción al reforzamiento disponible en dichas opciones de respuesta. El mejoramiento es una alternativa teórica que tiene elementos molares y moleculares de explicación de la conducta.

Precondicionamiento y Programas

Precondicionamiento sensorial: Procedimiento que se utiliza para asociar dos estímulos biológicamente débiles.

Preexposición al EC o inhibición latente: Interferencia sobre el aprendizaje de una asociación debida a la preexposición del EC implicado en la misma.

Programas (y teoría) de reforzamiento diferencial de tiempos entre respuestas: Se puede reforzar específicamente que se separen las respuestas entre sí por un tiempo mínimo RDB (un programa de reforzamiento diferencial de tasas bajas de respuesta) o por un tiempo máximo RDA (un programa de reforzamiento diferencial de tasas altas de respuesta), lo que genera respectivamente responder lenta o rápidamente. Este reforzamiento diferencial de los tiempos entre respuestas se piensa que está involucrado en la ejecución de todos los programas de reforzamiento aunque específicamente no se hubiesen programado así, y responde a un tipo de explicación característico de una aproximación teórica molecular (frente a la explicación de tipo molar).

Programas básicos de reforzamiento: Son reglas que determinan cómo se reforzarán las respuestas, destacando cuatro programas fundamentales: razón fija, razón variable, intervalo fijo e intervalo variable. La diferencia entre ellos se basa en el criterio de si se reforzará la respuesta que completa un número determinado de respuestas o la respuesta dada después de haber pasado un tiempo especificado, criterio que tanto en un caso como en otro puede ser fijo o puede variar de una ocasión a la siguiente. Los programas de razón mantienen por lo general tasas de respuesta más altas que los de intervalo, y los programas fijos, a diferencia de los variables, generan pausas post-reforzamiento.

Programas compuestos secuenciales de reforzamiento: Hace referencia a la presentación en sucesión de al menos dos programas básicos de reforzamiento, destacando los programas mixto, múltiple, tándem y encadenado, cuya diferencia radica en cómo se pasa de uno a otro de los programas componentes y si existe señal discriminativa para los mismos.

Pruebas y Respuestas

Prueba del estímulo compuesto o prueba de sumación: Procedimiento de prueba que sirve para identificar un inhibidor condicionado si ese estímulo reduce la respuesta elicitada por un estímulo excitatorio.

Prueba del retraso en la adquisición: Procedimiento de prueba que sirve para identificar un inhibidor condicionado si dicho estímulo necesita más ensayos para adquirir propiedades excitatorias que un estímulo neutro.

Pseudocondicionamiento: Incremento de la respuesta que se da por un proceso no asociativo.

REc: Abreviatura de respuesta emocional condicionada.

Respuesta Condicionada (RC): Respuesta que provoca un EC tras ser asociado a un EI y que generalmente es similar a la RI.

Respuesta condicional (Rc): Respuesta que se obtiene ante el EC tras su condicionamiento.

Respuesta emocional condicionada o supresión condicionada: Supresión de una conducta instrumental apetitiva provocada por la presentación de un estímulo que se ha asociado con un estímulo aversivo.

Respuesta Incondicionada (RI): Respuesta que provoca un EI, sin necesidad de un entrenamiento previo.

Respuesta incondicional (RI): Respuesta que se obtiene tras la presentación de un estímulo sin entrenamiento previo.

Sensibilidad y Teorías

Sensibilidad al reforzador: Estimación de cuanto una característica de reforzamiento influye en su efecto, de manera que no todas las variables que definen a los reforzadores (como su frecuencia o magnitud) contribuyen lo mismo a determinar el valor de los mismos, ni tienen el mismo valor para todos los individuos. Estimar la influencia relativa de una característica de reforzamiento en relación a otras, y con referencia a cada sujeto, es importante para poder determinar las preferencias en pruebas de elección como las de los programas concurrentes. Un parámetro de sensibilidad es incorporado a la ley generalizada de la igualación para poder explicar por qué en ocasiones la mejor alternativa es preferida por encima de lo que objetivamente vale (sobreigualación) y en muchas otras es preferida por debajo de lo que vale (infraigualación).

Teoría de la privación de respuesta: Propuesta teórica que matiza el principio del reforzamiento de Premack al postular que lo único necesario para que una actividad pueda funcionar como reforzadora es restringir su ocurrencia con respecto a su óptimo (ahora denominado punto de bienestar), pero que no es necesario establecer ninguna jerarquía de preferencias para saber si las actividades instrumental y reforzadora son diferencialmente preferidas.

Teoría de la probabilidad diferencial: También conocida como principio de Premack, y por la que se propone que para que una actividad pueda funcionar como reforzadora debe ser preferida sobre la actividad que se quiere reforzar y hacerla posible sólo de forma contingente a la realización previa de la conducta instrumental, para lo cual habrá que restringir su ocurrencia en relación a los niveles óptimos de preferencia (pues si no estuviese restringida dicha actividad no podría funcionar como reforzadora).

Variables y Fórmulas

Variable interviniente o intermedia: Es una variable que no se refiere a factores de causa o efecto pero que modifica (interviene) en las relaciones de otras variables, lo que aplicado a la teoría psicológica sería suponer la intervención de procesos no directamente observables pero que se pueden hacer operacionales con el fin de ser manipulados experimentalmente.

  • ECs excitatorios apetitivos – esperanza
  • ECs excitatorios aversivos – ansiedad
  • ECs inhibitorios apetitivos – tristeza
  • ECs inhibitorios aversivos – alivio

Intervalo entre ensayos ITI: principio 1.er ensayo – principio 2.º ensayo

Intervalo entre estímulos: principio 1.er estímulo – principio 2.º estímulo

Intervalo de huella: final 1.er estímulo – principio 2.º estímulo

Latencia de RC: principio de estímulo – principio respuesta

  • a: si EC – si EI
  • b: si EC – no EI
  • c: no EC – si EI
  • d: No EC – no EI

P1 = a/(a+b). P(EI/EC) probabilidad de que se dé el EI después del EC

P0 = c / (c+d). P(EI/EC) probabilidad de que se dé el EI tras la NO aparición del EC

ΔP = (a/a+b)-(c/c+d). P(EI/EC)+P(EI/noEC) índice resultante del cálculo de la contingencia, puede estar entre -1 y 1

Es positiva si ΔP > 0 / Perfecta si ΔP = 1 / Nula si ΔP = 0 / Negativa si ΔP < 0

Modelo Rescorla-Wagner

ΔV: incremento de la fuerza asociativa entre EC y EI

ΔVn: incremento de la fuerza asociativa entre EC y EI en un ensayo “n”

α β: saliencia del EC y el EI, constantes durante el aprendizaje. Entre 0 y 1.

Habitualmente α (EC) = 0,5 y β (EI) = 1

λ: magnitud del EI. Si detrás del EC aparece el EI λ=1 (asíntota). Si no aparece λ=0

Vn-1: fuerza asociativa entre EC-EI adquirida en el ensayo anterior de condicionamiento. Entre 0 y 1

V = Vn-1 + AVn fuerza asociativa neta

El cálculo del incremento de la fuerza asociativa es por tanto AVn= α β (λ+Vn-1)

ΣVn-1: Se usa cuando hay varios ECs presentados en conjunto, para tener en cuenta la influencia de todos sobre el condicionamiento. La fórmula queda: AV= α β (λ+EVn-1)