Condizionamento operante: meccanismi, rinforzi e implicazioni educative

Classificato in Insegnamento

Scritto il in italiano con una dimensione di 8,72 KB

Condizionamento operante

Il comportamento è uno strumento per raggiungere una ricompensa o una soluzione: ciò che il soggetto desidera.

Nel condizionamento classico il rinforzo si verifica indipendentemente dalla risposta del soggetto, mentre nel condizionamento operante (o strumentale) il rinforzo è una diretta conseguenza del comportamento.

Secondo Thorndike, l'apprendimento consiste nell'instaurazione di collegamenti tra una situazione e una risposta: l'animale viene premiato per le conseguenze del proprio comportamento (es. fuga dalla gabbia).

Leggi dell'apprendimento: contributi di Thorndike

Legge dell'effetto. "Quando si stabilisce una connessione tra una situazione modificabile e una risposta, e questa è accompagnata o seguita da uno stato di soddisfazione, la forza della connessione aumenta. Quando è accompagnata o seguita da uno stato di disagio, la sua forza diminuisce." (Premi e punizioni).

La punizione sopprime il comportamento ma non lo elimina del tutto, perché fornisce solo informazioni su cosa non fare. Tuttavia i rinforzi producono apprendimento.

Legge dell'esercizio (importanza della pratica). Le connessioni si rafforzano con l'uso e diminuiscono con il disuso.

Legge della prontezza (disposizione all'azione). Quando l'organismo è pronto ad agire, l'atto viene eseguito con maggiore facilità e non risulta avversivo; la prontezza facilita l'apprendimento.

Implicazioni educative secondo Thorndike (1912)

Gli insegnanti dovrebbero applicare la legge dell'effetto per favorire l'acquisizione di abitudini positive, seguendo questi principi:

  1. Allenare le abitudini: non aspettarsi che si formino spontaneamente.
  2. Prestare attenzione a non formare abitudini che poi vanno rimosse.
  3. Non sovraccaricare con due o più abitudini quando una è sufficiente.
  4. A parità di condizioni, le abitudini si formano come vengono praticate (importanza delle applicazioni pratiche insieme ai contenuti dei programmi).

Condizionamento operante (Skinner)

Skinner interpreta il condizionamento e il rafforzamento del comportamento come effetto del rinforzo. Si distinguono due tipi fondamentali di condizionamento: il tipo S (stimolo), tipico del condizionamento classico di Pavlov, in cui uno stimolo antecedente provoca una risposta riflessa; e il tipo R (risposta), tipico del condizionamento operante, in cui la risposta opera sull'ambiente per produrre un effetto.

Processi di base del condizionamento operante

Modello ABC (Antecedente-Comportamento-Conseguenza). Il comportamento (B) è influenzato dagli antecedenti ambientali (A) e dalle conseguenze che seguono (C).

Stimolo discriminativo. Uno stimolo discriminativo positivo indica che, se il comportamento viene emesso in sua presenza, sarà seguito da rinforzo; uno stimolo discriminativo negativo segnala che non vi sarà rinforzo.

Rinforzo e rinforzi

Rinforzo. Processo responsabile dell'aumento della probabilità che un comportamento si ripeta.

Rinforzi. Stimoli specifici che favoriscono il rinforzo. Il valore di un rinforzo dipende dalla storia individuale, dalla storia di apprendimento e dalle condizioni fisiologiche e psicologiche attuali del soggetto. Si distinguono:

  • Rinforzi primari (biologici).
  • Rinforzi secondari (condizionati).
  • Rinforzi generalizzati (es. denaro, punti).

Tipi di rinforzo e di punizione

Rinforzo: aumenta la probabilità che un comportamento si ripeta in situazioni simili.

  • Rinforzo positivo: il comportamento è seguito da un risultato appetitivo.
  • Rinforzo negativo: il comportamento è seguito dalla rimozione di uno stimolo avversivo.

Punizione: diminuisce la probabilità che un comportamento si ripeta.

  • Punizione positiva: presentazione di uno stimolo avversivo dopo la risposta.
  • Punizione negativa: ritiro di uno stimolo appetitivo dopo la risposta.

Programmi di rinforzo

Regole che determinano quando e come una risposta è seguita da rinforzo.

Programma di rinforzo continuo: il soggetto riceve un rinforzo dopo ogni risposta corretta.

Programmi di rinforzo intermittente: il rinforzo è fornito solo occasionalmente. Possono essere definiti in base al numero di risposte (rapporto) o al tempo (intervallo). Tipi principali:

  1. Programma a rapporto fisso (FR).
  2. Programma a rapporto variabile (VR).
  3. Programma a intervallo fisso (FI).
  4. Programma a intervallo variabile (VI).

Principio di Premack

Un comportamento preferito può fungere da rinforzo per comportamenti meno frequenti: le attività desiderate possono essere usate come ricompensa per attività meno desiderate.

Punizione: considerazioni

La punizione può evitare temporaneamente un comportamento, ma non necessariamente lo elimina. Se la minaccia di punizione scompare, il comportamento punito può ripresentarsi. Per questo motivo la punizione dovrebbe essere applicata solo quando non esistono alternative efficaci. Implicazioni educative importanti:

  1. Deve essere applicata il più rapidamente possibile per mantenerne l'efficacia.
  2. Deve essere accompagnata da rinforzi positivi per comportamenti alternativi appropriati.
  3. Non deve essere di durata eccessiva né di intensità troppo alta; deve essere proporzionata alla gravità dell'infrazione.
  4. Sviluppare alternative efficaci e accettabili al comportamento indesiderato.
  5. Spiegare la contingenza della punizione in anticipo, fornendo informazioni chiare.

Generalizzazione, discriminazione ed estinzione

Generalizzazione. Estensione degli effetti di un rinforzo ad altri stimoli simili. La generalizzazione non è automatica e varia tra soggetti.

Discriminazione. Processo opposto alla generalizzazione: rispondere a uno stimolo ma non ad altri, o rispondere in modo diverso a seconda delle caratteristiche della situazione.

Estinzione. Un comportamento appreso può diminuire e scomparire se il rinforzo che lo manteneva viene sospeso. Può verificarsi il fenomeno della "ricomparsa spontanea" dopo l'estinzione.

Implicazioni educative

A) Promozione e mantenimento di comportamenti desiderati

  1. Segnalazione e incitamento. Una segnalazione (stimolo antecedente) stabilisce le condizioni per l'esecuzione di un comportamento. L'incitamento si riferisce all'assistenza aggiuntiva per rispondere a un segnale specifico.
  2. Rinforzo positivo. Metodo principale per promuovere comportamenti sani: usare rinforzi contingenti ai comportamenti appropriati.
  3. Shaping (modellamento). Rinforzare i progressi verso un obiettivo mediante approssimazioni successive.
  4. Controllo degli stimoli. Alcuni stimoli facilitano più facilmente l'emergere di un comportamento rispetto ad altri; il controllo degli stimoli è utile per favorire risposte desiderate.
  5. Economia dei token. Uso diffuso di rinforzi condizionati (token, punti) per rafforzare gradualmente comportamenti adeguati e scoraggiare comportamenti inappropriati.

B) Rimozione o riduzione di comportamenti indesiderati

  1. Rinforzo differenziale di altri comportamenti (RDO). Si rinforza un comportamento incompatibile con quello inappropriato, senza applicare conseguenze al comportamento inadeguato.
  2. Costo della risposta. Punire la risposta con la perdita di rinforzi (ad es. rimozione di punti o privilegi).
  3. Ipercorrezione. Penalità che richiedono una riparazione: ad esempio, riparazione riparatoria e pratica positiva (ri-forzare il comportamento corretto mediante pratica).
  4. Economia dei token. Utilizzo di rinforzi condizionati per rinforzare progressivamente comportamenti adeguati e ridurre quelli inadeguati.
  5. Sazietà. Basata sulla ripetizione negativa: il soggetto ripete un comportamento fino alla stanchezza, riducendo così l'efficacia dello stimolo come rinforzo.
  6. Timeout. Allontanare il soggetto dalla fonte di stimoli che mantengono la cattiva condotta. Deve essere applicato per un periodo proporzionato all'età e alla gravità del comportamento.

Voci correlate: