Le conditionnement opérant, parfois appelé conditionnement instrumental, est une méthode d'apprentissage qui utilise des récompenses et des punitions pour le comportement. Grâce au conditionnement opérant, une association est établie entre un comportement et une conséquence (qu'elle soit négative ou positive) de ce comportement.
Par exemple, lorsque des rats de laboratoire appuient sur un levier lorsqu'un voyant vert est allumé, ils reçoivent une boulette de nourriture en récompense. Lorsqu'ils appuient sur le levier lorsqu'un voyant rouge est allumé, ils reçoivent un léger choc électrique. En conséquence, ils apprennent à appuyer sur le levier lorsque le feu vert est allumé et évitent le feu rouge.
Mais le conditionnement opérant n'est pas seulement quelque chose qui se déroule dans des cadres expérimentaux tout en entraînant des animaux de laboratoire. Il joue également un rôle important dans l'apprentissage quotidien. Le renforcement et la punition ont toujours lieu dans des environnements naturels, ainsi que dans des environnements plus structurés tels que des salles de classe ou des séances de thérapie.
L'histoire du conditionnement opérant
Le conditionnement opérant a été décrit pour la première fois par le comportementaliste BF Skinner, c'est pourquoi vous pouvez parfois l'entendre parler de conditionnement skinnérien. En tant que comportementaliste, Skinner pensait qu'il n'était pas vraiment nécessaire d'examiner les pensées et les motivations internes pour expliquer le comportement. . Au lieu de cela, a-t-il suggéré, nous ne devrions examiner que les causes externes et observables du comportement humain.
Au cours de la première partie du 20e siècle, le béhaviorisme est devenu une force majeure au sein de la psychologie. Les idées de John B. Watson ont très tôt dominé cette école de pensée. Watson s'est concentré sur les principes du conditionnement classique, suggérant autrefois qu'il pouvait prendre n'importe quelle personne, quelle que soit son origine, et la former à ce qu'il choisirait.
Les premiers comportementalistes ont concentré leurs intérêts sur l'apprentissage associatif. Skinner s'intéressait davantage à la façon dont le conséquences des actions des gens ont influencé leur comportement.
Skinner a utilisé le terme opérant pour désigner tout « comportement actif qui agit sur l'environnement pour générer des conséquences ». La théorie de Skinner expliquait comment nous acquérons la gamme de comportements appris que nous exhibons chaque jour.
Sa théorie a été fortement influencée par les travaux du psychologue Edward Thorndike, qui avait proposé ce qu'il appelait la loi de l'effet. Selon ce principe, les actions suivies de résultats souhaitables sont plus susceptibles d'être répétées tandis que celles suivies de résultats indésirables sont moins susceptibles de se répéter.
Le conditionnement opérant repose sur une prémisse assez simple : les actions qui sont suivies d'un renforcement seront renforcées et plus susceptibles de se reproduire à l'avenir. Si vous racontez une histoire amusante en classe et que tout le monde rit, vous aurez probablement plus de chances de raconter cette histoire à nouveau à l'avenir.
Si vous levez la main pour poser une question et que votre professeur fait l'éloge de votre comportement poli, vous aurez plus de chances de lever la main la prochaine fois que vous aurez une question ou un commentaire. Parce que le comportement a été suivi d'un renforcement, ou d'un résultat souhaitable, l'action précédente est renforcée.
Inversement, les actions qui entraînent des sanctions ou des conséquences indésirables seront affaiblies et moins susceptibles de se reproduire à l'avenir. Si vous racontez à nouveau la même histoire dans une autre classe mais que personne ne rit cette fois-ci, vous aurez moins de chances de répéter l'histoire à l'avenir. Si vous criez une réponse en classe et que votre professeur vous gronde, vous risquez moins d'interrompre à nouveau le cours.
Types de comportements
Skinner distingue deux types de comportements différents
- Comportements des répondants sont ceux qui se produisent automatiquement et par réflexe, comme retirer votre main d'un poêle chaud ou secouer votre jambe lorsque le médecin tape sur votre genou. Vous n'êtes pas obligé d'apprendre ces comportements. Ils se produisent simplement automatiquement et involontairement.
- Comportements opérants, d'autre part, sont ceux sous notre contrôle conscient. Certaines peuvent se produire spontanément et d'autres volontairement, mais ce sont les conséquences de ces actions qui influencent alors si elles se reproduisent ou non dans le futur. Nos actions sur l'environnement et les conséquences de cette action constituent une partie importante du processus d'apprentissage.
Alors que le conditionnement classique pouvait expliquer les comportements des répondants, Skinner s'est rendu compte qu'il ne pouvait pas expliquer une grande partie de l'apprentissage. Au lieu de cela, Skinner a suggéré que le conditionnement opérant avait beaucoup plus d'importance.
Skinner a inventé différents appareils au cours de son enfance et il a mis ces compétences à l'œuvre lors de ses études sur le conditionnement opérant. Il a créé un dispositif connu sous le nom de chambre de conditionnement opérant, souvent appelée aujourd'hui boîte de Skinner. La chambre pouvait contenir un petit animal, comme un rat ou un pigeon. La boîte contenait également une barre ou une clé sur laquelle l'animal pouvait appuyer pour recevoir une récompense.
Afin de suivre les réponses, Skinner a également développé un appareil appelé enregistreur cumulatif. L'appareil enregistrait les réponses sous la forme d'un mouvement ascendant d'une ligne afin que les taux de réponse puissent être lus en regardant la pente de la ligne.
Composants du conditionnement opérant
Il existe plusieurs concepts clés dans le conditionnement opérant.
Renforcement en conditionnement opérant
Le renforcement est tout événement qui renforce ou augmente le comportement qu'il suit. Il existe deux sortes de renforçateurs. Dans ces deux cas de renforcement, le comportement augmente.
- Renforçateurs positifs sont des événements ou des résultats favorables qui sont présentés après le comportement. Dans les situations de renforcement positif, une réponse ou un comportement est renforcé par l'ajout d'éloges ou d'une récompense directe. Si vous faites un bon travail au travail et que votre manager vous donne un bonus, ce bonus est un renforcement positif.
- Renforçateurs négatifs impliquent la suppression d'événements ou de résultats défavorables après l'affichage d'un comportement. Dans ces situations, une réponse est renforcée par la suppression de quelque chose considéré comme désagréable. Par exemple, si votre enfant commence à crier au milieu d'un restaurant, mais s'arrête une fois que vous lui donnez une friandise, votre action a conduit à la suppression de la condition désagréable, renforçant négativement votre comportement (pas celui de votre enfant).
Punition dans le conditionnement opérant
La punition est la présentation d'un événement ou d'un résultat indésirable qui entraîne une diminution du comportement qu'il suit. Il existe deux sortes de punitions. Dans ces deux cas, le comportement diminue.
- Punition positive, parfois appelée punition par application, présente un événement ou un résultat défavorable afin d'affaiblir la réponse qu'il suit. La fessée pour mauvaise conduite est un exemple de punition par application.
- Punition négative, également connu sous le nom de punition par suppression, se produit lorsqu'un événement ou un résultat favorable est supprimé après qu'un comportement se soit produit. Le retrait du jeu vidéo d'un enfant à la suite d'une mauvaise conduite est un exemple de punition négative.
Programmes de renforcement
Le renforcement n'est pas nécessairement un processus simple, et il existe un certain nombre de facteurs qui peuvent influencer la rapidité et la qualité de l'apprentissage de nouvelles choses. Skinner a trouvé que lorsque et à quelle fréquence les comportements renforcés ont joué un rôle dans la vitesse et la force de l'acquisition. En d'autres termes, le moment et la fréquence du renforcement ont influencé la façon dont les nouveaux comportements étaient appris et comment les anciens comportements étaient modifiés.
Skinner a identifié plusieurs programmes de renforcement différents qui ont un impact sur le processus de conditionnement opérant :
- Renforcement continu implique de fournir un renforcement à chaque fois qu'une réponse se produit. L'apprentissage a tendance à se produire relativement rapidement, mais le taux de réponse est assez faible. L'extinction se produit également très rapidement une fois le renforcement arrêté.
- Horaires à taux fixe sont un type de renforcement partiel. Les réponses ne sont renforcées qu'après qu'un nombre spécifique de réponses ait eu lieu. Cela conduit généralement à un taux de réponse assez stable.
- Horaires à intervalles fixes sont une autre forme de renforcement partiel. Le renforcement n'intervient qu'après un certain intervalle de temps. Les taux de réponse restent assez stables et commencent à augmenter à mesure que le temps de renforcement approche, mais ralentissent immédiatement après la livraison du renforcement.
- Horaires à taux variable sont également un type de renforcement partiel qui consiste à renforcer le comportement après un nombre varié de réponses. Cela conduit à la fois à un taux de réponse élevé et à des taux d'extinction lents.
- Horaires à intervalles variables sont la forme finale de renforcement partiel décrite par Skinner. Ce calendrier consiste à fournir des renforts après un laps de temps variable. Cela a également tendance à conduire à un taux de réponse rapide et à un taux d'extinction lent.
Exemples de conditionnement opérant
Nous pouvons trouver des exemples de conditionnement opérant à l'œuvre tout autour de nous. Prenons le cas d'enfants qui terminent leurs devoirs pour gagner une récompense d'un parent ou d'un enseignant, ou d'employés qui terminent des projets pour recevoir des éloges ou des promotions. Voici d'autres exemples de conditionnement opérant en action :
- Après avoir joué dans une pièce de théâtre communautaire, vous recevez les applaudissements du public. Cela agit comme un renforçateur positif, vous incitant à essayer d'autres rôles de performance.
- Vous entraînez votre chien à aller chercher en lui offrant des éloges et une tape sur la tête chaque fois qu'il exécute le comportement correctement. Ceci est un autre renforçateur positif.
- Un professeur dit aux étudiants que s'ils ont une assiduité parfaite tout le semestre, ils n'ont pas à passer l'examen de synthèse final. En supprimant un stimulus désagréable (le test final), les élèves sont renforcé négativement d'assister régulièrement aux cours.
- Si vous ne remettez pas un projet à temps, votre patron se met en colère et réprimande votre performance devant vos collègues. Cela agit comme un punisseur positif, ce qui réduit la probabilité que vous finissiez des projets tard dans le futur.
- Une adolescente ne nettoie pas sa chambre comme on lui a demandé, alors ses parents lui confisquent son téléphone pour le reste de la journée. Ceci est un exemple de punition négative dans lequel un stimulus positif est retiré.
Dans certains de ces exemples, la promesse ou la possibilité de récompenses provoque une augmentation du comportement. Le conditionnement opérant peut également être utilisé pour diminuer un comportement via la suppression d'un résultat souhaitable ou l'application d'un résultat négatif. Par exemple, on peut dire à un enfant qu'il perdra ses privilèges de récréation s'il parle hors de son tour en classe. Ce potentiel de punition peut conduire à une diminution des comportements perturbateurs.
Un mot de Verywell
Alors que le béhaviorisme a peut-être perdu une grande partie de la domination qu'il détenait au début du 20e siècle, le conditionnement opérant reste un outil important et souvent utilisé dans le processus d'apprentissage et de modification du comportement. Parfois, les conséquences naturelles entraînent des changements dans notre comportement. Dans d'autres cas, les récompenses et les punitions peuvent être consciemment distribuées afin de créer un changement.
Le conditionnement opérant est quelque chose que vous pouvez immédiatement reconnaître dans votre propre vie, que ce soit dans votre approche pour enseigner à vos enfants un bon comportement ou dans le dressage du chien de la famille. N'oubliez pas que tout type d'apprentissage prend du temps. Considérez le type de renforcement ou de punition qui convient le mieux à votre situation unique et évaluez quel type de programme de renforcement pourrait donner les meilleurs résultats.