オペラント条件づけ

Sponsoerd Link

オペラント条件づけ

レスポンデント条件づけ（レスポンデント条件づけ参照）とは別の条件づけが、オペラント条件づけです。これは、スキナーによる実験が有名ですね。この条件づけとレスポンデント条件づけの最大の違いは、報酬など条件づけ獲得のカギとなるものが提示される位置です。

レスポンデント条件づけでは、無条件反応を引き起こす無条件刺激を中性刺激と対提示することで、条件刺激と条件反応を獲得させました（詳しくはレスポンデント条件づけ参照）。しかし、オペラント条件づけでは、ある刺激によって行動（反応）が行われ、その行動（反応）に対して強化子と呼ばれる報酬や罰を与えます。つまり、反応のあとに提示される強化子で条件づけが獲得されるのです。よって、動物などに条件づけを行う場合は、段階的に学習を行う反応形成が必要となります。

ある刺激に対して反応が行われたとき、報酬や罰を与えることを強化と言います。たとえば、テストで良い点をとったとき、褒められれば勉強のモチベーションは上がりますね。望ましい行動（勉強してテストで良い成績を残した）に対して、報酬が与えられています。きっと、この子はより一層勉強することでしょう。このタイプの条件づけを、正の強化と呼びます。他には、望ましい行動に対して、嫌な事（お手伝いなど）を減らすことで報酬とし、もとの行動を促進しようとするタイプが負の強化、望ましくない行動に対して、叱るなどの嫌な刺激を与えることで元の行動を減少させようとするのが正の罰、望ましくない行動に対して、お小遣いカットといった良い刺激を減らすことで元の行動を減少させようとするのが負の罰と呼ばれます。まとめれば、行動に対して何かを与えれば「正の」、取り上げたり減らしたりすれば「負の」、元の行動を促進しようとすれば「強化」、減退させようとすれば「罰」となります。

オペラント条件づけでも、一度きりの学習では消去（レスポンデント条件づけ参照）が起こります。ですが、ある行動が起こる度に強化を行うのは得策ではありません。スキナーの実験から、毎回ではなくときどき強化子を与える部分強化の方が、消去しにくい（消去抵抗が大きい）ことが分かっています。このとき、どのようなタイミング（2回に1回or数時間に一回など）で強化を行うか、つまり強化の配分の仕方を強化スケジュールと呼びます。このような、部分強化によって消去抵抗が大きくなることを部分強化効果と言います。

オペラント条件づけでも消去が起こるのですから、もちろん分化や般化もおこります。特に、オペラント条件づけでは、刺激を区別するように条件づけを行うこともできます。たとえば、四角を提示したときにボタンを押せばエサが出てくるが、三角を提示したときにボタンを押すと静電気が発生するような装置を用いれば、四角と三角を区別してボタンを押すようになるわけです。このような学習は、弁別学習と呼ばれます。

また、報酬がない状態でも学習は進むことが明らかになっています。これは潜在学習と呼ばれるものです。オペラント条件づけには、それを応用したものがいくつかありますが、下の図を参考にしてください。