2024年7月号
今月のテーマは、馬に与えるプレッシャーとリリースによって、どのような学習のメカニズムが機能しているのかである。
ライダーが馬に対して与えたプレッシャーによって、馬は緊張し、緊張をもたらすプレッシャーは、馬に懲罰を与えたこととなるのである。一方、プレッシャーをリリースすることで、馬は緊張から緩和へ移行することとなるので、緩和は馬に報酬を与えることとなるのである。
懲罰によって、やってはいけないことを学習し、行動の拘束性が生まれるもので、受動性が拡大するものなのである。
報酬は、やるべきことを学習し、行動の能動性を拡大するものなのである。
緊張と緩和の効果を考える場合、マイナス要因とプラス要因とに置き換えれば、マイナス要因の効果が10とするとプラス要因の効果が4になるそうで、つまり、緊張:緩和10:4なのだそうである。従って、マイナス要素が働いた場合、与える影響が10相当だとすると、プラス要素は4相当の影響となるということである。
以上のことから、懲罰の効果は、10相当で、やってはいけないことを学習するのは強いインパクトを持ち効果が大きく、受動性が拡大しやすいものであることが理解できる。一方、報酬は、4相当で、やるべきことを学習するのは比較的弱いインパクトで効果が小さく、能動性は増進しにくい特性があることが理解できる。
懲罰は、効果的で、報酬は効果が弱いということを、短絡的に理解してしまうと、馬をトレーニングするとき、如何に懲罰を行使するかが重要だと考えてしまいがちなのだが、この理解は間違いなのである。
報酬の効果は、懲罰の半分以下なので、懲罰の3倍ぐらいリリースしなければ、効果がないので、懲罰の3倍以上のリリースを与えて、馬の能動性を引き出すことが極めて重要だと理解しなければならないのである。
何故なら、懲罰と報酬では、学習することが異なることなので、やってはいけないことを学習することも必要なのであり、やるべきことを学習することも必要なのである。しかし、やってはいけないことが学習しやすく、やるべきことは学習し難いこということなのである。
もう一つ考えなければならないことは、馬でも人間でも学習には、キャパシティがあり、一度に幾つものことを学習できないということで、つまりやってはいけないことを沢山学習すれば、やるべきことを学習できないし、やるべきことを沢山学習すれば、やってはいけないことを学習できないのである。
つまり、懲罰は、効果的で、沢山学習させてしまいがちになり、結果的にやるべきことを学習できなくなって、受動的になってしまうのである。
報酬は、非効果的で、懲罰の3倍報酬を与えても懲罰の学習効果に対等になるぐらいなので、能動性を拡大するように学習せしめるには、可成り報酬を与えなくてはならないのである。そして、報酬を与えてやるべきことを学習することで、能動性が拡大すれば、その分やってはいけないことを学習しなくても、やってはいけないことを知らなくても、やってはいけないことをやるようにはならないのである。
例えば、ある場所を嫌って行きたがらない馬を矯正するとき、馬がその場所を行くのを拒否したとき、懲罰を与えて行くようにした場合、馬がその場所を拒否しなくなるということがある。
このとき、馬はその場所を嫌わなくなったのではなく、ライダーの要求を強く感じて、我慢していくようになったのであり、もし、そのライダーより技量低いライダーが同じことを挑戦すれば、馬は再びその場所を嫌って行くこと拒否するのである。
これに対して、その場所へ馬が行くのを拒否した場合、そこで懲罰しないで、その場所から離れてプレッシャーを与えて、再びその場所へ行き、また拒否しても、その場所を離れたところまでは行ってプレッシャーを与え、再度その場所へ行き、一歩馬が前に進んだらプレッシャーをリリースして褒める。これを何回も繰り返して、その場所を嫌わずにスムースに行くまで、トレーニングをするのである。このようにすれば、トレーニングに懲罰したときより時間がかかるかも知れないが、この場合、技量の低いライダーに変わっても、その場所を拒否することにはならないのである。
ライダーは、如何に馬の能動性を高めるようにするトレーニングを心掛ける必要がある。
懲罰は、効果的であるが馬の受動性を増大するが、決して能動性を養成することにはならないのである。これに対して、報酬は、プレッシャーのリリースで、馬の能動性を養成するもので、馬が従順なのは、能動性を養成した馬のことで、受動性を高めても、馬は従順にはならないのである。
ウエスタンのトレーニング法で、馬を直進させるようにプレッシャーを掛け、馬が直進したとき直ぐに止めて、ターンして方向を変え、プレッシャーをかけて直進するように要求し、再び馬が直進したら直ちに止めて、ターンをして方向を変え、直進させるようにプレッシャーを掛けます。この繰り返しをする場合、直進させるときレインプレッシャーはリリース状態にあり、馬をターンさせた直後もプレッシャーをリリースするようにするのである。以上のように一見馬の行動を裏切るように強いプレッシャーを掛けているように見えるが、馬のアクション毎にプレッシャーをリリースして、報酬を与えるようにすることで、馬の能動性が養成され、絶えず能動的にライダーの指示を待つようになるのである。
報酬は、学習する当事者の能動性を養成するものであることを、ライダーが充分に理解する必要があるのである。しかし、報酬とは、緊張を緩和することで得られるものなのであり、相対的に緩和の前に緊張があって成立するものであることを、我々は知っておく必要がある。
緊張無くして、緩和なしであり、緩和無くして緊張なしで、それぞれに学習する内容や効果は異なるが、相対性的に成立していることも我々は理解しなければならないことなのである。
|