Raz szmatka, raz mydełko, czyli o zmiennym systemie nagradzania w treningu psów!

Dawno temu w Poznaniu

Wiele lat temu, będąc jeszcze studentką i mieszkając w Poznaniu, uwielbiałam wraz z koleżankami stołować się w legendarnych poznańskich barach mlecznych, zaś naszym ulubionym przybytkiem był Bar „Apetyt” na placu Wolności. Spośród wszystkich dań, jakie serwowały nam znakomite kucharki baru „Apetyt” najbardziej lubiłam zamawiać barszcz ukraiński. Ten kolor, konsystencja, różnorodność składników i za każdym razem niepowtarzalny, choć nieco odmienny smak tego dania kusiły mnie przy każdej wizycie w moim ulubionym barze. Próbowałam odgadnąć, na czym polega fenomen wyjątkowości smaku tej zupy, zaskakującej mnie za każdym razem jakimś nowym, nieznanym dla mnie składnikiem, aż w końcu jeden z kolegów, który przysiadł się do naszego stolika (w barze „Apetyt” ciężko było o wolne krzesła w porze obiadowej, więc przy okazji zawierało się tam również nowe znajomości) skwitował moje rozważania. „A tam się zastanawiasz, raz pani szmatkę upuści do gara, raz mydełko, ot, i cała tajemnica smaku”. No cóż, może i tak było, tym niemniej – tak mi się spodobały słowa mojego dowcipnego kolegi, że pamiętam je do dziś i zawsze, gdy je wspominam, wywołują uśmiech na mojej twarzy.

Ale co to ma wspólnego z treningiem psów? Na pierwszy rzut oka – niewiele, lecz na drugi… Zastanówmy się.

Dlaczego tak bardzo smakował mi ten legendarny barszcz ukraiński? Bo wpłacając przy kasie 2.50 zł, za każdym razem byłam zaskakiwana. Niby z góry wiedziałam, że wykazując pożądane przez kasjerkę zachowanie (grzecznie dając określoną kwotę, najlepiej drobnymi), dostanę nagrodę w postaci zupy. I ok, ale to byłoby zbyt nudne, zbyt przewidywalne i w końcu przestałaby mnie ta zupa fascynować. Lecz panie pracujące w barze „Apetyt” znały się na rozkładach wzmocnień i ogromnej roli zróżnicowania nagród! A więc. Słyszałam po chwili „klik” w postaci okrzyku na zapleczu „barszcz ukraiński raz” i cała uradowana biegłam po odbiór zupy, która po raz kolejny była dla mnie zaskoczeniem. No cóż, raz szmatka, raz mydełko. W ten sposób uzależniłam się od barszczu ukraińskiego i przejęłam strategie mądrych kucharek. Po-pierwsze, mój własnoręcznie robiony w domu barszcz ukraiński zawsze smakuje nieco inaczej. Proszę mnie nie pytać, co ja do niego dodaję, jaki to tajemniczy składnik. Improwizuję.

Po-drugie, i to jest bardziej istotne dla dzisiejszego wpisu, nauczyłam się, że niejednostajność i różnorodność nagród, jakie oferujemy naszym psom za pożądane zachowania, sprawiają, że psy uczą się szybciej, rzadziej się nudzą i przede wszystkim – dane zachowanie ma znacznie większe szanse na utrwalenie!

A więc – kilka zasad, dotyczących stosowania metody „raz szmatka, raz mydełko”.

Nauka nowego zachowania 

Gdy uczymy naszego psa nowego zachowania, wzmacnianie ciągłe jest jak najbardziej na miejscu. Po każdym prawidłowym SIAD – czy to przez naprowadzanie, czy już na sam sygnał optyczny lub komendę słowną, musimy psa nagrodzić. Otrzymanie nagrody sprawi, że pies będzie wiedział, że tej właśnie reakcji od niego oczekujemy. Pamiętajmy jednak, by nawet na tym etapie stosować różnorodne wzmocnienia. Rzecz jasna, mam tu na myśli nie tylko różne rodzaje smakołyków, choć i to jest wspaniałym urozmaiceniem nagród. A więc – przygotujmy trochę gotowych smakołyków, trochę kawałków kurczaka, trochę sera, parę malutkich skrawków paróweczki. To już sprawi, że pies, otrzymując różne nagrody smakowe, z większym zainteresowaniem podejdzie do tematu. Ale nie poprzestawajmy na tym! Forma podania smakołyków też może być różna! Można psu je podać z ręki, jak robimy to zazwyczaj, ale możemy też rzucić psu smakołyk – tak, by go złapał w locie! Zapewniam, że większość psów z chęcią włączy się do tej zabawy, bo będzie miała w sobie drobny element polowania. Kolejny sposób to wrzucenie naszego smakołyka, na przykład, do miski z piłeczkami, stojącej nieopodal. Pies, który już wie, o co chodzi w misce z piłeczkami, rzuci się na poszukiwanie nagrody wśród piłeczek, co pozwoli mu potrójnie skorzystać z nagrody. Po-pierwsze, da możliwość węszenia, co same w sobie jest dla psa czynnością przyjemną; po-drugie, rozładuje napięcie, jeśli takowe powstało w trakcie wykonywania ćwiczeń; po-trzecie, pozwoli zdobyć upragniony smakołyk!

Jak widać, nawet posługując się wyłącznie smakołykami, możemy sporo pokombinować, by nie zanudzić naszego psa. Oprócz nagród w postaci jedzenia, sięgnijmy też po inne formy nagradzania – zabawa szarpakiem, piłeczką, kulą-smakulą; pozwolenie psu na zanurzenie się w basenie, ustawionym na placu treningowym; wyjście na krótki spacer poza plac treningowy; zabawa w „szukaj np. piłeczki” itd. Możliwości jest wiele! Ważne, by na etapie nauki nowych zachowań, czyli wprowadzanie nowych dla psa komend, nagradzać naszego ucznia za każde prawidłowe wykonanie, pamiętając przy tym o różnorodności. W przeciwnym wypadku możemy sprawić, że nawet największy żarłok, gdy wreszcie się naje, po prostu sobie odejdzie, bo zanudzimy go zwyczajnym podawaniem tych samych smakołyków. Bo przecież nie kręcą nas zazwyczaj zakupy w supermarketach spożywczych (choć pewnie tu też istnieją wyjątki), a już wyciąganie pluszaków z ustawionych pod supermarketem automatów – jak najbardziej! Bo nigdy nie wiadomo, co się uda wyciągnąć, prawda, i czy w ogóle się uda? W ten sposób przechodzimy do drugiej bardzo istotnej zasady dotyczącej działania wzmocnienia pozytywnego w treningu psów.

Wzmocnienie zmienne – najważniejsza część szkolenia!

Gdy Twój pies wykonuje komendę SIAD w ośmiu przypadkach na dziesięć, i – co ważne – zachowanie to zostało „przeniesione” również na inne, niż Twoje mieszkanie lub plac treningowy miejsca i sytuacje, czas na wprowadzenie wzmocnienia zmiennego. Co to oznacza? Otóż, postaraj się powstrzymać z wyciągnięciem z kieszeni smakołyka po pierwszym i drugim wykonaniu przez psa komendy. Zaciśnij zęby, uśmiechnij się, pochwal psa i poproś i trzecie wykonanie. I dopiero nagródź! Następnym razem – zaskocz psa nagrodą o siódmym czy dziesiątym wykonaniu. I niech to będzie coś ekstra! Na przykład, wspólna zabawa w przeciąganie sznurka, rzucenie piłeczki lub wysłanie psa do wody za patykiem! Wprowadzając do Waszej „gry” element niespodzianki, zauważysz, że pies staje się bardziej skupiony na Tobie, z większą chęcią wykonuje ćwiczenia, coraz rzadziej zdarza mu się odchodzić od Ciebie po usłyszeniu komendy… Bo przecież my, ludzie, działamy bardzo podobnie! Oczywiście, cieszymy się z comiesięcznego wynagrodzenia, ale o ile więcej radości sprawi nam nieoczekiwana premia? A co dopiero wyjazd do Hiszpanii w ramach podziękowania za sfinalizowanie projektu? Założę się, że po powrocie z urlopu jako pierwsi zgłosicie się do udziału w kolejnym ważnym projekcie, prawda? Tak samo działają psy. Z jedną tylko różnicą. Nagroda-niespodzianka musi pojawić się natychmiast, tu i teraz. Nie obiecujmy psu, że jak ładnie teraz popracuje, wieczorem zabierzemy go nad jezioro…

A więc gdy zachowanie możemy uznać za wyuczone, naszym zadaniem jest pomóc psu je utrwalić. Do tego właśnie służy stosowanie wzmocnień zmiennych. Nagradzajmy psa co któreś zachowanie albo wybierzmy kryterium danego zachowania, które będziemy wzmacniań za pomocą nagrody. Na przykład, nagradzamy tylko natychmiastowe przyjście do nas na komendę. Byle jakie, z ociąganiem się lub bez entuzjazmu po prostu pochwalmy. Bez fajerwerków. Zapewniam, że gdy natychmiastowym powrocie zaserwujemy psu ekstra zabawę, perfekcja będzie dla Was na wyciągnięcie łapy…

Pułapka wzmocnień zmiennych, czyli wejście do kasyna

Niestety, istnieje też druga strona medalu w zasadzie działania nieregularnych wzmocnień. W naszym życiu codziennym z psami, świadomie lub nieświadomie często wzmacniamy również ich zachowania niepożądane. Otóż, załóżmy, że nasz pies spróbował swoich sił i skuteczności w żebraniu przy stole. Wiemy, że nie jest to zachowanie pożądane. Czasami jednak, gdy widzimy jego błagalne spojrzenia, minę, świadczącą o permanentnym odczuwaniu głodu, przymilanie się, jęczenie, a nieraz nawet szczekanie, poddajemy się i rzucamy pod stół kawałek szyneczki. A niech ma, niech zna nasze dobre serducho. Czego uczy się pies, jeśli przez okrągły tydzień bezskutecznych prób wreszcie dostał upragnioną nagrodę? Uczy się wytrwałości w żebraniu! Nabiera przekonania, że wcześniej zapewne starał się niewystarczająco i następnym razem, gdy siądziemy do posiłku, warto dać z siebie więcej! W ten sposób perfekcyjnie utrwaliliśmy zachowanie niepożądane. Echhh, żeby to tak pięknie działało w drugą stronę… Wiem, że łatwiej jest teoretyzować, niż być konsekwentnym na co dzień. Sama się zmagam z tym problemem. W moim domu Brysia – żarłok nad żarłoki – zawsze czatuje przy stole, gdy zasiadamy do kolacji razem z moim małżonkiem. Nie zawsze, lecz wzorcowo nieregularnie mój małżonek daje jej coś ze swojego talerza. I co mamy? Mamy psa-żebraka. Co ciekawe, gdy małżonka nie ma, drzwi do kasyna, zdaje się, są zamknięte. Mój pies nauczył się, że zabawa zaczyna się, gdy mój mąż zasiada razem ze mną przy stole. Krupier rozdaje karty i Brycha obstawia – uda się tym razem czy też nie… Ta gra zdaje się nie kończyć nigdy… Co możemy w tej sytuacji zrobić? Nie wzmacniać danego zachowania nigdy! Gdyby udało nam się dojść między sobą w tej sprawie do porozumienia i przez kolejne tygodnie, miesiące, lata nie dać żebrakowi ani razu nawet najmniejszego kawałka od stołu, dane zachowanie stopniowo będzie zanikać. Pod warunkiem, że od ustalonej przez nas zasady nie będzie żadnych wyjątków. Ani na święta, ani w Brysiowe urodziny, ani jak przyjdzie babcia. Nigdy! Wiem jednak z doświadczenia, że w kwestii porozumienia się z ludźmi niekiedy bywa znacznie trudniej, niż mogłoby się wydawać.

Co kto lubi…

Podsumowując, starajmy się dość szybko włączyć do naszych codziennych treningów schemat wzmocnień zmiennych. 

Nie zanudzajmy naszych czworonogów monotonią i przewidywalnością. Ich życie i tak nie jest zbyt bogate w rozrywki! Niech trening stanie się okazją do zabawy, a proponowane przez nas nagrody zaskakują naszego czworonoga tak, by ciągle chciał się starać! Planujmy przed wyjściem na spacer, co dziś będziemy mogli psu zaoferować. Zabawę szarpakiem, pogoń za piłeczką, możliwość pobiegania z psami, pozwolenie na obwąchanie obfitujących w zapachy psich słupków, kawałek kurczaka, a może – skok do wody za patykiem? Możliwości, wbrew pozorom, jest naprawdę wiele! Jedyna rzecz, o której chciałabym wspomnieć na koniec, to określenie, co dla naszego psa rzeczywiście jest nagrodą.
Bo jeśli mamy nieznoszącego wody psa rasy basenji, to wątpię, by wysłanie do wody za patykiem było dla niego nagrodą. Tak samo z pójściem na spacer w deszczową pogodę. Co dla labradora jest szczytem marzeń, to dla naszego afrykańskiego psa może okazać się wręcz karą! Dotyczy to również głaskania! Zwłaszcza – głaskania po głowie. Zdecydowanie nie każdy pies za tym przepada. Co więcej, niektóre nauczyły się to tolerować, ale absolutnie nie traktują tego jako nagrody. Niektóre, zwłaszcza psy lękliwe, wręcz boją się tego typu okazywania uczuć z naszego strony. A więc nie fundujmy im tych wątpliwych nagród. Zastanówmy się, czy akurat w ich przypadku nie lepszy będzie smakołyk czy zabawa w węszenie. A więc – pamiętajmy, żeby sporządzić listę nagród dla naszego pupila (nazwijmy to Menu) – od tych najbardziej pożądanych do tych o mniejszej atrakcyjności i manipulujmy nagrodami mądrze, jak robiły to swego czasu panie kucharki z poznańskiego baru „Apetyt”…