Czy potrafią Państwo przywołać jakiś eksperyment ekonomiczny (inny niż niekontrolowane „eksperymenty” w rodzaju chińskiego „wielkiego skoku”)? Pomimo kilkudziesięciu lat światowej tradycji i kilku nagród Nobla (Kahneman, Smith, Thaler), ekonomia eksperymentalna pozostaje w Polsce dziedziną niszową. Wyraźnie odróżnia się ona od ekonomii głównego nurtu, posługującej się danymi zastanymi (zbieranymi przez GUS, NBP, Ministerstwo Finansów, pochodzącymi z giełdy, od prywatnych firm itd.). Ekonomiści eksperymentalni zbierają bowiem dane głównie w laboratorium. W tym sensie jest to subdyscyplina ekonomii wyraźnie zbliżona do psychologii eksperymentalnej (w szczególności tej jej części, która zajmuje się podejmowaniem decyzji), choć istnieją też ważne różnice, o czym za chwilę.

Eksperymentator zaprasza badanych – na ogół studentów – do laboratorium, sadza ich w osobnych boksach, by uniemożliwić im komunikację i przedstawia pewien sztuczny problem decyzyjny. W najprostszym i chyba najpopularniejszym planie badawczym, problem ten występuje w dwóch wersjach (warunkach eksperymentalnych, treatments): losowo wybrana połowa badanych otrzymuje go w jednej wersji, reszta – w drugiej. Warunki te różnią się tylko poziomem jednej, wybranej zmiennej (zmiennej eksperymentalnej). Następnie badacz mierzy różnice w zachowaniu (dokonywanych wyborach) pomiędzy obiema grupami (zmienna wynikowa). Ponieważ grupy te są a priori jednakowe, tj. statystycznie rzecz biorąc nie różnią się od siebie pod względem cech badanych, i ponieważ napotykane przez nich problemy decyzyjne różnią się tylko poziomem zmiennej eksperymentalnej, możemy wywnioskować, że różnica w zachowaniu jest skutkiem różnicy w zmiennej eksperymentalnej.

Tu właśnie tkwi zasadnicza różnica względem statystycznej analizy zastanych danych społecznych (niekoniecznie ekonomicznych). Tam „wszystko wpływa na wszystko” – zidentyfikowanie przyczyn i skutków jest niezwykle trudne. W rezultacie, niełatwo jest stawiać przewidywania i rekomendacje dla polityk – rzadko bowiem mamy pewność, jakie będą rezultaty danej zmiany prawnej, etc. Znacznie większą pewność wnioskowania dają badania eksperymentalne: tu badacz ma (prawie) wszystko pod kontrolą. Jest to prawdą w szczególności w odniesieniu do eksperymentów laboratoryjnych.

Przyjmijmy na przykład, że rozważamy jakiś nowy mechanizm aukcyjny (tak jak to miało miejsce w wielu krajach w przypadku sprzedaży częstotliwości operatorom sieci komórkowych, Binmore i Klemperer, 2002). Otóż można najpierw przeprowadzić eksperyment, informując przybyłych, że wezmą udział w serii aukcji. Przedmiotem każdej z nich będzie pewne wirtualne dobro, o którego wartości każdorazowo badany zostanie poinformowany, wiedząc, że może ona być inna dla pozostałych uczestników. Możemy w tym środowisku testować dowolną liczbę różnych mechanizmów aukcyjnych (zmienna eksperymentalna); ich dobór na ogół motywowany jest przez rozważania teoretyczne. Przykładowo, regret theory (np. Loomes i Sugden, 1982) może sugerować, że warto po każdej aukcji informować przegranych, ile zabrakło im do zwycięstwa, ponieważ antycypowanie takiej informacji i związanego z nią żalu skłoni ich do licytowania wyżej (Filiz-Ozbay i Ozbay, 2007).

Reklama

Warto zauważyć, że eksperymentator może mierzyć jako zmienne wynikowe nie tylko średnie przychody dla aukcjonariusza, ale także efektywność aukcji. Istotnie, wiedząc, że w takiej a takiej rundzie wartość dobra z punktu widzenia tego a tego uczestnika wynosi tyle a tyle, możemy sprawdzić jak często dobro trafiło w rezultacie aukcji w ręce osoby, która akurat ceniła je najwyżej. Co więcej, osiągnięte wnioski, np. dotyczące tego, który mechanizm jest najlepszy, możemy łatwo zreplikować dowolnie wybraną liczbę razy. Do tego celu zapraszamy po prostu kolejne grupy badanych (to ten rzadki w przypadku prawdziwego badacza moment, gdy cieszy się on, że wokół kręci się tylu studentów).

O wszystkim tym moglibyśmy tylko pomarzyć, badając dane zastane: tam prawdziwe gotowości do zapłaty za dobro są nieznane, na ogół nie można wykonać niezależnych powtórzeń takiej samej aukcji, a różnice w mechanizmach nie są egzogenicznie losowane, lecz zależą od „ścieżki” (np. wyników poprzednich aukcji danego aukcjonariusza). W rezultacie niezmiernie trudno jest orzec na podstawie analizy danych zastanych o tym, czy ze społecznego (lub korporacyjnego) punktu widzenia dana zmiana mechanizmu jest korzystna, czy też nie.

Eksperymenty są szczególnie przydatne w zakresach, w których trudno zebrać jakiekolwiek wiarygodne dane terenowe. Dotyczy to w szczególności działań, które osoby podejmujące je starają się usilnie ukryć. Dobrym przykładem jest korupcja. Chcielibyśmy np. wiedzieć, czy karać osoby oferujące łapówki, biorące łapówki, czy też może obie strony. Liczba łapówek dawanych w danym kraju jest nieobserwowalna, możemy opierać się tylko na jej nieformalnych szacunkach deklarowanych przez uczestników badań sondażowych. Taka percepcja korupcji może istotnie zmieniać się w czasie w sposób wcale niespowodowany zmianami w prawie, zaburzając ewaluację ich skutków. W laboratorium, przeciwnie, możemy mechanizmy kar zaplanować jak tylko chcemy, losowo aplikować je różnym badanym obsadzonym w roli potencjalnego łapówkarza lub łapówkobiorcy i obserwować ich zachowanie. Przykładowo, Abbink i inni (2014) stwierdzają, że asymetryczna odpowiedzialność karna (spadająca tylko na biorącego łapówkę, nie dającego ją) ma potencjał w ograniczaniu korupcji, ale identyfikują kilka mechanizmów osłabiających ten efekt.

Eksperymenty są szczególnie przydatne w zakresach, w których trudno zebrać jakiekolwiek wiarygodne dane terenowe. Dotyczy to w szczególności działań, które osoby podejmujące je starają się usilnie ukryć. Dobrym przykładem jest korupcja.

Można oczywiście zapytać, czy uczestnicy eksperymentu w ogóle starają się podjąć możliwie najlepsze decyzje. Jeśli nie, wyniki będą mało miarodajne – niewiele powiedzą nam na temat tego, które rozwiązanie sprawdziłoby się poza laboratorium, z graczami chcącymi naprawdę kupić jak najtaniej, prawdziwymi skorumpowanymi urzędnikami, etc.

Tu pojawia się zasadnicza różnica pomiędzy typowym eksperymentem psychologicznym a ekonomicznym. W tym pierwszym badani nie otrzymują wynagrodzenia albo jest ono niezależne od treści podejmowanych decyzji. W rezultacie to, czy badany stara się rozwiązać postawione przed nim zadanie jak najlepiej, czy też nie, jest kwestią jego dobrej woli. Czasami można na nią liczyć (np. w krótkich testach na inteligencję, itp., zachęty finansowe nie grają roli), ale gdy zadanie jest dłuższe i nużące, wielu badanych nie będzie chciało podjąć wysiłku, klikając w sposób dość przypadkowy. Dlatego właśnie w eksperymentach ekonomicznych bardzo dużą wagę przykłada się do powiązania wysokości wypłaty pieniężnej dla badanego z treścią podejmowanych przez niego decyzji.

W naszym przykładzie dotyczącym aukcji może to oznaczać, że wartość dobra i cena w każdej rundzie wyrażona jest np. w ECU (Experimental Currency Unit), po czym na koniec eksperymentu losuje się jedną z rund i za każdą zdobytą w niej jednostkę ECU wypłaca się badanemu np. 20 groszy. Przykładowo, jeśli w wylosowanej rundzie dobro było warte dla badanego 700 ECU, a kupił je za 550 ECU, zyskał 150 ECU, zatem wróci do domu bogatszy o 30 zł (plus, dajmy na to, 5 zł za sam udział w eksperymencie).

Podobną zasadę poprawności motywacyjnej, zachęcającą do ujawniania prawdziwych preferencji i przekonań (poprzedzonego staranną lekturą instrukcji i namysłem) stosuje się, w miarę możliwości, do wszystkich zadań eksperymentalnych. Przykładowo, prosząc badanego o oszacowanie prawdopodobieństwa jakiegoś zdarzenia (np. tego, że inny uczestnik eksperymentu występujący w roli dłużnika odda pożyczkę) eksperymentator może użyć tzw. proper scoring rules, w ramach których badany zostaje nagrodzony, gdy faktycznie zdarzy się coś, co uważał za wysoce prawdopodobne, a ukarany, gdy zdarzy się coś, co uważał za mało prawdopodobne. W rezultacie badany ma zachętę by ujawnić swoje faktyczne przekonania (a nie podać wielkość przypadkową albo taką, którą – jak mu się wydaje – eksperymentator chciałby usłyszeć albo też taką, która np. usprawiedliwiałaby samolubne wybory badanego).

W inny sposób zasada poprawności motywacyjnej realizuje się w przypadku eksperymentów terenowych. Tam badany na ogół wcale nie wie, że jest uczestnikiem eksperymentu; uważa zatem, że jego wybory mają konkretne konsekwencje życiowe. Przykładem są eksperymenty dotyczące dyskryminacji na rynku pracy. Ich najczęściej stosowany plan badawczy przewiduje rozesłanie kilku tysięcy zgłoszeń – wyglądających na prawdziwe – w odpowiedzi na ogłoszenia o pracę. Zgłoszenia te są manipulowane w taki sposób, że taki sam list motywacyjny i takie samo CV – różniące się, przykładowo, jedynie płcią lub rasą – zostają wysłane w odpowiedzi na podobne ogłoszenia. W rezultacie, porównując odsetek rekrutujących, którzy odpowiedzą na zgłoszenia kobiet vs. analogiczne zgłoszenia mężczyzn możemy uzyskać rozeznanie, czy kobiety i mężczyźni rekrutujący się na dany typ stanowiska mają jednakowe szanse.

Bez użycia eksperymentu, sama obserwacja, że np. 90 proc. programistów to mężczyźni, wcale jeszcze by nie świadczyła o dyskryminacji kobiet, podobnie jak obserwacja, że 90 proc. osadzonych w zakładach karnych to mężczyźni nie świadczy jeszcze o tym, że sędziowie są uprzedzeni.

Znów, ta metoda pozwala na stwierdzenie dyskryminacji, bo wszystkie cechy poza płcią są jednakowe w zgłoszeniach „kobiet” i „mężczyzn”. Przeciwnie, bez użycia eksperymentu, sama obserwacja, że np. 90 proc. programistów to mężczyźni, wcale jeszcze by nie świadczyła o dyskryminacji kobiet, podobnie jak obserwacja, że 90 proc. osadzonych w zakładach karnych to mężczyźni nie świadczy jeszcze o tym, że sędziowie są uprzedzeni. Głównym powodem tej ostatniej dysproporcji jest po prostu to, że mężczyźni popełniają dużo więcej przestępstw, szczególnie tych z użyciem przemocy (na ogół zagrożonych wyższą karą). Podobnie programistów może być znacznie więcej niż programistek głównie dlatego, że znacznie więcej mężczyzn ubiega się o pracę w tym charakterze. Oczywiście, te obserwacje nie zwalniają nas z ważnych i interesujących dociekań, dlaczego mężczyźni chętniej niż kobiety studiują informatykę i dlaczego mężczyźni (niekoniecznie ci sami) częściej niż kobiety dają bliźnim po głowie, ale są to odmienne zagadnienia – niewskazujące bezpośrednio na uprzedzenia sędziów lub rekruterów.

Inny atrakcyjny obszar zastosowania eksperymentów terenowych to uchylanie się od płacenia podatków. Przeprowadzono wiele badań mających na celu zidentyfikowanie najskuteczniejszego sposobu nakłaniania podatników by deklarowali cały swój dochód. Przykładowo, Bott i współautorzy (2020)Otwiera się w nowym oknie wysłali 15 000 listów do obywateli, których norweski fiskus podejrzewał o zatajanie części zagranicznych dochodów. W porównaniu do bazowej wersji tekstu takiego listu od fiskusa, podatnicy poddani presji moralnej oraz ci, którym zasugerowano, że prawdopodobieństwo poddania ich zeznania szczegółowej kontroli jest wysokie, deklarowali większe dochody.

Często twierdzi się, że eksperymenty laboratoryjne oferują badaczowi większą kontrolę niż terenowe. Przykładowo, nie mamy pewności, kto, jeśli w ogóle ktokolwiek, zajrzał do przygotowanych przez eksperymentatora materiałów (w opisanych przed chwilą planach badawczych, odpowiednio: wysłanych pracodawcom życiorysów, a podatnikom – listów od fiskusa). W laboratorium widzimy, że badani czytają pilnie instrukcje i że z nikim nie konsultują swoich decyzji. W zamian za to, laboratorium ze swoimi sztucznymi zadaniami może mieć większy kłopot z trafnością zewnętrzną – możliwością przenoszenia zaobserwowanych wyników na tak zwane prawdziwe życie. Tym istotnym zagadnieniem zajmę się w kolejnym tekście.

Dr hab. Michał Krawczyk jest profesorem Uniwersytetu Warszawskiego, redaktorem podręcznika Ekonomia eksperymentalna (Krawczyk, 2012) i autorem czterdziestu pięciu artykułów w czasopismach o międzynarodowym zasięgu, dotyczących między innymi metodologii badań eksperymentalnych, podejmowania decyzji w warunkach ryzyka i nadmiernej pewności siebie.