Kada smo pisali tekst u kom smo Tuka u naslovu vesterna „Dobar, loš, zao“ zamenili sa statistički značajnim, govorili smo vam o tome kako možete pogrešiti, ako na osnovu značajne korelacije zaključujete o uzroku i posledici. Ukoliko bismo u toj gradaciji od Blondija do Tuka morali da nađemo zamenu za današnju temu, temu statistički neznačajnog, naišli bismo na ogroman problem. Naime, za većinu onih koji se bave istraživanjima ne postoji to toliko zlo statistički značajno, od kojeg bi bolje bilo nešto što je veće od p = .05, odnosno statistički neznačajno. O ovom sukobu statistički neznačajnog rezultata i istraživača će biti više reči u nekom od narednih tekstova, dok će se ovaj deo filmsko-statističkog bloga, ticati još jedne statističke prevare, ravne onima koje je činio Leonardo Dikaprio tumačeći Frenka Abagnejla. Za sve ljubitelje ovog filma, spremili smo uzbudljivu verziju statističke krimi drame, u kojoj nam beži ispravan statistički zaključak, pretvarajući se da je nešto drugo. Da biste ga otkrili potrebne su vam veštine ravne onima koje ima Tom Henks.
Da nema samo Leo kapacitete da u isto vreme bude pilot, pedijatar, advokat i falsifikator čekova i to sve sa nepunih 18 godina, demonstriraće vam još jedna priča o korelaciji. Kao što se Leo pretvara da nije ono što jeste, to isto može da čini i neznačajna korelacija. Ovo je zamka u koju istraživači češće upadaju, nego u interpretiranje kauzacije kod korelacija – kada dobiju statistički neznačajnu korelaciju sa sigurnošću zaključuju da povezanosti između dve pojave nema. Način na koji se povezanost dve pojave sakrila i pretvorila u neznačajan rezultat, time bežeći Tomu Henksu statistike, je nešto o čemu istraživači retko razmišljaju. Naime, vrlo lako se zaboravlja da korelacija testira linearnu povezanost između dve pojave. U primeru sa bebama i rodama iz prvog dela naučnih zabluda, to bi značilo da što u nekom mestu ima više roda, ima i više beba. Da ne bude zabune, o značajnoj korelaciji, ali negativnoj, bismo govorili i kada bismo na primeru margarina i razvoda iz istog odeljka, dobili podatak da kako raste stopa razvoda u Mejnu, tako dolazi do opadanja upotrebe margarina. Odnosno, o linearnoj povezanosti govorimo, kada povećanje neke pojave linearno prati povećanje (pozitivna korelacija) ili smanjenje (negativna korelacija) neke druge.
Ali šta ćemo ako povećanje neke pojave prati povećanje druge samo do određenog nivoa, a da onda povećanje te prve pojave počne da prati smanjenje ove druge? Odnosno, šta ćemo ako nemamo linearnu povezanost, nego postoji “zlatna sredina”, kao npr. u nivou aspiracije, perfekcionizmu, radoholizmu ili nivou socijalne podrške. Ukoliko se setite svih onih situacija kada ste tugovali, verovatno ćete se setiti i potrebe da budete okruženi ljudima. Međutim, kao što će vam teško pasti da u takvim situacijama budete usamljeni, verovatno nećete biti najsrećniji time kada vas okruži gomila nebitnih i napadnih ljudi. To bi značilo da je za vas najbolji takav nivo socijalne podrške koji obuhvata nekoliko, odabranih ljudi. Međutim, šta to znači za korelaciju? To znači da bi vaše blagostanje raslo sa porastom socijalne podrške, ali samo do određenog nivo, do nivoa dok vas ne preplave dosadni rođaci. Nakon invazije rođaka dolazi do toga, da blagostanje počne ponovo da opada, sa povećanjem njihovog broja, budući da za nas može da predstavlja dodatni napor i podršku kakvu ne želimo. Kada bismo to predstavili grafički dobili bismo U-krivu, gde bismo rekli da je za osobu optimalan neki srednji nivo socijalne podrške, odnosno ni situacija kada nas ostave same, ni ona kada nas preplave razni ljudi. Ono što bismo dobili na ovom primeru, ukoliko bismo statistički proveravali povezanost između socijalne podrške i subjektivnog blagostanja, dobili bismo da je korelacija neznačajna. Do toga dolazi budući da se korelacijom testira linearna povezanost, dok u ovom našem primeru to nije slučaj. U takvim situacijama povezanost između dve pojave postoji, ali ne onakva kakvu testiramo našom korelacijom. U takvim situacijama bismo na osnovu našeg dobro prerušenog statistički neznačajnog rezultata, mogli lako da pogrešimo i kažemo da socijalna podrška nije povezana sa subjektivnim blagostanjem.
Saznanje da kada je korelacija neznačajna, može biti da su dve pojave povezane, ali nelinearno je skroz “Uhvati me, ako možeš”. Tom Henks je na kraju mogao, i ne samo to – napravio je od Lea FBI agenta. Na sličan način statističar može da nauči da testira nelinearnu korelaciju, i od naizgled statistički neznačajnog rezultata napravi statistički značajan.
Ukoliko želite da naučite kako da ne pravite ovakve greške tokom sprovođenja istraživanja, kao i da savladate odgovarajuće postupke statistikče analize podataka koje treba da obradite, uskoro ćete u SELF-u imati prilike da se priključite edukaciji iz primenjene statistike.