Sådan undgår du de syv dødbringende synder ved statistisk fejlagtig fortolkning

Statistik er et nyttigt redskab til at forstå mønstrene i verden omkring os. Men vores intuition svigter os ofte, når det kommer til fortolkning af disse mønstre. I denne serie ser vi på nogle af de almindelige fejl, vi laver, og hvordan vi undgår dem, når vi tænker på statistik, sandsynlighed og risiko.The Conversation

1. Forudsat at små forskelle er meningsfulde

Mange af de daglige udsving på aktiemarkedet repræsenterer tilfældighed snarere end noget meningsfuldt. Forskelle i afstemninger, når en part er foran et point eller to, er ofte bare statistisk støj.

Du kan undgå at drage fejlbehæftede konklusioner om årsagerne til sådanne udsving ved at kræve at se "fejlmargenen" vedrørende tallene.

Hvis forskellen er mindre end fejlmargenen, er der sandsynligvis ingen meningsfuld forskel, og variationen er sandsynligvis bare ned til tilfældige udsving.

Sådan undgår du de syv dødbringende synder ved statistisk fejlagtig fortolkningFejllinjer illustrerer graden af ​​usikkerhed i en score. Når sådanne fejlmargener overlapper hinanden, skyldes forskellen sandsynligvis statistisk støj.


indre selv abonnere grafik



2. Ligestilling af statistisk signifikans med virkelighedens betydning

Vi hører ofte generaliseringer om, hvordan to grupper adskiller sig på en eller anden måde, såsom at kvinder plejer mere, mens mænd er fysisk stærkere.

Disse forskelle trækker ofte på stereotyper og folkelig visdom, men ignorerer ofte lighederne mellem mennesker mellem de to grupper og variationen i mennesker inden for grupperne.

Hvis du vælger to mænd tilfældigt, er der sandsynligvis stor forskel i deres fysiske styrke. Og hvis du vælger en mand og en kvinde, kan de ende med at blive meget ens med hensyn til pleje, eller manden kan være mere plejende end kvinden.

Du kan undgå denne fejl ved at bede om "effektstørrelse" af forskellene mellem grupper. Dette er et mål for, hvor meget gennemsnittet for en gruppe adskiller sig fra gennemsnittet for en anden.

Hvis effektstørrelsen er lille, er de to grupper meget ens. Selvom effektstørrelsen er stor, vil de to grupper sandsynligvis stadig have stor variation inden for dem, så ikke alle medlemmer af en gruppe vil være forskellige fra alle medlemmer af en anden gruppe.


3. Forsømmer at se på ekstremer

Bagsiden af ​​effektstørrelse er relevant, når den ting, du fokuserer på, følger et ”Normal fordeling”(Undertiden kaldet en“ klokkekurve ”). Det er her, de fleste mennesker er tæt på gennemsnittet, og kun en lille gruppe ligger langt over eller langt under gennemsnittet.

Når det sker, frembringer en lille ændring i ydeevne for gruppen en forskel, der ikke betyder noget for den gennemsnitlige person (se punkt 2), men som ændrer ekstremernes karakter mere radikalt.

Undgå denne fejl ved at reflektere over, om du har at gøre med ekstremer eller ej. Når du har at gøre med gennemsnitlige mennesker, betyder forskelle i små grupper ofte ikke noget. Når du holder meget af ekstremerne, kan forskelle i små grupper have masser af dynger.

Sådan undgår du de syv dødbringende synder ved statistisk fejlagtig fortolkningNår to populationer følger en normalfordeling, vil forskellene mellem dem være mere tydelige ved ekstremiteterne end i gennemsnittene.


4. Tillidsfuld tilfældighed

Vidste du, at der er en korrelation mellem antallet af mennesker, der hvert år druknede i USA ved at falde i en swimmingpool, og antallet af film, Nicholas Cage dukkede op i?

Sådan undgår du de syv dødbringende synder ved statistisk fejlagtig fortolkningMen er der en årsagssammenhæng? tylervigen.com

Hvis du ser hårdt nok ud, kan du finde interessante mønstre og sammenhænge, ​​der kun skyldes tilfældighed.

Bare fordi to ting tilfældigvis ændrer sig på samme tid eller i lignende mønstre, betyder det ikke, at de er beslægtede.

Undgå denne fejl ved at spørge, hvor pålidelig den observerede tilknytning er. Er det en engangsart, eller er det sket flere gange? Kan fremtidige foreninger forudsiges? Hvis du kun har set det en gang, skyldes det sandsynligvis tilfældig chance.


5. At få årsagssammenhæng bagud

Når to ting er korreleret - for eksempel arbejdsløshed og psykiske problemer - kan det være fristende at se en "åbenbar" årsagsvej - sig at psykiske problemer fører til ledighed.

Men nogle gange går kausalvejen i den anden retning, såsom arbejdsløshed, der forårsager psykiske problemer.

Du kan undgå denne fejl ved at huske at tænke på omvendt årsagssammenhæng, når du ser en tilknytning. Kunne indflydelsen gå i den anden retning? Eller kunne det gå begge veje og skabe en feedback-loop?


6. Glemmer at overveje eksterne årsager

Mennesker evaluerer ofte ikke mulige ”tredje faktorer” eller eksterne årsager, der kan skabe en sammenhæng mellem to ting, fordi begge faktisk er resultatet af den tredje faktor.

For eksempel kan der være en sammenhæng mellem at spise på restauranter og bedre hjerte-kar-sundhed. Det kan få dig til at tro, at der er en årsagsforbindelse mellem de to.

Det kan dog vise sig, at de, der har råd til at spise på restauranter regelmæssigt, er i et højt socioøkonomisk beslag og også har råd til bedre sundhedspleje, og det er sundhedsvæsenet, der giver bedre kardiovaskulær sundhed.

Du kan undgå denne fejl ved at huske at tænke på tredje faktorer, når du ser en sammenhæng. Hvis du følger op på en ting som en mulig årsag, så spørg dig selv, hvad der igen forårsager den ting? Kunne den tredje faktor forårsage begge observerede resultater?


7. vildledende grafer

Der opstår meget ondskab i skalering og mærkning af den lodrette akse på grafer. Etiketterne skal vise det fulde meningsfulde udvalg af det, du ser på.

Men nogle gange vælger grafproducenten et snævrere interval for at gøre en lille forskel eller tilknytning mere imponerende. På en skala fra 0 til 100 ser to kolonner muligvis ud i samme højde. Men hvis du tegner de samme data kun fra 52.5 til 56.5, kan de se drastisk anderledes ud.

Du kan undgå denne fejl ved at passe på at notere grafens etiketter langs akserne. Vær især skeptisk over for umærkede grafer.

Sådan undgår du de syv dødbringende synder ved statistisk fejlagtig fortolkningGrafer kan fortælle en historie - hvilket gør forskelle større eller mindre afhængigt af skalaen.

Om forfatteren

Winnifred Louis, lektor, socialpsykologi, University of Queensland og Cassandra Chapman, ph.d.-kandidat i socialpsykologi, University of Queensland

Denne artikel blev oprindeligt offentliggjort den The Conversation. Læs oprindelige artikel.

Relaterede Bøger:

at InnerSelf Market og Amazon