Oprydning af forvirring mellem sammenhæng og årsag 

Her er en historisk godbid, du måske ikke er opmærksom på. Mellem årene 1860 og 1940, da antallet af metodistministre, der boede i New England, steg, steg også mængden af ​​cubansk rom importeret til Boston - og de steg begge på en meget lignende måde. Således skal metodistministre have købt masser af rom i den periode!

Faktisk nej, det er en fjollet konklusion at drage. Hvad der virkelig foregår er, at begge mængder - metodistministre og cubansk rom - blev drevet opad af andre faktorer, såsom befolkningsvækst.

Når vi har nået den forkerte konklusion, har vi begået den alt for almindelige fejl forvirrende sammenhæng med årsagssammenhæng.

Hvad er forskellen?

To mængder siges at være korreleret  hvis både stiger og falder sammen (“positivt korreleret”), eller hvis den ene stiger, når den anden falder og omvendt (“negativt korreleret”).

Korrelation detekteres let ved hjælp af statistiske målinger af Pearsons korrelationskoefficient, som angiver, hvor tæt låst de to størrelser er, alt fra -1 (perfekt negativt korreleret) til 0 (slet ikke korreleret) og op til 1 (perfekt positivt korreleret).


indre selv abonnere grafik


 årsagssammenhæng1tylervigen.com

Men bare fordi to størrelser er korreleret, betyder det ikke nødvendigvis, at man er direkte forårsager den anden at ændre. Korrelation indebærer ikke årsagssammenhæng, ligesom overskyet vejr ikke indebærer nedbør, selvom det omvendte er sandt.

Hvis to mængder er korreleret, kan der meget vel være et ægte årsag og virkning-forhold (såsom nedbørsniveauer og paraplysalg), men måske kører andre variabler begge (såsom piratantal og global opvarmning), eller måske er det bare tilfældighed (som f.eks Amerikansk osteforbrug og strangulations-by-laken).

Selv hvor årsagssammenhæng er til stede, skal vi være forsigtige med ikke at blande årsagen sammen med virkningen, ellers kan vi f.eks. Konkludere, at en øget brug af varmeapparater forårsager koldere vejr.

For at fastslå årsag og virkning er vi nødt til at gå ud over statistikken og lede efter separate beviser (af videnskabelig eller historisk art) og logisk begrundelse. Korrelation kan tilskynde os til at gå på udkig efter sådanne beviser i første omgang, men det er på ingen måde et bevis i sig selv.

Subtile problemer

Selvom ovenstående eksempler åbenbart var dumme, forveksles sammenhæng meget ofte som årsagssammenhæng på måder, der ikke umiddelbart er tydelige i den virkelige verden. Når man læser og fortolker statistik, skal man være meget omhyggelig med at forstå nøjagtigt, hvad dataene og dens statistikker antyder - og vigtigere, hvad de er ikke antyder.

 årsagssammenhæng2

Et nylig eksempel på behovet for forsigtighed ved fortolkning af data er spændingen tidligere i år omkring den tilsyneladende banebrydende påvisning af gravitationsbølger - en meddelelse, der ser ud til at være foretaget for tidligt, før der blev taget højde for alle de variabler, der påvirkede dataene.

Desværre er analyse af statistikker, sandsynligheder og risici ikke et sæt færdigheder, der er forbundet med vores menneskelig intuition, og det er alt for let at blive vildledt. Hele bøger er skrevet på de subtile måder, hvorpå statistikker kan fortolkes fejlagtigt (eller bruges til at vildlede). For at hjælpe med at holde din vagt oppe er her nogle almindelige glatte statistiske problemer, som du bør være opmærksom på:

1) The Healthy Worker Effect, hvor nogle grupper undertiden ikke kan sammenlignes direkte på lige vilkår.

Overvej en hypotetisk undersøgelse, der sammenligner en gruppe kontormedarbejders helbred med en gruppe astronauters helbred. Hvis undersøgelsen ikke viser nogen signifikant forskel mellem de to - ingen sammenhæng mellem sundhed og arbejdsmiljø - skal vi konkludere, at det at leve og arbejde i rummet ikke medfører nogen langsigtede sundhedsrisici for astronauter?

Ingen! Grupperne er ikke på samme fod: astronautkorpset screener ansøgere for at finde sunde kandidater, der derefter opretholder et omfattende fitnessregime for proaktivt at bekæmpe virkningerne af at leve i ”mikrogravitation”.

Vi forventer derfor, at de i gennemsnit vil være sundere end kontormedarbejdere og med rette skulle være bekymrede, hvis de ikke var det.

2) Kategorisering og Stage Migration Effect - blanding af mennesker mellem grupper kan have dramatiske effekter på statistiske resultater.

Dette er også kendt som Will Rogers efter den amerikanske komiker, der efter sigende kvitterede:

Da Okies forlod Oklahoma og flyttede til Californien, hævede de det gennemsnitlige efterretningsniveau i begge stater.

For at illustrere, forestil dig at opdele en stor gruppe venner i en "kort" gruppe og en "høj" gruppe (måske for at arrangere dem til et foto). Efter at have gjort det er det overraskende nemt at hæve gennemsnitshøjden for begge grupper på én gang.

Bare bed den korteste person i den "høje" gruppe om at skifte til den "korte" gruppe. Den “høje” gruppe mister deres korteste medlem og støder således op på deres gennemsnitlige højde - men den “korte” gruppe får deres højeste medlem endnu, og dermed også i gennemsnit.

Dette har store implikationer i medicinske studier, hvor patienter ofte sorteres i "sunde" eller "usunde" grupper i løbet af test af en ny behandling. Hvis diagnostiske metoder forbedres, kan nogle meget lidt usunde patienter blive kategoriseret igen - hvilket fører til, at begge gruppers sundhedsresultater forbedres, uanset hvor effektiv (eller ej) behandlingen er.

 årsagssammenhæng3Valg og valg blandt dataene kan føre til de forkerte konklusioner. Skeptikerne ser periode med afkøling (blå), når dataene virkelig viser langvarig opvarmning (grøn). skepticalscience.com 

3) Data mining - når der er en overflod af data, kan bits og stykker kirsebærplukkes for at understøtte enhver ønsket konklusion.

Dette er dårlig statistisk praksis, men hvis det gøres bevidst kan være svært at få øje på uden kendskab til det originale, komplette datasæt.

Overvej ovenstående graf, der f.eks. Viser to fortolkninger af data om global opvarmning. Eller fluor - i små mængder er det en af ​​de mest effektive forebyggende lægemidler i historien, men den positive effekt forsvinder helt, hvis man kun nogensinde overvejer giftige mængder fluor.

Af lignende grunde er det vigtigt, at procedurerne for et givet statistisk eksperiment er fastgjort inden eksperimentet begynder og derefter forbliver uændrede, indtil eksperimentet slutter.

4) Klyngedannelse - hvilket kan forventes selv i helt tilfældige data.

Overvej en medicinsk undersøgelse, der undersøger, hvordan en bestemt sygdom, såsom kræft eller multipel sklerose, er geografisk fordelt. Hvis sygdommen rammer tilfældigt (og miljøet ikke har nogen effekt), ville vi forvente at se adskillige klynger af patienter som en selvfølge. Hvis patienterne spredes perfekt jævnt, ville fordelingen faktisk være meget tilfældig!

Så tilstedeværelsen af ​​en enkelt klynge eller et antal små klynger af sager er helt normal. Sofistikerede statistiske metoder er nødvendige for at bestemme, hvor meget gruppering der kræves for at udlede, at noget i dette område kan forårsage sygdommen.

Desværre giver enhver klynge overhovedet - endog en ikke-signifikant - en let (og ved første øjekast overbevisende) nyhedsoverskrift.

 årsagssammenhæng4

Statistisk analyse, som ethvert andet kraftfuldt værktøj, skal bruges meget omhyggeligt - og især skal man altid være forsigtig, når man drager konklusioner baseret på, at to størrelser er korreleret.

I stedet for skal vi altid insistere på særskilte beviser for at argumentere for årsag og virkning - og at beviser ikke kommer i form af et enkelt statistisk tal.

Tilsyneladende overbevisende sammenhænge, ​​siger mellem givne gener og skizofreni eller mellem en højt fedtindhold og hjertesygdomme, kan vise sig at være baseret på meget tvivlsom metode.

Vi er måske som en art kognitivt dårligt parat til at håndtere disse spørgsmål. Som canadisk underviser Kieran Egan sæt det i sin bog At få det forkert fra begyndelsen:

Den dårlige nyhed er, at vores udvikling udstyrede os til at leve i små, stabile jægersamleresamfund. Vi er mennesker fra Pleistocæn, men vores slidte hjerner har skabt massive, multikulturelle, teknologisk sofistikerede og hurtigt skiftende samfund, som vi kan leve i.

Som følge heraf skal vi konstant modstå fristelsen til at se mening i tilfældighed og forvirre sammenhæng og årsagssammenhæng.The Conversation

Denne artikel blev oprindeligt offentliggjort den The Conversation
Læs oprindelige artikel.


Om forfatterne

borwein jonathanJonathan Borwein (Jon) er Laureate Professor i matematik ved University of Newcastle. Han er Laureate Professor i matematik ved University of Newcastle og direktør for Centre for Computer Assisted Research Mathematics and its Applications (CARMA). Han har arbejdet på Carnegie-Melon, Dalhousie, Simon Fraser og Waterloo Universiteter og har haft to Canada Research Chairs i computing.

rose michaelMichael Rose er ph.d.-kandidat, School of Mathematical and Physical Sciences ved University of Newcastle. Mathematik ph.d.-studerende under vejledning af Laureate Prof. Jon Borwein ved University of Newcastle, Australien. Hjælper i øjeblikket med forskning i anvendelse af fraktal matematik til modellering af hjerne synaps distributioner.

Oplysning om offentliggørelse: Forfatterne arbejder ikke for, konsulterer med, ejer aktier i eller modtager finansiering fra nogen virksomhed eller organisation, der vil drage fordel af denne artikel. De har heller ingen relevante tilknytninger.


Anbefalet bog:

Penge, sex, krig, Karma: Noter til en buddhistisk revolution
af David R. Loy.

Penge, sex, krig, Karma: Noter til en buddhistisk revolution af David R. Loy.David Loy er blevet en af ​​de mest magtfulde fortalere for det buddhistiske verdensbillede og forklarer som ingen andre dets evne til at omdanne det sociopolitiske landskab i den moderne verden. I Penge, sex, krig, Karma, han tilbyder skarpe og endda chokerende klare præsentationer af ofte misforståede buddhistiske hæfteklammer - karmaens arbejde, selvets natur, årsagerne til problemer på det individuelle og samfundsmæssige niveau - og de virkelige årsager bag vores kollektive følelse af "aldrig nok , "hvad enten det er tid, penge, sex, sikkerhed ... endda krig. Davids "buddhistiske revolution" er intet mindre end en radikal ændring i måder, vi kan nærme os vores liv, vores planet, de kollektive vrangforestillinger, der gennemsyrer vores sprog, kultur og endda vores spiritualitet.

Klik her for mere info og / eller for at bestille denne bog på Amazon.