Om Hjørnet

I bloggen min skriver jeg om det som faller meg inn der og da. Derfor har den ingen rød trÃ¥d eller samlende tema, med den konsekvens at kategorien Diverse ganske stor. Bloggen min inneholder meninger, anekdoter fra dagliglivet, konspirasjoner, anvendt finans, filosofering, dikt jeg har skrevet og mye mer. Den dagen det bare er tørt […]

Print Friendly, PDF & Email

Continue Reading »

Abonnér

Legg igjen e-mail, så får du mail når jeg publiserer nytt innhold.

Ta kontakt i sosiale medier

Du finner meg her:

Mye lest siste 30 dager

Søk, og du skal finne (håper jeg)

Forræderiske tall 2: Samvariasjon eller årsak?

23.03.08 in StatistISK

Ofte når vi leser gjengivelser av snurrige sammenhenger og snodige årsaker, står vi overfor et vanlig problem i statistisk analyse. Nemlig det som går ut på å skille mellom årsakssammenheng (kausalitet) og samvariasjon (korrelasjon). Gang på gang går journalister i den fella, og lager store oppslag med sensasjonelle overskrifter, som ofte gir debatt på helt feil grunnlag.

NÃ¥r overskriften er “Kvinner med høy utdanning fÃ¥r oftere brystkreft” er det en slik feilslutning vi stÃ¥r overfor. Høy utdanning er neppe Ã¥rsaken, men det samvarierer. For kvinner med høy utdanning fÃ¥r barn senere, og Ã¥rsakssammenhengen gÃ¥r pÃ¥ hvor tidlig du fÃ¥r barn. Jo tidligere du fÃ¥r barn, og jo flere barn du fÃ¥r, jo mindre er sannsynligheten for Ã¥ fÃ¥ brystkreft (kausalitet). Hvor tidlig eller sent du fÃ¥r barn, samvarierer gjerne med hvor lang utdannelse du har tatt (korrelasjon). I tilfellet med brystkreft var uttalelsen tillagt avdelingsdirektør i helsestatistikk ved Folkehelseinstituttet, Heine Strand. Jeg hÃ¥per virkelig ikke det var han som hadde kommet med uttalelsen, men journalisten som hadde misforstÃ¥tt eller rett og slett vridd artikkelen feil.

Påstand: Høy musikk forårsaker kviser.

Ungdom hører på høy musikk. Ungdom får kviser. Ergo forårsaker høy musikk kviser.

Nei. Hormoner forårsaker kviser. Kviser samvarierer med en tendens til å ville høre på høy musikk.

Problemet med å tro at du har funnet en årsak, når du egentlig har funnet en samvariasjon er at du kan sette inn helt feil tiltak, fordi du trekker feil konklusjoner. Det er konsekvenser som er langt mer alvorlige enn at du får noen snurrige nettdebatter på tøysete grunnlag.

Et eksempel som er trukket frem i boken “The tiger that isn’t” er det med at det eldste barnet i en søskenflokk gjerne har høyere IQ enn yngre søsken. Undersøkelser har vist at det er slik. Teoriene har gÃ¥tt pÃ¥ at det skyldes at det første barnet fÃ¥r mest oppmerksomhet fra foreldrene, det neste barnet fÃ¥r mindre og sÃ¥ videre. Det høres jo ut som en plausibel forklaring. Men kan det være andre forklaringer?Jo, det kan det. Det er nemlig slik at det ofte i familier med lavere sosioøkonomisk status at du finner de store barneflokkene. Det er en mer sannsynlig Ã¥rsak, enn kun det faktum at det er flere søsken. Det er ikke i seg selv det Ã¥ ha søsken som gir lavere IQ-score, det er det at familier med lav sosio-økonomisk status fÃ¥r flere barn.

Når jeg jobber med slike statistiske sammenhenger for prognoseformål, bruker jeg følgende metodikk:

  • Analyser historiske data, og se om du finner signifikante sammenhenger historisk
  • Spør deg om sammenhengen er logisk, altsÃ¥ om det er rimelig Ã¥ tro at det ligger en Ã¥rsakssammenheng her. Er det vanskelig Ã¥ finne en logisk sammenheng, er det muligens en “tilfeldig” samvariasjon du stÃ¥r overfor
  • Vil den historiske sammenhengen ogsÃ¥ gjelde i fremtiden?

Først om alle de tre tingene er til stede, kan du mene at dette er en sammenheng du kan legge vekt på. Og når man leser om de rareste konklusjoner i mediene, er det på sin plass å se etter logikken, som i eksempelet med brystkreft og høy utdannelse.

Print Friendly, PDF & Email

Tagged With:

18 Reader Comments

Trackback URL | Comments RSS Feed

  1. Olds69 says:

    Eller sagt kortere:

    Correlation does not imply causation

    Olds69

  2. Marina says:

    Og når det gjelder sammenhengen mellom brystkreft og ikke å få barn i ung alder, er sammenhengen slett ikke så stor som mange vil ha det til. Ettersom jeg er en kvinne på omtrent 40 som aldri har fått barn er jeg bare nødt til å vite dette for å kunne stoppe kjeften på folk som bruker altfor mye tid og energi på å kritisere meg for å ikke ha fått barn.
    Sjansene for å få brystkreft er bare svært lite større for kvinner som ikke har fått barn før de fylte 30. Nære slektninger som har hatt brystkreft, overvekt, og diverse sykdommer øker sjansene mye mer, men stort sett dreier det seg ganske enkelt om å være uheldig. Samme gjelder forresten så godt som alle sykdommene vi til stadighet leser om hvordan vi kan unngå ved å spise visse matsorter eller ta piller eller noe sånt. Hvis man blir syk er det hovedsaklig fordi man er uheldig, ikke fordi man ikke levde riktig.
    Men ved å leve sunt kan man minske sjansene for diverse sykdommer litt.

    Marinas siste bloggpost er..Sub-optimal husjakt, uten hagle

  3. Iskwew says:

    That’s right, Olds 🙂

    Det har du helt rett i, Marina. Og det er skremmende hvordan slike undersøkelser blåses opp som skremselspropaganda.

  4. Goodwill says:

    En sten kan ikke flyve. Mor Nille kan ikke flyve. Ergo er Mor Nille en sten.

    ~Erasmus Montanus~

    Goodwills siste bloggpost er..Dejligt!

  5. Iskwew says:

    Nettopp, ja, Goodwill 😉

  6. Anne says:

    Foreleser’n min pleide Ã¥ bruke eksemplet IQ og skonummer 🙂

    Annes siste bloggpost er..Seminarhelvetet II

  7. Weinberg says:

    Alltid like interessant at noen tror korrelasjon og kausalitet er det samme. Jeg burde antageligvis en tid fått gratis sesongkort hos AaFK siden de en periode ikke tapte noen av kampene jeg var på. Dessverre ble utvalgsstørrelsen med tiden økt såpass at korrelasjonen ble svekket.

    For øvrig kjenner vi vel alle sammenhengen mellom pirater og global oppvarming…

    Weinbergs siste bloggpost er..Klimaproblemet, the Rögnvaldur Hannesson way

  8. Iskwew says:

    Hehe – den avtok etterhvert, ja? Synd det, ellers kunne du jo ha satt penger pÃ¥ det, og tjent deg rik!

  9. Weinberg says:

    De møtte Start og da røyk hele statistikken. Hersens sørlendinger!

    Kombinasjonen sunnmøring og har hatt statistikk tilsier vel at jeg spiller relativt lite. Selv ikke årets Tippeligavinner har jeg spilt på, selv om det ifølge e24 og tretten ligninger med tretten ukjente skal være mulig å tjene penger på det (men det er som vanlig før gebyrer hos de forskjellige bookmakere er regnet inn).

    Weinbergs siste bloggpost er..Dagens figur – fattige barn og kaffidrikking

  10. Iskwew says:

    Mja, du kan jo ha flaks du som andre folk. Og dessute, skal du først spille på noe, skal du spille på fotball. Eller hester. Der du kan ha nytte av kunnskap.

  11. Weinberg says:

    Hester er uinteressant. Med tanke pÃ¥ hvordan økonomien ser ut i dag er den vel omtrent like volatil som en middels tippekupong, sÃ¥ med noen litt over middels enkle analyser og en stategi med lavoddsere burde det kanskje være mulig Ã¥ gÃ¥ i pluss (spørsmÃ¥let er om det er verdt tidsbruken). Tror uansett det er bedre mÃ¥ter Ã¥ sikre pensjonen pÃ¥ pÃ¥ lang sikt 🙂

    Weinbergs siste bloggpost er..Dagens figur – fattige barn og kaffidrikking

  12. Iskwew says:

    Sannsynligvis er det nok det, ja. Å gå på NHH er f.eks. en god start.

    Jeg har forresten vunnet 2.500 på Øvrevoll en gang, da. Jeg tippet på de hestene som hadde de peneste navnene. Det funka. Uten at jeg tenkte på det som en god strategi for pensjonssikring.

  13. centipede says:

    Bare for Ã¥ kverulere litt: Overskriften “Kvinner med høy utdanning fÃ¥r oftere brystkreft” representerer faktisk ingen feilslutning. Den sier ikke at høy utdannelse fører til brystkreft. Den gjør bare oppmerksom pÃ¥ en korrelasjon.

    Hadde overskriften derimot sagt “Høyere utdannelse gir kvinner brystkreft” hadde saken vært en annen.

  14. Iskwew says:

    SprÃ¥kpirk er selvsagt lov 🙂 Men les artikkelen hos ABC-nyheter. Der stÃ¥r det ikke noe om at dette er en ren samvarioasjon.

Top