Sannsynligvis vil han gjøre det igjen

Du og jeg er ikke gjennomsnittsmennesker. Ingen vi kjenner er det, til det er mennesket for mangefasettert. Det kan vi sikkert være enige om, men likvel bruker vi diverse gjennomsnitt for å beskrive virkeligheten, og kommer frem til noen stereotypier som beskriver den. Så sier vi at slik er

kvinner
menn
nordmenn
innvandrere
gamle
unge

eller slik er

voldteksforbryteren
morderen
bankraneren

og så videre.

Det som er saken er at gjennomsnitt er gode til å beskrive grupper, spesielt store grupper. Men til å beskrive, eller predikere, enkeltmennesker fungerer det veldig sjelden like bra. Strengt tatt kan det bare brukes om variasjonen mellom individene i populasjonen er lav.

Et eksempel på to serier med gjennomsnitt 50:

1. 00 25 50 75 100
2. 48 49 50 51 052

I den første serien er det stor variasjon, i den andre er det liten variasjon. Det ser du med et blikk. I større serier er det vanskeligere, og da beregnes noe som heter standardavvik ((Gjennomsnittlig avvik fra gjennomsnittet eller )). For serie 1 er det 35, for serie 2 er det 1,4.

En serie bestående av 0 og 100 har forøvrig også et gjennomsnitt på 50.

I Economist fant jeg en artikkel som omhandler hvordan gjennomsnitts-betraktninger brukes i domstolene i USA og England. Der brukes de blant annet til å se på gjentakelsesfaren for personer som har begått alvorlige forbrytelser. I USA handler det om avgjørelser som kan bety liv eller død. I Storbrittania brukes det til å avgjøre om forvaring skal brukes. Hvordan det er i Norge, vet jeg ikke, men jeg ser ikke bort fra at lignende betraktninger kan brukes her. Man gjør en risiko-prediksjon. Basert på ting som alder, relasjoner, kriminell historie og hvilken type offer de har valgt. Om noen plasseres i en gruppe der en høy andel har gjentatt kriminelle handlinger, antar man at risikoen for at det enkeltindividet skal begå nye kriminelle handlinger, er lik den gruppen har.

Stephen Hart m.fl. på University of British Colombia, gjennomgikk noen av testene som brukes for å studere hvorvidt de faktisk predikerer godt også for enkeltindivider. Sannsynligheten for at seksualforbrytere ville begå nye overgrep var satt til 36% innenfor en periode på 15 år. Forskerne fant utfallsrommet faktisk var mellom 30% og 43%, på 95% konfidensnivå. Ved bruk av standard statistiske metoder for å overføre gruppedata til individnivå fant de at på et 95% konfidensnivå var utfallsrommet mellom 3% og 91%. Det er jo omtrent som å si at det er umulig å si noe.

Det blir helt meningsløst å bruke et så stort mulighetsområde til å predikere noe som helst. Og når det så styrer menneskers livsskjebne, for ikke å snakke liv og død, er det livfarlig.

Ellers leste jeg i Magasinet i helgen at Jan Erik Kristiansen på SSB kommer med bok snart. Den heter “Tall kan temmes!”, handler om statistikk og bruk av statistikk og er delvis rettet mot journalister.

“Jeg tar vel ikke for hardt i hvis jeg sier at journalister ikke er de skarpeste knivene i skuffen når det gjelder tall“, sier Kristiansen.

*humre*

Videre sier han at det i hovedsak er to grupper som lyver med statistikk: journalister og politikere. Journalisten for å dramatisere og lage nyheter, og politikeren for å tilpasse statistikken til sin politiske agenda. Men ikke alt er av vond vilje. Noen ganger er det mangel på kunnskap og forståelse. Som når man ukritisk bruker gjennomsnitt for å beskrive virkeligheten. Her kan forhåpentligvis boken hjelpe.

Posted

24.06.07

StatistISK

Iskwew

Tags:

Kriminalitet, MSM, Risiko, Tallknusing

Comments

16 responses to “Sannsynligvis vil han gjøre det igjen”

radiohode

24.06.07

Hvorfor uteglemme modus og median?
Iskwew

24.06.07

Kanskje det kommer mer etterhvert? :o)

Altså er det ikke uteglemt.

Median er sjelden noe godt mål, med mindre populasjonen er stor, og da er den omtrent som mean. Den gir skjeve resultater.
Frida K

25.06.07

Median blir brukt om debutalder. Er det hensiktsmessig?
Iskwew

25.06.07

Jeg tipper grunnen til at de bruker median der er at det er noen som aldri debuterer, og dermed drar opp snittet kraftig. Om utvalgene er store nok, blir resultatet omtrent som gjennomsnittet av de som faktisk debuterer.

Alternativet til median er å beregne gjennomsnitt av de som faktisk debuterer, ved at du holder de som ikke gjør det utenfor gjennomsnittsberegningen.
Helge

25.06.07

Statistikk kan jammen brukes til mye rart. Selv har jeg en yrkesskade (godkjent som det etter syv år!) Jeg ble gjort oppmerksom på at jeg statistisk sett hadde blitt syk før tiden i forhold til gjennomsnittseksponering, og at dette ville bli brukt for det det var verdt av forsikringssselskaper.

Tjohei hvor det går over stokk og stein av og til :O)
Iskwew

25.06.07

Forsikringsselskaper er kjent for å bruke slikt i utstrakt grad, ja. De tar seg betalt om du ikke er på gjennomsnittet…
Mads

25.06.07

Du skriver:

«Det som er saken er at gjennomsnitt er gode til å beskrive grupper, spesielt store grupper. (…) Strengt tatt kan det bare brukes om variasjonen mellom individene i populasjonen er lav.»

Er ikke dette selvmotsigende, at gjennomsnitt best beskriver store grupper … og lav populasjon? Eller misforstår jeg?
Mads

25.06.07

Dette var en veldig interessant post.

1. Ad debutalder:
Hvis man tar gjennomsnittet av dem som HAR debutert (i stedet for alle) og sammenligner med median, vil ikke det bli temmelig likt? Kan man egentlig oppnå store sprik mellom de to målemåtene?

2. Kanskje er prediksjon av kriminalitet svært lite treffende, til og med ubrukelig i visse tilfeller. Det beste verktøyet vi har for å forutse handlinger, er med andre ord dårlig.

Men går det egentlig an å AVSTÅ fra å bruke prediksjon i domstolene? Jeg kan ikke se hvordan vi skal greie det. Når vi skal avgjøre hvorvidt en person skal dømmes til streng eller mild straff, tidsbestemt straff eller forvaring, er vi helt nødt til å begynne å vurdere mange ulike faktorer.

Men jeg mener vi kan redusere bruken av prediksjon i rettssystemet. Den mest menneskefiendtlige prediksjonen er generelle forbud for ALLE innen én kategori. Unge Venstre mener:

«Straffedømte som har sonet sin straff og gjort opp for seg skal ikke bli ytterligere straffet ved et generelt yrkesforbud. Yrkesforbud kan bare bli pålagt ved dom.»

Slike generelle yrkesforbud, som vi gjerne ser i forbindelse med sexforbrytelser, brer om seg, og er etter min mening et lite treffsikkert tiltak, og i mange tilfeller et uttrykk for en grov fordømmelse.

Man må for eksempel ha attest for å jobbe som lærer. 17-åringen som ble dømt for å ha hatt sex med sin kjæreste på 14 år, er altså LIKE utelukket som lærer som den mest bestialske og farlige overgriper — som med det tidligere systemet ble fanget opp i domstolen på grunn av den glimrende paragraf 29 i straffeloven:

http://www.lovdata.no/all/tl-19020522-010-004.html#29

Ifølge SSBs statistikker, er det bare miljøkriminalitet som har lavere tilbakefallsrate.

http://www.ssb.no/emner/03/05/a_krim_tab/tab/tab-2007-04-13-24.html

Med andre ord: Den strengste prediksjonen brukes på den kategorien lovbrudd hvor gjentakelsesfaren er blant de laveste.

Konklusjon: Prediksjon bør foretas individuelt, nettopp fordi alle mennesker har en helt særegen historie, bakgrunn, beveggrunner, forutsetninger og evner.

Generell prediksjon og gjentakelsesfare basert på gjennomsnitt eller andre generaliseringer, bør vi være ytterst varsomme med. Nyansene MÅ ivaretas, også i domstolene.
Marina

25.06.07

Hvis jeg sier at politikere vil fortsette å lyve om statistikk er 100%, tror jeg nok likevel at jeg har mitt på det tørre!
Men jeg er ikke sikker på at det kan bevises matematisk…
Iskwew

25.06.07

[quote comment=”21502″]

Er ikke dette selvmotsigende, at gjennomsnitt best beskriver store grupper … og lav populasjon? Eller misforstår jeg?[/quote]

Jeg sier at variasjonen i populasjonen er lav, ikke at selve populasjonen er det. Om variasjonen er lav, som i mitt eksempel 2, er det jo rimelig presist å si ca. 50. I eksempel 1, der variasjonen er stor, er det ikke rimelig å si det, fordi observasjonene er spredd fra 0 til 100, selv om snittet er 50 der også.
Iskwew

25.06.07

Mads,

1. Dersom utvalgene er store, er det gjerne ikke stor forskjell på mean og median. Med mindre variasjonen er stor, den ene eller den andre veien.

2. I Norge er det vel stort sett etter at psykologer/psykiatere har studert den tiltalte at man avgjør f.eks. forvaring eller ikke? Det vil jo si at man studerer på individnivå. Men dette vet jeg ikke nok om.

Og OM man skal bruke statistiske anslag på f.eks. gjentakelsesfare, så må man i hvert fall vite hva man gjør. Det var jo en enkel sak for forskerne å plukke disse standardene fra hverandre.

Marina, jeg tror du har helt rett i at sannsynligheten for det er omtrent 100%, ja.
Hold T. Forfall

29.06.07

Vel, det er faktisk ikke nødvendigvis slik at median og gjennomsnitt konvergerer ved store utvalg. Om det du estimerer i seg selv er en gjennomsnittsverdi og der du har rimelig grunn til å tro at sentralgrensesetningen(e) gjelder, så ja — men ikke hvis du estimerer noe som er genuint skjevt. Debutalder var nevnt som eksempel — der har du et problem med at noen punkter bør ha “uendelig” verdi (eller fjernes fra utvalget), men hvis man for eksempel ser på antall seksualpartnere i løpet av livet (som er et endelig og i praksis også begrenset tall, til stor sorg for enkelte), så har man en fordeling som formodentlig er ganske skjev. Eller i hvert fall ikke kan påregnes å være spesielt symmetrisk. Da kan muligens median være et bedre mål enn gjennomsnitt.

Også for tilfeller der du muligens kunne ha en teoretisk konvergens mellom median og gjennomsnitt, kan robust statistikk noen ganger ha noe for seg.

Mads: Hva angår debutalder for dem som har debutert: Her har vi et potensielt metodisk problem. For eksempel hvis faktisk debutalder er på vei oppover, så betyr det at en betydelig del av utvalget utsetter sin debut sammenlignet med “forrige statistikk”. Men disse vil for den perioden de ikke har debutert, falle ut av statistikken. Dermed kan det målte resultatet bli at gjennomsnittet av dem som har debutert, går ned — fordi de som trekker snittet opp, ikke er med. Når disse da debuterer seg inn i statistikken, så kan denne gjøre et uforholdsmessig stort byks opp før den stabiliserer seg. Virkningen kan være at den målte utviklingen ser ut som 18 — 17 — 20 — 19 mens virkeligheten var 18 — 18.5 — 19 — 19. Bare for å ta noen tall ut av lufta. Eksempelet er hypotetisk, men jeg har sett slike diskusjoner dukke opp på virkelige data.
Iskwew

29.06.07

Interessant, HTF.

*noterer*
Milton Marx

01.07.07

Politiet hadde en veldig trist sak for noen år siden. Bare søk på Landås-saken. Kort fortalt slo politiet alarm fordi for mange eldre døde på vaktene til en kvinnelig pleier på et sykehjem.

De hadde kjørt tallene gjennom sitt nye statistikkprogram, og sjansene for at noe slikt var tilfeldig, var bare så alt for små – mente de.

Damen gikk gjennom et helvete i media, og fikk vel i realiteten livet delvis ødelagt.

Alt sammen fordi politiet manglet en helt grunnleggende forståelse for statistikk. Dersom man ikke tillater de spesielle avvikene, faller jo all logikk om generalisering sammen! Det politiet gjorde, kan sammenlignes med å kjøre i gang en tung etterforskningsprosess mot en lottovinner, bare fordi sjansene for at det ikke er juks er så alt for små.

Det skremmende var egentlig i hvilken grad politiet fikk holde på å drite seg ut i måneder uten at landets intellektuelle og sakkyndige sa fra.

Kobles dette sammen med den kritikken samme instans har fått for sine avhørsmetoder, blir bildet skremmende. De har til tider brukt teknikker som er så manipulative at de har presset frem tilståelser fra uskyldige mennesker.

Den skal i sannhet være sterk den som skal slippe helskinnet gjennom noe slik – likegyldig av hvor uskyldig vedkommende er.
Iskwew

01.07.07

Milton, det er utrolig mange yrkesgrupper som bruker statistikk uten å ha filla peiling på hva de driver med. Og når den så anvendes på individnivå, blir det fort hakkende galt. Leger gjør det også, de har ikke svart belte i statistikk de heller. For ikke å snakke om Mattilsynet, som ved god bruk av statistiske metoder ikke hadde overtestet (så til den milde grad) kjøttdeig da unger ble syke og døde. De fulgte bare det ene sporet, og tok prøver av omtrent alt som var av kjøttdeig og overså alt annet.
Farlig marginalisering « Seksuelt usivilisert

08.12.08

[…] fordi vi frykter at du kanskje kan komme til å begå lovbrudd igjen». Men en slik følelsesladd prediksjon bygger mer på fordommer og frykt enn en reell risikovurdering av […]