For noget tid siden kunne en undersøgelse fra Odense Universitetshospital konkludere, at det er farligt at bo i centrum. Eller i hvert fald hvis man løber efter overskriften på Politikens hjemmeside, som lyder: “Forsker overrasket: Det ser ud til at være farligt at bo i centrum”. Det viser sig åbenbart, at det øger risikoen for åreforkalkning, en af de hyppigste sygdomme i det vestlige samfund, at bo i centrum, eller som Politiken skriver: “Hvis du bor i centrum af København, Aalborg, Aarhus eller Odense er du i højrisiko for at få åreforkalkning.” Forklaringen skulle være den øgede forurening, man kan forvente omkring centrum.
Det kan jo sådan set være meget godt, ja eller trist om man vil, og hvorfor skulle det være interessant for en psykolog? Det, som fanger min opmærksomhed og interesse her, er, at det er uklart, hvordan resultaterne er kommet i stand, og da jeg prøvede at efterfølge historien, fandt jeg nogle metodiske uklarheder og mediemæssige stramninger, som kan have interesse for den metode-orienterede psykolog/studerende. Det kan også fungere som en illustration af de spring, der kan være fra forskning til nyhed. Indlægget her repræsenterer denne række af tanker og min nærmere undersøgelse. Det bør siges, at indlægget er den spæde start på et forhåbentlig større metodefokus her på hjemmesiden som.
Som en disclaimer må jeg sige, at jeg ikke ved noget særligt om åreforkalkning eller dets årsager, og det er ikke en kritik af lægernes faglighed, men blot et case eksempel på, hvilke metodiske problemer man ofte ser i denne slags undersøgelser samt en advarsel om ikke at lade sig rive med af det der står i avisen (det sidste burde være en no-brainer).
Pressemeddelelsen
Efter den alarmerende overskrift fra Politiken er det næste stop Odense Universitetshospitals hjemmeside for at finde det, jeg regner med, er en pressemeddelelse – journalister gransker sjældent forskningsartiklerne så mon ikke artiklen bygger på en sådan? Og her er der ganske rigtigt en med overskriften: Forurening fordobler risiko for åreforkalkning. Ok, det lyder jo umiddelbart slemt nok til at tale om højrisiko… indtil man begynder at tænke lidt over ordene her. En fordobling af en risiko siger sådan set ikke noget om, hvor høj risikoen er, bare at den er dobbelt så høj. Men i forhold til hvad? En “højrisiko” derimod sætter risikoen i en bås (ingen, lav, mellem, høj), som der umiddelbart ikke er dækning for. Hvis risikoen var lav før, så kunne den efter en fordobling sådan set stadig være lav eller måske mellem. Og hvis risikoen var høj, så siger det jo ikke så meget, at den nu også er høj, eller måske “mere høj”. Det vi mangler er altså et tal på, hvad risikoen er for at få åreforkalkning.
På netpatient.dk finder vi, at ca. 250.000 danskere er ramt af denne sygdom i forskellig grad, og at den tegner sig for ca. 1/3 af alle dødsfald i Danmark. Faktisk står der, at: “Hyppigheden øges med alderen, således at de fleste personer over 60 år i større eller mindre grad vil få åreforkalkning”. Det er naturligvis mange (ca. 4% af den danske befolkning), så problemet er stort kan man se, men først når der kommer konkrete tal på. Det viser os også noget om den bagvedliggende logik i undersøgelsen, at man tilsyneladende har taget et udpluk af befolkningen, og herefter grupperet dem i meningsfulde kategorier ud fra en hypotese, og så set på hvordan andelen af åreforkalkning fordeler sig i de forskellige grupperinger. Når vi kigger i rapporten, så viser det sig, at det er sådan man har gjort, men nu er vi jo kun kommet til pressemeddelelsen. Her er der allerede en lurende mistanke om, at en mulig begrebslig glidning, når man blander andel og risiko sammen, da dette hurtigt kan lede til en sammenblanding af korrelation og årsag.
I pressemeddelelsen kan man videre læse, at: “Risikoen for at få [egt: Andelen af… (m.k.)] forkalkede kranspulsårer er dobbelt så stor for beboerne i centrum af de større byer som for indbyggerne i mindre forurenede by- og landområder.” Nu nævnes ikke længere specifikke bynavne, bare større byer. Vi får lidt flere tal på bordet her: “1.225 mænd og kvinder i alderen mellem 50 og 60 år deltog i undersøgelsen. 20 procent af dem (251 personer) bor i centrum af større danske byer.”
251 personer? Som så sammenlignes med resten? Og hvilke større danske byer, hvor mange har de fordelt sig på, hvordan er undersøgelsen lavet?
Åh alle de spørgsmål kan kun besvares ved selve kilden, som er en artikel i Journal of Internal Medicine. Lige som en sidenote. Jeg synes at det er en uskik, at man i sådanne pressemeddelelser ikke linker til artiklen, også selvom man kun kan læse den, hvis man er tilknyttet et forskningsbibliotek. Nå skidt, jeg kan vel godt finde den slags, så her er det manglende link. I dette tilfælde er den faktisk offentlig tilgængelig.
Artiklen
Artiklen har den besnærende titel: The relation between coronary artery calcification in asymptomatic subjects and both traditional risk factors and living in the city centre: a DanRisk substudy, af Lambrecthsen et al, 2012 (der er 8 forfattere, så jeg tillader mig et et al, men se nederst på siden for den fulde reference).
Metodevalg
Når man kigger lidt rundt i de seneste numre af tidsskriftet, kan man se, at emnet tilsyneladende har en vis bevågenhed pt., så artiklen skriver sig nok ind i en længere faglig diskussion. Det ser også ud som om, at man som udgangspunkt i artiklen har haft som hypotese, at luftforurening kunne spille en rolle, sammen med de øvrige kendte faktorer (bl.a. køn, alder, rygning), og det er et klart plus til artiklen, da det tyder på at forfatterne ikke har været på fisketur og fundet en tilfældig korrelation i datamaterialet. Man har faktisk ledt efter netop denne effekt, og altså tilsyneladende fundet den. Det viser sig også, at studiet er en tværsnitsundersøgelse, hvilket vil sige, at man har undersøgt repræsentanter i aldersgrupperne 50 års alderen og i 60 års alderen i begge køn, fordelt i byer og omegn.
Der er intet galt i tværsnitsunderøgelser, men det begynder alligevel at blive lidt suspekt, da både pressemeddelelsen og Politikens artikel mere end antyder, at det er forureningsmængden i centrum, som forårsager den forøgede risiko. Dette kan man ikke konkludere ud af en tværsnitsundersøgelse. Det er ikke en tværsnitsundersøgelses styrke at finde kausale sammenhænge men derimod korrelationer mellem grupperinger. Kausale sammenhænge kræver typisk kontrollerede eksperimentelle forhold, da man skal have styr på variablerne, men i dette tilfælde er der ikke styr på variablerne grundet undersøgelsens design. Det er der ikke noget galt i, det handler kun om hvor meget man kan tillade sig at generalisere. Det kan naturligvis indvendes at også eksperimenter kan have problemer med at udtale sig om kausale sammenhænge, men den kritik, om end den kan have sin rigtighed, er ikke relevant for nærværende. Et mere egnet metodedesign ville have været langtidsundersøgelser (longitudinal studies), som ganske vist også har variabel-kontrol problemer, men som dog har en bedre mulighed for at indikere kausalitet. Det er dog værd at bemærke, at i forhold til Lambrecthsen et als artikel, så er kausalitetsspørgsmålet en del af den såkaldte journalistiske stramning, og ikke indeholdt i artiklen.
Byer og personer
Det næste, man opdager, er, at “større byer” betyder Odense, Kolding, Fredericia, Vejle og Esbjerg, og at fordelingen af “respondenter” her er 31, 73, 65, 53, 29 (n=251). Altså ikke København, Århus og Ålborg som Politiken skrev om. Dette skyldes sikkert, at Politikens journalist har forestillet sig, at den moderne læser ikke kunne relatere sig til byer som Esbjerg, og at nyheden ville være større (“katastrofen” mere omfattende), hvis det i stedet var København. Og journalisten føler sig sikkert berettiget til at foretage denne generalisering, da forureningen jo må være større i disse byer end i Esbjerg. Problemet er, at sådan kan man ikke nødvendigvis generalisere, og særligt ikke med rygstød i denne undersøgelse. Hvis alt andet var lige, og det eneste som var forskelligt mellem de forskellige byer var forureningsmængden, så kunne man være berettiget til at lave en sammenhæng, men alt andet er ikke lige, så det kan man ikke uden yderligere undersøgelser. Jeg har allerede antydet, at det at A og B er korreleret ikke nødvendigvis betyder, at de er kausalt forbundet. Det hører til det første, jeg fik banket ind i mit hoved på 2. semesters statistik. At A korrelerer med B, kan være fordi, at A forårsager B, men det kan også være, at A forårsager C, som forårsager B (osv.). En årsag er en direkte sammenhæng, men en korrelation er en slags samtidighed. Der behøver i princippet slet ikke at være en sammenhæng. Rejser alle børnene i klassen sig, fordi Bjarne gjorde det, fordi klokken ringede, eller fordi læreren sagde “tak for i dag”? Hvis vi kun måler på Bjarne og korrelerer det med de øvrige børns adfærd, så finder vi det første, men kan vi så udlede, at Bjarne forårsager, at alle børnene i klassen rejser sig? Nej vel? Bjarne er bare hurtigere end de andre.
En af de mere uklare faktorer i den foreliggende undersøgelse er – udover byernes forskellighed – også deltagernes sammensætning. Antallet af personer fra de enkelte byer er ikke mange – faktisk kan man sige få -, og viser en af farerne, når man laver undersøgelser, hvor man er nødt til at dele folk op i mindre grupper. Det samlede antal er 1225 personer, udtrukket tilfældigt fra CPR registret og frivilligt deltagende. “Over 1000” som Politiken skrev, for vi ved jo at en to mange, så 1000+ er rigtig mange. At der oprindeligt blev spurgt 1825 men 31% takkede nej, er ikke et problem, men et forhold alle den slags undersøgelser må forholde sig til. Blandt andet skal man forholde sig til, om der er en systematik, som kan have relevans for ens undersøgelse, ved dem som er hoppet fra. Der er tilsyneladende ingen overvejelser om, hvorvidt de manglende respondenter kan siges at udgøre et tilfældigt udsnit eller om man kan forestille sig, at de repræsenterer et systematisk og dermed metodisk problematisk udsnit. Hvad nu hvis de som sagde nej alle var ikke-rygere? Eller kun kvinder? Ville det så have gjort nogen forskel? Det er naturligvis altid svært at sige noget om dem, som ikke har deltaget, men dette indlæg er jo tænkt som et forsøg på at rette fokus på metodiske problemstillinger.
For få deltagere?
At man i undersøgelsen kun har fået 20% af den samlede gruppe (251) til at være fra bykerner og oven i købet har fordelt dem på 5 byer, er et problem for den statistik, der kommer ud. Når man tænker på, at det var hypotesen, at forurening i bynære områder kunne være medvirkende årsag til åreforkalkning, så undrer det mig såre, at man ikke har sikret sig flere fra disse områder (fx 50%), for eksempel ved at skære ned på by-udsnittet. Lad os sige at alle 251 midtby-beboere havde været fra Odense, havde det så været et problem for undersøgelsens generaliserbarhed? Som jeg ser det, havde det været et mindre problem end nu, hvor Odense er repræsenteret med 31 personer.
Når man kigger på tabellen i artiklen på side 446, så er det tydeligt at der er sikret en næsten ligelig fordeling mellem aldersgrupperne og mellem kønnene, men altså ikke mellem centrum og omegn. Dette kan selvfølgelig være en tanketorsk, men det kan også være, at man faktisk havde en ligelig fordeling hvis man fx havde fordelt deltagerne fra “rural” i mere specifikke områder, så som “næsten bymidte”, “by-periferi”, “lidt udenfor byen”, “langt ude på landet”. Hvis det er tilfældet, så er det rigtig dårlig dataskik ikke at gengive denne opdeling, uanset hvor stor en signifikans man har fundet. Det kunne jo være, at hvis man sammenlignede bymidte med “langt ude på landet” så forsvandt forskellen? Faktisk er denne fordeling så mærkelig, at den alligevel rejser spørgsmålet, om hypotesen reelt var luftforurening, eller om der alligevel er tale om en lille fisketur, men vi lader tvivlen komme den anklagede til gode.
Forurening
Men de sjove metodeting stopper ikke her. For at Kolding, Fredericia, Vejle og Esbjerg nævnes som “større byer” er jo nok det, der hedder en definitionssag. Man kunne selvfølgelig sige, at kan man koble en sammenhæng med disse mellem-store (i dansk skala) købmandsstader/-havnebyer, forurening og åreforkalkning, så stiller det selvfølgelig bare Århus og København endnu værre. Men kan man nu det?
Artiklen benytter sig af statistik fra det danske luft-kvalitets monitorerings program, som har målepunkter i forskellige byer, til at vise at der er forskel på mængden af NOx (kvælstof) og PM10 (partikler) i byer og landdistrikter. Men så vidt jeg kan se i den rapport som artiklen henter sine informationer fra, så er det af de i forskningsartiklen anvendte byer kun Odense, som optræder som målepunkt (se figur som er fra side 13 i rapporten).
Det vil sige at rent forskningsmæssigt, så kan man ikke automatisk udlede, at det også gælder i Kolding, Fredericia, Vejle og Esbjerg. Her kan luftkvaliteten i centrum såmænd være glimrende. Vi ved det ikke! Her kan være mindre lastbilstrafik, længere mellem husene, mere vind, bedre busser osv. Luftkvaliteten kan også være værre. Der kan være mere forurening syd fra (bare for at give nogle andre skylden), busserne kan være dårligere, hovedvejen kan gå igennem centrum, befolkningen kan køre rundt i ældre biler osv. Derfor kan man nok sige, at undersøgelsen ikke er en undersøgelse om forurening, men om bopæl, som så muligvis har en sammenhæng med forureningsmængden. I undersøgelsen skriver de på side 449, at det at leve i centrum er en erstatning for luftforurening, men som jeg har forsøgt at argumentere for her, så kan dette være metodisk problematisk.
Det betyder også, at skal vi være lidt strenge, så er der kun basis for at inddrage Odense-målingen, som er på 31 personer. Nu har vi altså en undersøgelse, som baserer sin konklusion på 31 personer versus resten (minus dem fra de andre byer). Hvis der før var for få, så er tingene jo ikke blevet bedre nu. Men er det ikke en rimelig antagelse, at der er luftforurening i alle midtbyer? Både og, og du – som læser – kan sikkert sagtens komme op med et par gode pro et con, men det er ikke det, som er pointen her. Pointen er, at der ikke er empirisk basis for at sige det, selvom der kan være mange gode grunde.
Et andet problem med den manglende kobling mellem by og forurening er, at der er mange særlige ting, som kan tænkes at gøre sig gældende i bycentrum i forhold til opland. Artiklen nævner selv støj som en mulig faktor for stress, som er koblet til højt blodtryk, men skriver, at det gennemsnitlige blodtryk faktisk var lavere for dem, der bor i centrum, end dem der bor udenfor. Hvis denne forskel er signifikant (det skriver de ikke noget om), så kunne historien derfor ligeså godt have været, at det er ‘godt’ for dit blodtryk at bo i centrum, men lad nu det ligge.
Artiklen peger på, at man ikke har kunnet kontrollere for uddannelse og socioøkonomiske faktorer, og fortsætter uden videre anfægtelser derfra. Jeg vil lade det være op til læseren at overveje, om det er en rimelig hypotese, at der kunne være en forskel på fordelingen af de mennesker, som bor centralt i forhold til dem, som ikke gør. Hvis prisudviklingen i nullerne i de nævnte byer minder om den, man finder i Århus og København, så kan man nok pege på, at der kunne være en indkomstmæssig forskel eller en gældssætningsforskel. Her taler jeg ikke om, at det skal være lige så dyrt som at bo i København, men om den relative forskel i pris mellem centrum og bygrænse. Kan man virkelig gå hen over den slags?
Signifikans-trumfen
Men lægerne vil sikkert pege på den signifikante forbindelse – og statistisk signifikans overtrumfer jo fornuft og anden form for bedreviden, ikk’? Hvis du tror det, så bør du forlange dine penge tilbage fra det seneste statistikkursus, du måtte have været på. Prøv eventuelt at kigge efter Jacob Cohen, mens de tilbagefører pengene. Denne artikels undersøgelse finder rigtig nok nogle signifikante forbindelser:
“CAC was less common in women compared to men (33% vs. 58%; P < 0.0001) and in those aged 50 compared to 60 years (35% vs. 54%; P < 0.0001). CAC was more pronounced in patients living in the city centre versus urban or rural areas, both in men (69% vs. 56%; P = 0.009) and women (42% vs. 30%; P = 0.02) as well as in 50-year-old (48% vs. 32%; P = 0.001) and 60-year-old subjects (61% vs. 53%; P = 0.09)” (Lambrecthsen et al, 2012, p.446).
Det vil sige at der er forskel på mænd og kvinder og på aldersgrupper. Der er også forskel på bycentrum og opland, og det er jo det vi er interesseret i her. Det er lidt uheldigt her, at den statistiske metode ikke nævnes, men det er sikkert praksis, siden den er gået igennem peer review-processen. Det kunne også have været berigende at se procenterne i faktiske tal – jeg regner med, at procenterne angiver, hvem der har CAC (åreforkalkning). Så vidt jeg kan se, så må fx de “48%” af 50-årige være fra midtbyen, hvilket er en gruppe på 120 personer og 48% af 120 er 57,6, så et eller andet sted er der en stakkels 0,6 person. Nå, det er sikkert afrundinger, eller også misser jeg et eller andet?
Lad os i øvrigt som tankeeksperiment kun tillade at Odense er med i materialet, grundet de ovenstående indvendinger om forureningsforskelle. Så udgør gruppen af 50-årige kun ca. 15 deltagere fra Odense – under forudsætning af en ligelig byfordeling – og hos ca. halvdelen af dem har man fundet CAC. I reelle tal svarer det til 7-8 personer, som skal repræsentere alle folk fra Odense, som lider af CAC. Man kan sige, hvad man vil, men det er altså et tyndt grundlag.
Man kan også sige, at statistisk signifikans ikke altid betyder faktisk signifikans. Der er mange måder, man kan sikre sig en statistisk signifikans på, men det betyder ikke, at studiet faktisk har fundet noget vigtigt. I dette tilfælde mener jeg, at man kan rejse berettiget tvivl om, hvorvidt de undersøgte faktorer faktisk er betydende, når man inddrager de metodiske problemer undersøgelsen har. Og selv om man så accepterer de statistiske signifikante sammenhænge som betydende, så kan man faktisk stadig ikke sige, at det er forureningen, som er skyld i et øget antal åreforkalkninger, da det jo ikke er forureningen, som har været en parameter, men bopælen. Ja faktisk kan man ikke sige noget som helst om, hvad der er årsag til noget ud fra denne undersøgelse. Man kan maksimalt sige, at der er en positiv korrelation, altså en samtidig sammenhæng. Når det ene tal går op eller ned, så er der en god chance for, at det andet tal også går tilsvarende op eller ned. Bemærk at det er en fundamental anden måde at beskrive en sammenhæng på end ved at sige, at når det ene tal går op/ned, så forårsager det, at det andet tal går op/ned.
Konklusionen i rapporten
Rapporten konkluderer rimeligt ydmygt at:
“In conclusion, the presence of CAC in asymptomatic ‘healthy’ middle-aged subjects is related to the presence of traditional CVD risk factors and living in a city centre (a surrogate for air pollution). These findings may be relevant from a public health perspective, but should be verified in further studies” (Lambrecthsen et al, 2012, p. 449).
Der er en relation mellem forekomsten af åreforkalkning og det at leve i midtbyen, og midtbyen anses for at være en erstatning for luftforurening, men mere forskning behøves.
Dette er en noget mere afdæmpet konklusion, end den man finder både i pressemeddelelsen og på Politikens hjemmeside, noget som nok peger på behovet for profilering fra Universitets side og behovet for at sprøjte (gratis) stof ud fra Politikens. Man kan som sagt diskutere det rimelige i at erstatte midtby med luftforurening, særligt når det gøres på basis af en rapport, som tilsyneladende ikke måler forurening i 4 af de 5 anvendte byer, men når man har med denne slags tværsnitsstudier at gøre, så er det korrekte at skrive, at der er en relation, en sammenhæng eller en samtidighed – og altså ikke at det ene forårsager det andet. Jeg har en indgroet forestilling om, at den fjerde statsmagt er overbevist om, at folk i almindelighed er for ubegavede til at kunne forstå forskellen. Måske forstår journalisterne den heller ikke?
Men det er ikke kun journalisternes problem. Det er også i dette tilfælde den pressemeddelelse, som kommer ud fra huset om nyheden. Den formår heller ikke at videregive, at dette er en undersøgelse in progress, at det er en korrelation og ikke en kausal forbindelse, og at så store er byerne heller ikke. Derfor kan journalisten, som læser nyheden fra universitetet dårligt bebrejdes andet end, at han eller hun ikke er dykket dybere ned i historien ved fx at læse forskningsartiklen. Så svær er den heller ikke, og det bliver, som med så meget andet, lettere jo flere gange man gør det.
Afslutning
Lad det være sagt med det samme. Dette indlæg er ikke ment som en afvisning af, at der er en effekt af at bo i centrum – eller midtbyen som det jo hedder i provinsen – i forhold til åreforkalkning eller at denne effekt kunne være forureningsbaseret. Det giver umiddelbart god mening – forurening er noget skidt, og har mange helbredsmæssige konsekvenser. På grundlag af denne artikel virker det dog som om der kun er basis for to mulige konklusioner: enten er man lidt frisk, og siger at undersøgelsen giver grund til at gå videre, da der synes at være en forskel (hvilket er artiklens konklusion), eller også er man forskningsmæssig konservativ, og siger at undersøgelsen desværre ikke helt formåede at få de metodiske ender til at nå helt sammen (bl.a. grundet et for lille udsnit), og man derfor ikke vil konkludere andet end at flere, større og mere specifikke undersøgelser behøves, og at dette derfor kun kan ses som et forstudie. Sidste konklusion havde næppe havde ført en publikation med sig, og det er jo den virkelighed som forskerne skal rette sig ind mod. Dette bør også indgå i de journalistiske overvejelser, når man gransker forskningsnyheder, akkurat som man bør være kritisk overfor tyngden af de politiske udmeldinger i sommerperioden.
Dette indlæg er også en lille advarsel om, at resultater som er statistisk signifikante ikke nødvendigvis er rigtige, men kan være det, man kalder for et falsk positiv resultat. For interesserede kan jeg anbefale Ioannidis’ artikel i PLoS Medicine om emnet. For en kritik af ukritisk brug af statistisk signifikans testing kan jeg anbefale tidligere nævnte Jacob Cohens artikel “The Earth is Round p>0.5”. Jeg vil ved en senere lejlighed kaste mig i lag med emnet på denne hjemmeside.
Som en sidste ting er det altid sjovt at læse andre faggruppers artikler. At vi har med læger at gøre afslører sig forskellige steder i sprogbrugen, og særligt når de skriver: “CAC was more pronounced in patients living in the city centre versus urban or rural areas” (p.446, min fremhævning). Her er man ikke en deltager eller person men en patient, også selvom man bare har sagt ja til at deltage i en undersøgelse.
Den vigtigste lære i dette, er dog ikke rettet mod de involverede lægers studie. Alle studier har fejl og problemer, bare man kigger grundigt nok, og der er såmænd ikke noget særligt i, at statistisk signifikans fremtrækkes. Publish or perish, ikke sandt? Mit problem er, hvordan en konklusion, som mere eller mindre rammer undersøgelsens niveau, kan blive til, at man tager skade af at bo i centrum pga. forurening. Altså hvordan forskning bliver til nyheder.
—————————————————-
Artikel: Lambrechtsen, J., Gerke, O., Egstrup, K., Sand, N. P., Nørgaard, B. L., Petersen, H., Mickley, H. and Diederichsen, A. C. P. (2012), The relation between coronary artery calcification in asymptomatic subjects and both traditional risk factors and living in the city centre: a DanRisk substudy. Journal of Internal Medicine, 271: 444–450. doi: 10.1111/j.1365-2796.2011.02486.x
—————————————————-
Skulle der være noget jeg har misforstået eller overset, så hører jeg gerne om det, og vil oven i købet rette det. Så skriv, også hvis du “bare” har en mening.