Hvis man tester 1000 menn med prostataspesifikt antigen (PSA ) i en relativt PSA -naiv befolkning i aldersgruppen 50 til 65 år, kan man vente å få omtrent følgende resultater når man setter tallene inn i den klassiske 2 x 2 tabellen:
Disse tallene er basert på første screeningrunde i en stor kontrollert, populasjonsbasert undersøkelse av screening for prostatakreft som ble startet i Gøteborg i 1995, med en oppslutning på ca 73%. PSA > 3,0 ng/l ble regnet som positiv test, og alle disse gjennomgikk sekstant-biopsi av prostata. Grunnen til at jeg har anført at resultatet for 10 menn var falskt negativt, er at disse mennene fikk oppdaget kreft i prostata løpet av de par nærmeste årene, som vi må anta også var tilstede ved første screeningrunde.
Her er sensitiviteten av PSA 28/38 = 74%. Sensitivitet er avhengig av hvilken PSA -cut-offverdi som velges for terskel til å ta biopsi, biopsi-teknikk og antall biopsier. Det vanlige i Norge i dag er å bruke en cut-off verdi på 4,0, og dette ville ha gitt en lavere sensitivitet og høyere spesifisitet. Spesifisiteten for PSA i denne populasjonen var 870/962 = 90%. Ved gjentatt PSA -testing, stiger sensitiviteten for PSA opp mot 100%. Etter 8 år, og nye screeningrunder, var det oppdaget prostatakreft i ca 8% av den screenede populasjonen i Gøteborg, men denne økningen må vi anta skyldtes ”nyoppståtte cancere”, som ikke var mulig å oppdage ved første screening-runde.
Vi kom ikke i gang med noen tilsvarende screeningundersøkelse i Norge, og PSA – testing av friske menn blir frarådet av helsemyndighetene. Det eneste unntaket er menn med ”arvelig disposisjon for prostatakreft”, dvs. i praksis menn med en mer eller mindre sterkt familieanamnese på sykdommen. I en slik populasjon kan man tenke seg at man har doblet prevalens av prostatakreft dvs. 7,6% mot 3,8% i normalpopulasjonen. Hvis vi tester 1000 slike menn, kan vi regne med å få følgende resultat:
Vi har her forutsatt en sensitivitet ved testen på 56/76 = 74% og en spesifisitet på 90% (833/924 = 90%), akkurat som ved forrige eksempel. Dette er fordi de to populasjonene er helt like med hensyn til alder, comorbiditet osv, bortsett fra at den sistnevnte populasjonen er ”beriket med prostatakreft-tilfelle”. Dette påvirker altså ikke testegenskapene til PSA , slik de måles med sensitivitet og spesifisitet.
Men testens prediktive evne blir forskjellig i de to eksemplene: PPV i ikke-selektert populasjon blir 28/120 = 23%, mens PPV i en risikopopulasjon blir 56/147 = 38%. PPV er altså høyere i risikopopulasjonen enn i normalpopulasjonen. Dette eksempelet bekrefter hovedpoenget i den forrige artikkelen om testegenskaper, nemlig at en tests prediktive evne er avhengig av prevalensen av sykdom i den populasjonen som undersøkes. For sykdommer med relativt lav prevalens i en populasjon, slik som prostatakreft og brystkreft, er PPV lav, og det blir mange individer som får falskt positivt resultat, noe som gir angst og behov for flere undersøkelser. Dette er en ulempe ved all screening for kreftsykdommer, der sykdommen har relativt lav prevalens, og der testen man benytter er relativt uspesifikk.
NPV er 870/880 = 99% i en ikkeselektert populasjon og 833/853 = 98% i risikopopulasjonen, altså høye verdier i begge tilfelle, slik det vil være for sykdommer med lav prevalens. Ved å bruke en ”narre-test” for PSA som alltid gav lave verdier, og derved alltid var negativ, ville NPV fortsatt være 96%. Man skal ikke uten videre la seg imponere av tilsynelatende gode test-egenskaper!
Så langt har altså sensitivitet og spesifisitet vært uforandret i de to kliniske situasjonene mens PPV og NPV har vært forskjellige fordi de avhenger av sykdommens prevalens. Men som nevnt foretas ikke systematisk screening for prostatacancer i Norge, i motsetning til for brystkreft. Derimot blir en stor andel av norske menn, både med og uten symptomer fra urinveiene, ”opportunistisk” PSA -testet hos fastleger og bedriftsleger. Hvis en allmennpraktiker tester 1000 menn, med en PSA -cut-off på 3,0 ng/l, vil det følgende være et typisk resultat:
Vi får som tidligere en sensitivitet på 28/38 = 74%. Sensitiviteten er den samme, fordi jeg har forutsatt et egenskapene ved den gruppen som har prostatacancer i denne populasjonen er omtrent som tidligere, og det blir samme fordeling mellom falskt negative og sant positive prøver som i de tidligere eksemplene. Videre har jeg forutsatt samme prevalens av prostatacencer som i befolkningen generelt, ut fra den antakelse at en pasientpopulasjon som er selektert på grunnlag av symptomer fra urinveiene, og/eller ønske om PSA – test ikke har noen forøket frekvens av prostatakreft. Samtidig BPH, som kan være assosiert med PSA -forhøyelse, innebærer ikke økt risiko for prostatakreft. Prostatakreft gir ikke symptomer i de tidlige stadiene som oppdages ved PSA -testing. (Dog vil det hos en allmennpraktiker dukke opp sporadiske menn som PSA -testes fordi de har symptomgivende, avansert prostatakreft, slik at prevalensen av prostatakreft ville være noe høyere enn i mitt eksempel).
Nå blir spesifisiteten for PSA -testen 746/962 = 78%, altså mye dårligere enn når testen ble brukt populasjonsbasert, der spesifisiteten var 90%. Årsaken til dette er at hos menn som blir PSA -testet hos en allmennpraktiker vil det være en relativ overvekt av menn som har oppsøkt lege nettopp pga. symptomer fra urinveiene, slik som vannlatingsbesvær pga. forstørret prostata og infeksjon. Det er en ”svakhet” ved PSA -testen at den reagerer (med PSA -forhøyelse) også på andre tilstander enn prostatakreft. PSA er spesifikk for prostata, men ikke for prostatacancer. Denne svakheten ved testen blir forsterket når den brukes på en ”mindre egnet populasjon”, som har en rekke ”alternative årsaker” til PSA -forhøyelse. Dette illustrerer at ”spesifisitet” ikke uten videre kan brukes til å beskrive kvaliteten på PSA -testen. Spesifisitet avhenger av populasjonen testen brukes i.
At disse ”dårlige testegenskapene” for PSA hos allmennpraktiker-pasienter også gir seg utslag i dårlige verdier for PPV er ikke overraskende. PPV blir bare 28/244 = 11%, altså svært lavt i forhold til i den populasjonsbaserte screeningen da PPV var henholdsvis 23% og 38%. I kontrast til dette blir NPV 746/756 er 99%. Dvs. at hvis en mann, med eller uten symptomer, får konstatert en normal PSA hos en almennpraktiker, er det 99% sjanse for at han ikke har prostatakreft.
Hva skjer på en urologisk henvisningspoliklinikk? Urologen får henvist disse mennene på bakgrunn av PSA -forhøyelse, og ser ikke de som er test-negative, slik at her blir det meningsløst å snakke om sensitivitet og spesifisitet. PPV blir nok noe høyere enn 11% fordi mange menn med grenseverdier av PSA eller stabile, lett forhøyede PSA -verdier ikke blir henvist til urolog. Men uansett, urologiske poliklinikker har stor pågang av pasienter med PSA -forhøyelse som ikke skyldes prostatakreft, dvs. PPV for PSA -testen i denne populasjonen er lav. Ulempen av dette forsterkes ved at det ofte er nødvendig med flere biopsi-runder før cancer-muligheten er rimelig sikkert utelukket.
I våre eksempler har spesifisitet for PSA variert fra 78% til 90% (avhengig av klinisk situasjoner). Det er viktig at tallet man bruker for spesifisitet er tatt fra et relevant klinisk materiale. I NoU 1997: 20, Norsk Kreftplan, Omsorg og Kunnskap, diskuteres PSA som populasjonsbasert screening-test (side 128) og det angis en spesifisitet på 50%. Et slik tall på spesifisitet må være tatt fra et meget spesielt pasient materiale, med mange selv-henviste pasienter med hyppig forekomst av ”alternative årsaker” til PSA -forhøyelse, der halvparten av ”friske” menn ville måtte gjennomgå biopsi. Et mer relevant tall for spesifisitet i relasjon til screening ville være ca 90%.
Hvilken rolle spiller så mennenes alder? Eldre pasienter har mere betennelse, større prostata og høyere ”normalverd” for PSA , noe man ikke uten videre tar hensyn til ved bestemmelse av cutoffverdi. Vi får flere falskt pos svar, lavere spesifisitet og dårligere PPV, altså forandringer i samme retning som i et pasientmaterialet hos en allmennpraktiker.
Også ved brystkreftscreening med mammografi vil spesifisiteten variere med pasientpopulasjonen. For eksempel gir mammografi mange falskt positive svar hos yngre kvinner fordi de har kjertelforandringer der man ikke kan utelukke cancer. Mammgrafi vil hos yngre kvinner ha dårligere test-egenskaper, dvs. lavere PPV og lavere spesifisitet, altså det motsatte av det som er tilfelle for PSA – testen som har høyest spesifisitet hos de yngste mennene.
Begge tester kan også være ”for sensitive”, dvs. de kan oppdage ikkesignifikante cancertilfelle som ikke trenger behandling, og derved føre til overbehandling. Endelig er testene gjenstand for stadige forbedringer som endrer testegenskapene. Å evaluere diagnostiske tester er en komplisert og dynamisk prosess.