De wetenschap van de geneeskunde meer speciale onderwerpen  

 Het onderstaande is de letterlijke vertaling van de online versie van de Merck Manual, consumer version.    Lees meer over de Merck Manuals.

Hoe artsen proberen te leren wat werkt
Artsen behandelen mensen al vele duizenden jaren. De vroegste schriftelijke beschrijving van medische behandelingen komt uit het oude Egypte en is meer dan 3500 jaar oud. Zelfs daarvoor gaven genezers en sjamanen waarschijnlijk al kruiden en andere remedies aan zieken en gewonden. Een paar remedies, zoals die voor sommige eenvoudige breuken en kleine verwondingen, waren effectief. Maar tot voor kort werkten veel medische behandelingen niet en waren sommige zelfs schadelijk.

Tweehonderd jaar geleden waren gebruikelijke remedies voor een breed scala aan aandoeningen onder andere het opensnijden van een ader om een halve liter bloed of meer te verwijderen en het geven van verschillende giftige stoffen om braken of diarree te veroorzaken, waardoor het lichaam "gezuiverd" werd van ziektes - allemaal gevaarlijk voor een zieke of gewonde persoon. Zo'n 120 jaar geleden vermeldde DE HANDLEIDING, naast enkele nuttige maar mogelijk giftige medicijnen zoals aspirine en digitalis, ook cocaïne als behandeling voor alcoholisme, arsenicum en tabaksrook als behandeling voor astma en zwavelzuur neusspray als behandeling voor verkoudheid. Artsen dachten dat ze mensen hielpen. Het is natuurlijk niet eerlijk om te verwachten dat artsen vroeger wisten wat wij nu weten, maar waarom hadden artsen ooit gedacht dat iemand met astma baat zou kunnen hebben bij tabaksrook?

Er waren veel redenen waarom artsen ineffectieve (en soms schadelijke) behandelingen aanraadden en waarom mensen deze accepteerden:

  • meestal waren er geen effectieve alternatieve behandelingen
  • artsen en zieke mensen doen vaak liever iets dan niets
  • mensen vinden het prettig om problemen aan een autoriteitsfiguur over te dragen
  • artsen bieden vaak de broodnodige steun en geruststelling

Het belangrijkste is echter dat artsen niet konden zeggen welke behandelingen werkten.

Behandeling en herstel: Oorzaak en gevolg?
Als de ene gebeurtenis onmiddellijk voorafgaat aan de andere, nemen mensen van nature aan dat de eerste de oorzaak is van de tweede. Als iemand bijvoorbeeld op een ongemerkte knop op een muur drukt en een nabijgelegen liftdeur gaat open, neemt de persoon van nature aan dat de knop de lift bedient. Het vermogen om dergelijke verbanden te leggen tussen gebeurtenissen is een belangrijk onderdeel van de menselijke intelligentie en is verantwoordelijk voor een groot deel van ons begrip van de wereld. Mensen zien echter vaak causale verbanden waar die er niet zijn. Daarom blijven atleten de "geluks"sokken dragen die ze aanhadden toen ze een grote wedstrijd wonnen, of blijft een student hetzelfde "gelukspotlood" gebruiken om examens te maken.

Deze manier van denken is ook de reden waarom men dacht dat sommige ineffectieve medische behandelingen wel werkten. Als bijvoorbeeld de koorts van een zieke afnam nadat de dokter een halve liter bloed had afgetapt of de sjamaan een bepaalde spreuk had uitgesproken, dan namen de mensen natuurlijk aan dat die handelingen de koorts hadden doen afnemen. Voor de persoon die wanhopig op zoek was naar verlichting, was beter worden al het bewijs dat nodig was. Helaas waren de ogenschijnlijke oorzaak-gevolgrelaties die in de vroege geneeskunde werden waargenomen zelden correct, maar het geloof erin was genoeg om eeuwen van ineffectieve remedies in stand te houden. Hoe kon dit gebeuren?

Mensen worden spontaan beter. In tegenstelling tot "zieke" levenloze voorwerpen (zoals een gebroken bijl of een gescheurd overhemd), die beschadigd blijven totdat ze door iemand gerepareerd zijn, worden zieke mensen vaak vanzelf beter (of ondanks de zorg van hun arts) als het lichaam zichzelf geneest of de ziekte zijn beloop heeft. Verkoudheid is binnen een week over, migraine duurt meestal een dag of twee en symptomen van voedselvergiftiging kunnen binnen 12 uur stoppen. Veel mensen herstellen zelfs van levensbedreigende aandoeningen, zoals een hartaanval of longontsteking, zonder behandeling. Symptomen van chronische ziekten (zoals astma of sikkelcelziekte) komen en gaan. Veel behandelingen kunnen dus effectief lijken als ze voldoende tijd krijgen, en elke behandeling die wordt gegeven in de buurt van het moment van spontaan herstel kan dramatisch effectief lijken.

Het placebo-effect kan hiervoor verantwoordelijk zijn. Geloof in de kracht van de behandeling is vaak genoeg om mensen zich beter te laten voelen. Hoewel geloof er niet voor kan zorgen dat een onderliggende aandoening, zoals een gebroken bot of diabetes, verdwijnt, voelen mensen die geloven dat ze een sterke, effectieve behandeling krijgen zich vaak beter. Pijn, misselijkheid, zwakte en veel andere symptomen kunnen afnemen, zelfs als een pil geen werkzame bestanddelen bevat en mogelijk geen baat heeft, zoals een "suikerpil" (een placebo genoemd). Wat telt is de overtuiging.

Een ineffectieve (of zelfs schadelijke) behandeling voorgeschreven door een zelfverzekerde arts aan een vertrouwende, hoopvolle persoon resulteert vaak in een opmerkelijke verbetering van de symptomen. Deze verbetering wordt het placebo-effect genoemd. Mensen kunnen dus een daadwerkelijk (niet alleen waargenomen) voordeel ervaren van een behandeling die geen duidelijk effect heeft op de ziekte zelf. Huidig onderzoek suggereert dat er een biologische basis is voor het placebo-effect bij sommige aandoeningen, ook al is dat effect niet gericht op de eigenlijke ziekte.

Waarom is het belangrijk? Sommige mensen beweren dat het enige belangrijke is of een behandeling ervoor zorgt dat mensen zich beter voelen. Het maakt niet uit of de behandeling daadwerkelijk "werkt", dat wil zeggen, invloed heeft op de onderliggende ziekte. Dit argument kan redelijk zijn als het symptoom het probleem is, zoals bij veel alledaagse pijntjes en kwaaltjes, of bij ziektes zoals verkoudheid, die over het algemeen vanzelf overgaan. In zulke gevallen schrijven artsen soms behandelingen voor die weinig effect hebben op de ziekte en in plaats daarvan de symptomen op zijn minst gedeeltelijk verlichten door het placebo-effect. Bij gevaarlijke of mogelijk ernstige aandoeningen, of wanneer de behandeling zelf bijwerkingen kan veroorzaken, is het echter belangrijk dat artsen alleen een behandeling voorschrijven die echt werkt. De potentiële voordelen van een behandeling moeten worden afgewogen tegen de potentiële nadelen. Medicijnen met veel bijwerkingen kunnen bijvoorbeeld de moeite waard zijn voor mensen met levensbedreigende ziekten, zoals kanker. Sommige medicijnen tegen kanker kunnen ernstige schade aanrichten, zoals aan de nieren of het hart, maar deze risico's zijn vaak aanvaardbaar omdat het alternatief voor de medicijnen (de gevolgen van onbehandelde kanker) waarschijnlijk erger is dan de bijwerkingen van de medicijnen.

Hoe artsen proberen te leren wat werkt   
Omdat sommige artsen zich al lang geleden realiseerden dat mensen op eigen kracht beter kunnen worden, probeerden ze natuurlijk te vergelijken hoe het verschillende mensen met dezelfde ziekte verging met of zonder behandeling. Tot het midden van de 19e eeuw was het echter erg moeilijk om deze vergelijking te maken. Ziekten werden zo slecht begrepen dat het moeilijk was om vast te stellen of twee of meer mensen, zelfs met vergelijkbare symptomen, dezelfde ziekte hadden.

Artsen die een bepaalde term gebruikten, hadden het vaak over totaal verschillende ziekten. In de 18e en 19e eeuw werd de diagnose "waterzucht" bijvoorbeeld gegeven aan mensen met opgezwollen benen. We weten nu dat zwelling het gevolg kan zijn van hartfalen, nierfalen of een ernstige leverziekte - heel andere ziekten die niet op dezelfde behandelingen reageren. Op dezelfde manier kregen veel mensen die koorts hadden en ook braakten de diagnose "galachtige koorts". We weten nu dat veel verschillende ziekten koorts en braken veroorzaken, zoals tyfus, malaria, blindedarmontsteking en hepatitis.

Pas toen nauwkeurige, wetenschappelijk onderbouwde diagnoses rond het begin van de 20e eeuw gemeengoed werden, konden artsen effectief behandelingen gaan evalueren. Ze moesten echter nog bepalen hoe ze een behandeling het beste konden evalueren.

Steekproefgrootte
Allereerst realiseerden artsen zich dat ze naar meer dan één reactie van een zieke op een behandeling moesten kijken. Eén of twee mensen die beter (of zieker) worden, kunnen toeval zijn. Het behalen van goede resultaten bij veel mensen is minder waarschijnlijk te wijten aan toeval. Hoe groter het aantal behandelde mensen (steekproefgrootte), hoe waarschijnlijker het is dat een waargenomen voordeel of bijwerking echt is.

Controlegroepen
Zelfs als artsen een goede respons vinden op een nieuwe behandeling bij een grote groep mensen, weten ze nog steeds niet of hetzelfde aantal mensen (of meer) op eigen kracht beter zou zijn geworden of het nog beter zou hebben gedaan met een andere behandeling. Daarom vergelijken artsen meestal resultaten tussen een groep mensen die een studiebehandeling krijgt (behandelgroep) en een andere groep (controlegroep) die:

  • een oudere behandeling
  • dummybehandeling (een placebo, zoals een suikerpil)
  • helemaal geen behandeling

Studies met een controlegroep worden gecontroleerde studies genoemd.

Tijdsbestek
In het begin gaven artsen al hun patiënten met een bepaalde ziekte gewoon een nieuwe behandeling en vergeleken vervolgens hun resultaten met een controlegroep van mensen die op een eerder tijdstip waren behandeld (door dezelfde of andere artsen). De eerder behandelde mensen worden beschouwd als een historische controlegroep. Als artsen bijvoorbeeld ontdekten dat 80% van hun patiënten malaria overleefde nadat ze een nieuwe behandeling hadden gekregen, terwijl voorheen slechts 60% overleefde, dan zouden ze kunnen concluderen dat deze nieuwe behandeling effectiever was.

Een probleem bij het maken van vergelijkingen met resultaten uit een eerder tijdperk is dat vooruitgang in de algemene medische zorg in de tijd tussen de oude en de nieuwe behandelingen verantwoordelijk kan zijn voor een verbetering in het resultaat. Het is bijvoorbeeld niet gepast om de resultaten van mensen die in 2021 zijn behandeld te vergelijken met mensen die in 1971 zijn behandeld. In één voorbeeld: maagzweer werd oorspronkelijk behandeld met een melk- en roomdieet of een operatie, daarna met medicijnen die zuur blokkeren en meer recent met antibiotica. Bij vergelijkingen van behandelingen die in de loop der tijd zijn gebruikt, moet rekening worden gehouden met de veranderingen in het begrip van het ziekteproces.

Prospectieve studies kunnen de problemen met historische controlegroepen helpen vermijden. In prospectieve studies proberen artsen behandelingsgroepen en controlegroepen tegelijk te creëren en de resultaten van de behandeling te observeren terwijl ze zich ontwikkelen. Relevante kenmerken van de mensen in de behandel- en controlegroepen moeten vergelijkbaar zijn. Als het bestudeerde resultaat bijvoorbeeld sterfte als gevolg van kanker of hartaandoeningen is, moeten de leeftijden van de mensen in elke groep vergelijkbaar zijn omdat deze ziekten vaker voorkomen bij oudere mensen.

Appels met appels vergelijken
De grootste zorg bij alle soorten medische studies, inclusief historische studies, is dat vergelijkbare groepen mensen vergeleken moeten worden.

In het eerste voorbeeld van een historische controle, als de groep mensen die de nieuwe behandeling (behandelgroep) voor malaria kreeg, bestond uit voornamelijk jonge mensen met een milde ziekte, en de eerder behandelde (controle)groep bestond uit oudere mensen met een ernstige ziekte, dan zou het goed kunnen dat de mensen in de behandelgroep het beter deden, simpelweg omdat ze jonger en gezonder waren. Zo zou een nieuwe behandeling ten onrechte beter kunnen lijken te werken.

Naast leeftijd en ernst van de ziekte moet er ook rekening worden gehouden met veel andere factoren, zoals:

  • de algehele gezondheid van de mensen die worden onderzocht (mensen met chronische ziekten zoals diabetes of nierfalen hebben de neiging om het slechter te doen dan gezondere mensen)
  • de specifieke arts en het specifieke ziekenhuis die de zorg verlenen (sommige artsen zijn bekwamer en hebben betere faciliteiten dan andere)
  • de percentages mannen en vrouwen in de onderzoeksgroepen (mannen en vrouwen kunnen verschillend reageren op de behandeling)
  • of het onderzoek een diverse populatie omvatte (behandelingen moeten veilig zijn en goed werken bij mensen met verschillende kenmerken, zoals verschillende etniciteiten, geografische locaties of sociaaleconomische status) omdat behandelingen effectiever kunnen werken bij bepaalde van deze groepen

Artsen hebben veel verschillende methoden geprobeerd om ervoor te zorgen dat de groepen die worden vergeleken zo veel mogelijk op elkaar lijken, maar er zijn twee belangrijke benaderingen:

  • case-control studies: Het nauwkeurig koppelen van mensen die de nieuwe behandeling krijgen (cases) aan mensen die dat niet krijgen (controles) op basis van zoveel mogelijk factoren (leeftijd, geslacht, gezondheid, enzovoort) en het gebruik van statistische technieken om de vergelijkbaarheid tussen de groepen te helpen verzekeren
  • gerandomiseerde onderzoeken: Willekeurige toewijzing van mensen aan elke onderzoeksgroep voordat het onderzoek begint

Case-control studies lijken zinvol. Als een arts bijvoorbeeld een nieuwe behandeling voor hoge bloeddruk (hypertensie) bestudeert en iemand in de behandelgroep is 42 jaar oud en heeft diabetes, dan zou de arts proberen om een 40-jarige persoon met hypertensie en diabetes in de controlegroep te plaatsen. Er zijn echter zoveel verschillen tussen mensen, waaronder verschillen waar de arts niet eens aan denkt, dat het bijna onmogelijk is om opzettelijk een exacte match te maken voor elke persoon in een onderzoek.

Bij gerandomiseerde onderzoeken wordt het risico dat verschillen tussen groepen de onderzoeksresultaten beïnvloeden op een heel andere manier verkleind. De beste manier om een overeenkomst tussen de groepen te garanderen is om gebruik te maken van de wetten van waarschijnlijkheid en willekeurig (meestal met behulp van een computerprogramma) mensen met dezelfde ziekte aan verschillende groepen toe te wijzen. Vergelijkbaarheid van de groepen is waarschijnlijker als de groepen gematcht worden aan de hand van bekende variabelen zoals leeftijd, geslacht en de aanwezigheid van andere ziekten. Een uniek belangrijk voordeel van randomisatie is echter dat alle factoren die het studieresultaat beïnvloeden, maar onbekend zijn (en dus niet gematcht kunnen worden tussen groepen), waarschijnlijk willekeurig verdeeld worden over de deelnemers en groepen. Hoe groter de groep, hoe groter de kans dat mensen in elke groep vergelijkbare kenmerken hebben.

Prospectieve, gerandomiseerde onderzoeken zijn de beste manier om er zeker van te zijn dat een behandeling of test wordt vergeleken tussen gelijkwaardige groepen.

Andere factoren elimineren
Als artsen eenmaal gelijkwaardige groepen hebben gemaakt, moeten ze ervoor zorgen dat het enige verschil dat ze toestaan de studiebehandeling zelf is. Op die manier kunnen artsen er zeker van zijn dat een verschil in uitkomst te wijten is aan de behandeling en niet aan een andere factor, zoals de kwaliteit of frequentie van de follow-up zorg.

Het placebo-effect is een andere belangrijke factor. Mensen die weten dat ze een echte, nieuwe behandeling krijgen in plaats van geen behandeling (of een oudere, vermoedelijk minder effectieve behandeling) verwachten vaak dat ze zich beter zullen voelen. Aan de andere kant verwachten sommige mensen meer bijwerkingen van een nieuwe, experimentele behandeling. In beide gevallen kunnen deze verwachtingen de effecten van de behandeling overdrijven, waardoor de behandeling effectiever lijkt of meer complicaties heeft dan in werkelijkheid het geval is.

Blindering, ook wel maskering genoemd, is een techniek die wordt gebruikt om de problemen van het placebo-effect te verminderen. Er zijn twee algemene soorten blindering: enkelvoudige en dubbele blindering.

  • enkelvoudige blindering is wanneer de mensen in een onderzoek niet mogen weten of ze een nieuwe behandeling krijgen. Dat wil zeggen dat ze "geblindeerd" zijn voor deze informatie. Blindering wordt meestal bereikt door mensen in de controlegroep een stof te geven die er identiek uitziet, meestal een placebo, iets zonder medisch effect. Bij enkelvoudige blindering kent het onderzoekspersoneel de behandelingstoewijzing, maar de deelnemers niet
  • bij dubbele blindering weten zowel de deelnemers aan een onderzoek als het onderzoekspersoneel niet welke deelnemers een nieuwe behandeling of een placebo krijgen. Omdat de arts of verpleegkundige een persoon per ongeluk zou kunnen laten weten welke behandeling hij krijgt en zo de persoon zou kunnen "ontblinden", is het beter als alle betrokken zorgverleners niet weten wat er wordt gegeven. Een andere reden voor dubbele blindering is dat het placebo-effect zelfs de arts kan beïnvloeden, die onbewust kan denken dat een persoon die een behandeling krijgt het beter doet dan een persoon die geen behandeling krijgt, ook al gaat het met allebei precies hetzelfde. Dubbele blindering vereist meestal dat een persoon die niet bij het onderzoek betrokken is, zoals een apotheker, identiek uitziende stoffen bereidt die alleen een speciale cijfercode hebben. De cijfercode wordt pas verbroken nadat het onderzoek is afgerond

Niet alle medische onderzoeken kunnen dubbelblind zijn. Chirurgen die bijvoorbeeld twee verschillende chirurgische procedures bestuderen, weten natuurlijk welke procedure ze uitvoeren (hoewel de mensen die de procedures ondergaan daar niet van op de hoogte mogen zijn). In zulke gevallen zorgen artsen ervoor dat de mensen die de uitkomst van de behandeling evalueren geblindeerd zijn over wat er gedaan is, zodat ze de resultaten niet onbewust kunnen beïnvloeden.

Als er al een effectieve behandeling voor een ziekte bestaat, kan het onethisch zijn om de controlegroep alleen een placebo te geven. In die situaties kunnen behandelingen nog steeds vaak worden geëvalueerd met behulp van andere onderzoeksopzetten, zoals in de volgende voorbeelden:

  • om te bepalen of een nieuwe behandeling iets toevoegt aan de effectiviteit van een standaardbehandeling, kan een onderzoek de resultaten vergelijken met behulp van de standaardbehandeling plus ofwel de nieuwe onderzoeksbehandeling ofwel een placebo
  • om een nieuwe behandeling waarvan bekend is dat deze effectief is te vergelijken met de standaardbehandeling, kan een onderzoek de resultaten van de nieuwe behandeling vergelijken met die van de standaardbehandeling. Indien nodig om de blindering te behouden, kunnen placebo's aan beide behandelingsgroepen worden toegevoegd

In elk van de benaderingen moeten de stoffen voor elk van de behandelingen er identiek uitzien voor de deelnemers en, in het geval van een dubbelblind onderzoek, voor het onderzoekspersoneel. Als de behandelgroep een rode, bittere vloeistof krijgt, dan moet de controlegroep ook een rode, bittere vloeistof krijgen. Als de behandelgroep een heldere oplossing krijgt toegediend via een injectie, dan moet de controlegroep een soortgelijke injectie krijgen.

Het kiezen van een klinische proefopzet
Het beste type klinische trial bevat alle bovenstaande elementen, zoals:

  • prospectief, wat betekent dat behandelings- en controlegroepen worden ingeschreven in een onderzoek voordat het begint en dat ze in de loop van de tijd worden gevolgd
  • gerandomiseerd, wat betekent dat mensen in het onderzoek willekeurig worden verdeeld over toegewezen behandelgroepen
  • placebo gecontroleerd, wat betekent dat sommige mensen in het onderzoek een placebo krijgen (een inactieve behandeling)
  • dubbelblind, wat betekent dat noch de mensen in het onderzoek noch degenen die het onderzoek uitvoeren weten wie de behandeling krijgt en wie een placebo

Deze opzet maakt het mogelijk om de effectiviteit van een behandeling het duidelijkst vast te stellen. In sommige situaties is deze proefopzet echter niet mogelijk. Bijvoorbeeld, bij zeer zeldzame ziekten is het vaak moeilijk om genoeg mensen te vinden voor een gerandomiseerde trial. In die situaties kunnen retrospectieve case-control trials worden uitgevoerd.

Diversiteit
Om ervoor te zorgen dat de onderzoeksresultaten toepasbaar zijn in de echte wereld, moeten de deelnemers aan het onderzoek representatief zijn voor de gehele populatie die de onderzochte ziekte heeft, inclusief de van toepassing zijnde leeftijden, geslachten, rassen, etniciteiten, sociaaleconomische status en levensstijlen. Een nauwkeuriger vergelijking van appels met appels wordt vaak eenvoudiger door deelnemers aan het onderzoek te beperken tot bepaalde groepen. De klinische onderzoeken waarvan de resultaten het meest van toepassing zijn op de hele bevolking, werven echter een diverse groep deelnemers. In de Verenigde Staten maken raciale en etnische minderheden bijvoorbeeld bijna 40% van de bevolking uit. Een onderzoek zonder een dergelijke diversiteit zou een aantal belangrijke factoren kunnen missen. Voor sommige medicijnen kunnen het ras en de genetische achtergrond van een persoon de effectiviteit van dat medicijn beïnvloeden. Een tekort aan het enzym G6PD komt bijvoorbeeld vaker voor bij mannen van Afrikaanse, Aziatische of Mediterrane afkomst en bepaalde medicijnen kunnen hemolytische anemie veroorzaken bij mensen met G6PD-deficiëntie. Door mensen met verschillende achtergronden erbij te betrekken, kunnen klinische onderzoeken aantonen of de behandelingen veilig zijn en goed werken voor mensen uit verschillende groepen. Toch kunnen factoren zoals sociaaleconomische status, alfabetiseringsniveau, toegang tot vervoer en de nabijheid van de onderzoekslocatie het moeilijk maken om een voldoende diverse populatie te rekruteren.


Bronnen:

Laatste wijziging: 03 september 2023 Colofon  Disclaimer  Privacy  Zoeken  Copyright © 2002- G. Speek

  Einde van de pagina