Poolcoördinaten
Bewegings vergelijkingen
Behoudswetten
Wetten van Kepler
Lagrangiaanse mechanica
Golfvergelijking
Fourier transformaties
Maxwell vergelijkingen
Bohratoom
Schrödinger vergelijking
Dirac vergelijking
Padintegralen
De ideale gaswet
wetenschaps filosofie
Statistiek
Radiocommunicatie

Extra stof
Wetenschapsfilosofie


Wetenschappelijke methode

Welkom bij het hoofdstuk wetenschapsfilosofie. In dit hoofdstuk ga je een gevaarlijk-krachtige manier van denken aanleren. We gaan het namelijk hebben over hoe we betrouwbare kennis kunnen onderscheiden van onbetrouwbare kennis. Deze techniek is van onmisbaar belang in de wetenschap, maar het zal je ook verbazen hoe vaak het in het dagelijks leven van pas zal komen. Recentelijk was ik bijvoorbeeld in een vergadering waarbij een 'expert' ons ging vertellen hoe goed om te gaan met verschillend gedrag van leerlingen. Ze had haar verhaal waarschijnlijk al vaak genoeg afgedraaid om het zo te kunnen vertellen dat het aannemelijk klonk. Waarschijnlijk had ze in verloop van tijd het verhaal zo aangepast om kritische vragen van het publiek te kunnen vermijden. Ook had ze genoeg voorbeelden verzameld van mensen die erg succesvol waren met de techniek die door haar beschreven werd. We noemen dit anekdotisch bewijs - een 'bewijs' gebaseerd op de ervaringen van een paar individuën, die meestal ook nog zijn uitgekozen vanwege hun succesvolle ervaringen met een bepaalde interventie. Vaak krijgen we bij deze vorm van bewijsvoering echter niets te horen van de mensen waarbij de interfentie geen effect had.

Helaas zat ik in de zaal om het geheel even flink onderuit te halen. Op welk onderzoek is dit gebaseerd? Hoe is dit onderzoek uitgevoerd? Het onderzoek was er niet. Een collega in het publiek verwees naar een boek waarin dergelijk onderzoek wel te vinden we - uitgevoerd op 250 miljoen leerlingen. Wow, dat klink indrukwekkend! Onderzoek naar onderwijs is echter meestal berucht waardeloos voor redenen die later in dit hoofdstuk aan bod zullen komen. Ik had echter toevallig deze bron onderzocht en wist dat de '250 miljoen leerlingen' het totaal aantal leerlingen was van studies over vele jaren naar vele honderden verschillende fenomenen in het onderwijs. Per onderzocht fenomeen waren er dus vele malen minder deelnemers. Daarnaast - en hier wordt het vernietigend - bleek dat de interventie die in een eerdere uitgave van zijn boek op nummer 1 stond als het gaat om effectiviteit, binnen een paar jaar verplaatst was naar nummer 83. Ik had hier over gemaild met de auteur. Misschien dat in de eerdere editie een foutje gemaakt was - fouten zijn menselijjk. Maar dit was niet het geval. Een paar nieuwe studies hadden de meest effectieve interventie veranderd in een redelijke waardeloze interventie. Opeens stond de informatie in een heel ander daglicht. 'Kennis' die nog zo gevoelig is voor nieuwe input, daar kan je niet op vertrouwen - en je wil zeker niet je hele onderwijs praktijk omgooien voor een dergelijk idee. Het enige wat van haar verhaal over was gebleven was een 'mooi klinkend verhaal' met een beetje anekdotisch bewijs. Leuk voor aan de bar, maar niet voor professionals.

Deze strategie is echter niet alleen goed voor het razendsnel deconstrueren en met de grond gelijk maken van verschillende theoriën. Als een theorie immers 'waar' is, dan zal het alle testen kunnen doorstaan waaraan je het onderwerpt. Er zijn theoriën die men al eeuwenlang probeert te ontkrachten, maar waar niemand in slaagt. Het is deze kennis die in de wetenschap het meest gewaardeeerd wordt.

Laten we even beginnen bij het begin. De filosofie is een vakgebied wat drie vragen probeert te beantwoorden:

  1. Wat is echt?
  2. Welke kennis is betrouwbaar?
  3. Wat is goed en slecht?

De studie naar de eerste vraag wordt de metafysica genoemd, de studie naar de tweede vraag de epistemologie en de studie naar de derde vraag we ethiek. Wetenschap houdt zich bezig met de eerste twee vragen. Wetenschappers proberen door nauwkeurige metingen aan de natuur te doen om betrouwbare kennis te vinden over deze natuur (epistemologie) en met behulp hiervan wordt er een poging gedaan om de werkelijkheid (metafysica) te achterhalen die verscholen gaat achter de individuele zintuigelijke waarnemingen.

Het belangrijkste gereedschap waarmee we dit doen in de wetenschappelijke methode. Deze methode ligt aan de basis van al het wetenschappelijk denken en is de sleutel om de wetenschappelijke en technologische vooruitgang in de laatste drie eeuwen te begrijpen. De wetenschappelijke methode is zo krachtig, omdat het ons een systematische manier geeft om betrouwbare kennis te vinden. Zonder deze methode trekken mensen geregeld verkeerde conclusies over hoe de wereld in elkaar zit. De afwezigheid van deze methode in het grootste deel van de mensengeschiedenis verklaard de alomtegenwoordigheid van magisch denken in de wereld. Gek genoeg wordt deze methode op school bijna nooit expliciet aangeleerd, maar in deze cursus gaan we hier verandering in brengen.

In zijn meest simpele vorm werk de wetenschappelijke methode als volgt. Allereerst wordt op basis van de ervaring of met behulp van een observatie een hypothese bedacht over een fenomeen dat we willen begrijpen. Een hypothese is een nog onbewezen, maar zo goed mogelijk onderbouwde verklaring of beschrijving van deze observaties. Om de hypothese te bevestigen, moet deze meerdere malen getest worden. Wetenschappers stellen op deze manier hun ideeën op de proef. Alleen als de hypothese echt goed is, zal het al deze tests doorstaan. Hoe meer tests de hypothese doorstaat, hoe groter ons vertrouwen in de hypothese wordt. Mocht de hypothese een test niet goed doorstaan, dan wordt de hypothese aangepast of zelfs geheel verworpen.

Wanneer een hypothese veel tests doorstaan heeft, noemen we het een theorie of wordt de hypothese een onderdeel van een grotere theorie. Sommige theorieën zijn al miljarden keren met succes getest en dat geeft wetenschappers een groot vertrouwen in de juistheid ervan. Het hele proces wordt in de onderstaande afbeelding nog eens samengevat:

In het dagelijks leven wordt het woord 'theorie' vaak onjuist gebruikt. Mensen zeggen soms 'het is maar een theorie' en dan bedoelen ze dat het slechts een onbewezen idee is. In de wetenschap wordt het woord theorie echter meestal gebruikt voor ideeën die extreem goed getest zijn. Denk bijvoorbeeld aan de relativiteitstheorie, de atoomtheorie of de evolutietheorie. Deze theorieën zijn miljoenen keren getest.




Francis Bacon

De Grieken de grondslag gelegd voor het westelijk denken. Ze hadden de logica ontdekt, de wiskunde en deden de eerste pogingen om de wereld te begrijpen op basis van natuurlijke - in contrast met magische - verklaringen. Tevens hadden de Grieken, in navolging van de Mesopotamiërs - nauwkeurige metingen gedaan aan de beweging van de sterren en de planeten en voerden ze experimenten uit om bijvoorbeeld de omtrek van de aarde met precisie te kunnen bepalen.

Toch waren de Grieken geen wetenschappers in de moderne zin van het woord. Ongeacht hoe geniaal de Grieken waren, ze maakten continu gebruik van hypothesen die niet ondersteunt werden door enig direct bewijsmateriaal. Een heel bizar voorbeeld is het idee van Aristoteles dat zware voorwerpen sneller vallen dan lichte voorwerpen. Een kwartiertje experimenteren met het laten vallen van verschillende voorwerpen laat zien dat dit niet het geval is. Als je een stuk papier laat vallen en een hamer, dan is de hamer eerder beneden. Als we van het papiertje echter een prop maken, dan komen ze nagenoeg tegelijk neer. De beslissende factor voor het sneller of minder snel vallen is dus niet de massa maar de wrijvingskracht. Deze theorie van Aristoteles bleef echter bestaan tot Galileo in de 17de eeuw liet zien dat dit niet het geval was. Hoe is het mogelijk dat niemand dit even getest had? Een ander voorbeeld zijn de vier elementen. De mensen die geloofden dat de wereld uit slechts vier elementen bestond hadden hier geen bewijzen voor.

Dit wil echter niet zeggen dat de Griekse filosofen geen slimme ideëen hadden. Aristoteles geloofde bijvoorbeeld dat de aarde zich in het centrum van het universum bevindt en dat al het materiaal waar de aarde uit bestaat altijd naar dit centrum toe valt. Hij kon hiermee in één keer verklaren dat recht naar het centrum van de aarde vielen en dat de aarde bolvormig is (deze vorm ontstaat automatisch als materiaal zo dicht mogelijk naar het centrum geperst wordt). De theorie klinkt indrukwekkend, maar Aristoteles was niet in staat zjin beweringen te testen. Zo had niemand ooit het 'centrum van het universum' gezien. Hij was zo onder de indruk was van de elegantie en de eenvoud van zijn uitleg, dat hij geloofde dat het wel goed moest zijn.

De persoon die dit probleem in het Griekse denken voor het eerst goed blootlegde was de invloedrijke filosoof Francis Bacon in de 17de eeuw. Hij had door dat de Griekse filosofen de geloofden dat ze de wereld konden begrijpen door erover te filosoferen. De Grieken probeerde op basis van hun observaties de meest elegante ideëen te bedenken, maar gingen ze daarna niet systematisch testen. Volgens Francis Bacon waren de Grieken te veel onder de indruk van de interne logica, de elegantie en de eenvoud van hun ideëen en zagen daarom niet de noodzaak om de ideëen te ondersteunen door metingen. Hij vertelde dat je op deze manier gemakkelijk gaat geloven in allerlei ongefundeerde fantasiën. De oorzaak van dit probleem is dat mensen diepgewortelde vooroordelen hebben. Sommige van deze vooroordelen zijn aangeleerd door de samenleving en andere hebben een diepere oorzaak in ons brein. In een zekere zin, zo dacht Bacon, is de menselijke geest zelfs als een obstakel bij het vinden van kennis.

Bacon merkte op dat wetenschappers vaak de mist in gingen als ze bijvoorbeeld een systeem van de wereld wilde ontwikkelen waarmee ze alles in het universum konden verklaren. De theorie van de vier elementen was hier een voorbeeld van. De Griekse filosofen werden hier volgens Bacon te snel verleid door allerlei goed klinkende verzinsels.

In plaats van de filosoferen over de wereld was de oplossing voor Bacon on systematisch de natuur te bestuderen. De juiste manier om betrouwbare kennis te vergaren ging volgens Bacon als volgt. Eerst ga je systematisch data verzamelen door middel van observaties of met behulp van nauwkeurige meetinstrumenten. In deze fase is het van belang de data nog niet te interpreteren. Je wil de data dus zo onpersoonlijk mogelijk verzamelen. Daarna ga je in de data op zoek naar patronen. Als je een patroon gevonden hebt, dan is het belangrijk het experiment nog een aantal keer te herhalen, om te bevestigen dat het patroon daadwerkelijk bestaat en dat het niet een toevalstreffer was. Als de patronen standhouden, dan heb je nieuwe kennis bemachtigd. Het idee dat kennis moet voortkomen uit zintuigelijke waarneming noemt men het empirisme

Een voordeel van deze methode, volgens Bacon, is dat dit process door iedereen stap-voor-stap uitgevoerd kan worden, zonder dat hiervoor exceptionele genialiteit voor nodig is. Het enige dat nodig is, is dat we de methode volgen. Alles wat nodig is, is dat we meten zonder te interpreteren - hetgeen onze vooroordelen omzeild - totdat we duidelijke patronen vinden.

Bacon was ook een groot voorstander van het ontwikkelen van apparatuur met als enige nut om precieze informatie in te kunnen winnen over hoe de wereld werkt. Hij onderscheidde dit type metingen met het ongehinderd observeren van de natuur. Met een goed ontwikkeld experiment kunnen we 'de natuur op een pijnbank leggen en Haar zo dwingen Haar geheimen prijs te geven'. Met deze experimenten konden we de natuur specifieke vragen in isolatie te laten beantwoorden, hetgeen vaak lastig te observeren is in de complexe wereld. We kunnen tevens allerlei variabelen zelf controleren en de effecten hiervan meten. Een goed voorbeeld hiervan uit de 17de eeuw was de vacuümpomp, waarmee onderzoek gedaan kon worden bij verschillende luchtdruk. Robert Boyle ontdekte op deze manier de relatie tussen de druk en het volume van een gas. Ook het vallen van voorwerpen in beter te bestuderen in een vacuümruimte. Bij onderzoek naar de zwaartekracht is het bijvoorbeeld niet genoeg om simpelweg vallende voorwerpen te observeren. De valbeweging wordt namelijk beïnvloed door de luchtwrijvingskracht. In deze gecontroleerde omgeving kunnen we deze invloed wegnemen en de zwaartekracht in isolatie bestuderen.

De grote wetenschapper Isaac Newton was een uitgesproken volgeling van Bacon. Newton had op basis van nauwkeurige metingen een formule gevonden waarmee hij de zwaartekracht kon beschrijven. Hij kon met deze ene formule zowel het vallen van voorwerpen als het bewegen van de planeten om de zon beschrijven.

Newton kon met behulp van zijn formule precies beschrijven hoe de planeten om de zon bewegen, maar hij kon nog niet verklaren waarom dit gebeurde. Hoe kan de zon een planeet aantrekken zonder dat de zon en de planeet elkaar aanraken? Een tijdgenoot van Newton had bedacht dat de zon zich misschien in het centrum van een onzichtbare draaikolk zou bevinden en dat de planeten in deze draaiklok meegesleept worden. Newton weigerde op deze manier te 'fantaseren'. Hij vertelde had hij liever geen antwoord op deze vraag had, dan dat hij zomaar iets zou bedenken. Zijn beroemde reactie hierop was:

'Ik zuig geen hypotheses uit mijn duim' ('I feign no hypotheses')




Herhaalbaarheid

Een van de meest bijzondere eigenschappen van de wetenschap, is dat je de beweringen van wetenschappers op eigen initiatief kan testen. Het is dus niet nodig om een wetenschapper op zijn woord te geloven. Als je een theorie wantrouwt, dan nodigt de wetenschap je uit om de theorie geheel onafhankelijk te testen.

Een bekend voorbeeld is Galileo Galilei's ontdekking van de vier grootste manen van Jupiter. Galileo bewees hiermee dat niet alle hemellichamen om de aarde draaien, hetgeen door Aristoteles beweerd werd.

Een aantal geleerden wilde Galileo echter niet geloven en daarom gaf hij ze de gelegenheid om zelf door zijn telescoop te kijken, zodat ze het met eigen ogen konden zien.

DEMO

De geleerden weigerden echter door de telescoop te kijken. Ze waren zo overtuigt van de theorie van Aristoteles, dat ze het niet nodig vonden om hun theorie op de proef te stellen. Het werk van Aristoteles werd in die tijd onkritisch geloofd. Net als de Bijbel werd het werk van Aristoteles gezien als een autoriteit waar niet aan getwijfeld kon worden. Deze autoriteit weegde voor veel geleerden zwaarder dan de mogelijkheid om zelf te onderzoeken hoe de wereld werkt. Dit is een zeer onwetenschappelijke houding! In een brief aan de bekende wetenschapper Johannes Kepler, schreef hij over dit incident:

Mijn beste Kepler, wat zou jij zeggen van de geleerden hier, die met grote hardnekkigheid blijven weigeren om door de telescoop te kijken? Hoe moeten we hierop reageren? Moeten we hierom lachen of huilen?

Een vakgebied waar de methode van Bacon misschien wel het meest nodig was, was in de scheikunde. De scheikunde van voor de wetenschappelijke revolutie werd de alchemie genoemd en stond bekend om z'n magische en mysterieuze elementen. In de onderstaande afbeelding uit een alchemieboek zien we bijvoorbeeld hoe praktische en religieuze aspecten van het werk van de alchemisten werd gecombineerd. Zo zien we een alchemist die voor een fornuis aan het bidden is. Zijn gebed wordt gehoord door de engelen die hem de hermetische fles met daarin de Steen der Wijzen, hier gepersonificeerd als de god Mercurius. De Steen der Wijzen was een mythische steen die bij aanraking met andere stoffen ze in goud kon veranderen. Deze steen werd als heilig ervaart en was het ultieme doel van elke alchemist. Dit maakte het heel aanlokkelijk voor een aantal alchemisten om hun collega's te bedriegen door in hun boeken te vertellen dat ze de steen gemaakt hadden. Omdat dit natuurlijk niet mogelijk was, moesten de recepten voor het maken van deze steen vaag genoeg zijn, dat anderen hun claims niet konden ontkrachten. Zo werd vaak een mysterieuze metaforen en mythische referenties gebruikt, die - zogenaamd - alleen de echte wijzen zouden kunnen ontcijferen. De steen zou niet in de handen mogen komen van de verkeerde mensen. Ook werd vaak geclaimd dat voor succes in de alchemie ook de hulp van God nodig was. Als het iemand niet gelukt was het recept te volgen, dan zal dit wel komen doordat niet goed genoeg in God gelooft werd.

De eerste moderne scheikundige die hier verandering in bracht was Robert Boyle. Ook hij was beïnvloed door het werk van Bacon. Boyle noemde zijn nieuwe manier van werken zijn experimentele filosofie. Hij had kritiek zijn voorgangers die allerlei algemene conclusies trokken op basis van onvoldoende of niet toereikende metingen en die vergaande theoriën bedachten door te redeneren met ongecheckte aannamens. Boyle wilde met zijn nieuwe filosofie afstand nemen van de bedriegers in de alchemie en van de onbetrouwbare en niet bevestigde observaties die in vele tekstboeken te vinden waren. Ook wilde hij afstand nemen van de magie, geheimhouding en onbegrijpelijke mystieke referenties.

Boyle's experimentele filosofie maakte hem een echte wetenschapper. Zo had hij door dat de conclusies die hij trok slechts hypothesen waren die mogelijkerwijs omvergeworpen kunnen worden als tegenbewijs aan het licht komt. Ook gaf hij aan hoe belangrijk het was dat experimenten in detail en in precieze taal beschreven werden. Boyle schreef dat hij 'deze experimenten zo aanleverde, zodat ze voor de normale lezer gemakkelijk te begrijpen zijn'. Ook vond hij dat scheikundige experimenten reproduceerbaar moeten zijn

In zijn werk zien we dat Boyle niet alleen onderzoek doet om theoretische vragen te beantwoorden, maar ook test of het materiaal zelf betrouwbaar werkte. Waren de stoffen die gebruikt waren wel puur? Hoe kunnen we dit testen? Produceren verschilende ovens wel evenveel warmte? Weten we zeker dat een deel van de gassen niet toch langzaam ontsnapt?

Ook gaf Boyle aan wanneer experimenten mislukt waren. Een analyse hiervan kan voorkomen dat anderen dezelfde fout maken en kan wellicht anderen op ideëen brengen het beter te doen. In deze moderne tijd was geheimhouding niet nuttig. Wetenschap moet juist publiekelijk zijn en volledige openheid, zodat iedereen de experimenten kan herhalen en zelf kan nagaan of de theorie daadwerkelijk klopt.

Boyle had zelf goed door wat de impact van zijn ideëen waren. In zijn werk 'The Skeptical Chymist' laat hij een personage zeggen:

'[Ik heb] de ingenieuze dienst heeft gedaan om de scheikundige doctrines uit de donkere en rokerige laboratoria te trekken en ze in het open licht hebben gezet waar de zwaktes van hun bewijzen zichtbaar werden [...] en waardoor scheikundigen nu verplicht zijn in simpelere taal te spreken dan tot dusver gedaan is en betere experimenten en argumenten moeten leveren'.

Desondanks de moderne ideëen van Boyle, kon hij nog niet volledig afstand doen van het magische denken. Zo geloofde hij nog steeds in het bestaan van de Steen der Wijzen en geloofde dat deze steen als een universeel medicijn zou kunnen dienen. Ook geloofde hij dat de Steen spiritueel actief was en men in staat kon stellen om met engelen te praten. Hij zag de scheikunde daarom als een Christelijke activiteit. Deze verhalen stroken niet met het wetenschappelijk werk van Boyle en zijn eigen kritieken. Dit is echter kenmerkend voor de 17de eeuw. De wetenschappers uit deze tijd stonden nog met één been in de middeleeuwen en met het andere been in de moderne wereld. Zelfs Newton geloofde nog in de alchemie. Het merendeel van de notities die hij heeft achtergelaten gaan hierover. Ook hij heeft uren en uren besteed om die mysterieuze alchemische teksten te decoderen in een poging de geheimen eruit te kunnen ontcijferen. Ook deed hij veel onderzoek naar of Bijbelse voorspellingen waren uitgekomen.

De principes van Boyle's experimentele filosofie worden nog steeds gezien als essentiële eigenschappen van goede wetenschap. Neem bijvoorbeeld het geven van volledige openheid over het onderzoek dat gedaan is. Van wetenschappers wordt verwacht dat ze vertellen hoe ze hun experiment hebben uitgevoerd, wat de resultaten waren en welke onzekerheden er nog in het experiment zaten. Al deze informatie moet nauwkeurig worden gedocumenteerd en publiekelijk worden gemaakt. Op deze manier kunnen wetenschappers het werk van hun collega's zorgvuldig controleren. Is het experiment wel goed opgezet? Zijn de meetinstrumenten nauwkeurig genoeg? Zijn de gegevens wel correct verwerkt? Vooral als een wetenschapper een grote ontdekking doet, gaan wetenschappers van over de hele wereld nauwkeurig na of het experiment wel goed is uitgevoerd. Vervolgens moet het experiment ook nog een aantal keer herhaald worden door verschillende onafhankelijke wetenschappers. Pas als een hypothese al deze tests doorstaan heeft, zijn (goede) wetenschappers bereid de theorie aan te nemen.

Om te zien hoe dit in de praktijk gaat, wil ik het volgende voorbeeld bespreken. In 2011 dachten wetenschappers bijvoorbeeld een deeltje te hebben gevonden dat sneller is dan het licht. Dit was een bijzondere ontdekking, omdat dit volgens de speciale relativiteitstheorie van Einstein niet mogelijk is. De wetenschappers die de ontdekking gedaan hadden, reageerden zoals het hoort in de wetenschap:

'We nodigen natuurkundigen over de hele wereld uit om te onderzoeken wat we hebben gedaan en het helemaal tot in de detail uit te pluizen. Het zou ideaal zijn als wetenschappers op een andere plek op aarde dit experiment zouden kunnen herhalen, om te kijken of ze dezelfde resultaten vinden'.

Uiteindelijk bleek de snelheid van het deeltje door een foutje in de meetapparatuur toch iets langzamer te gaan dan het licht. Ook werd het experiment op een andere plek herhaalt en ook hier werd de lichtsnelheid niet overschreden.

Deze openheid naar de buitenwereld toe is voor wetenschappers vaak heel spannend. Wat als andere wetenschappers fouten in het experiment vinden? In zo'n geval kan jarenlang onderzoek nutteloos blijken te zijn. Toch gebeurd dit dagelijks in de wetenschap.




Confirmation bias

Zoals eerder vermeld hebben mensen de neiging snel patronen te zien, ook daar waar eigenlijk helemaal geen patroon aanwezig is. Daarnaast is het zo dat mensen graag gelijk willen hebben. Als gevolg hiervan zijn we geneigd om meer aandacht te geven aan aanwijzingen die onze ideeën bevestigen en minder aan aanwijzingen die ons tegenspreken. Dit effect wordt de confirmation bias genoemd en dit definiëren we als volgt:

Confirmation bias is het effect dat mensen data die overeenstemt met hun hypothese vaak onkritisch accepteren en data die hiermee in tegenspraak is onkritisch verwerpen of negeren.

Het bekendste voorbeeld van de confirmation bias is bijgeloof. Bijgelovige mensen zijn bij het lezen van een horoscoop geneigd om veel aandacht te geven aan de onderdelen die kloppen en weinig aan de onderdelen die niet kloppen. Op deze manier groeit bij deze mensen een krachtig geloof dat horoscopen kloppen.

We kunnen dit effect goed zien in het volgende filmpje. Een astroloog beweert dat ze aan de hand van het sterrenbeeld van een man kan voorspellen wat het sterrenbeeld van zijn vrouw is. In het filmpje kan je zien dat de astroloog in alle twaalf gevallen een verkeerde keuze heeft gemaakt. Bij zo'n disastreuze uitslag zou je verwachten dat de astroloog haar hypothese opgeeft, maar in het filmpje gebeurt dit niet. Ze verwerpt het negatieve resultaat direct. Ze zegt dat de resultaten 'bewijzen dat veel mensen een relatie aangaan met mensen waar ze eigenlijk niet goed bij passen'. Dit is een goed voorbeeld van confirmation bias. Positieve resultaten accepteert ze direct, maar voor de negatieve resultaten wordt een excuus bedacht. Dit is zeer onwetenschappelijk.

DEMO

Natuurlijk hebben we met dit filmpje ook niet meteen aangetoond dat horoscopen niet werken. Experimenten moeten namelijk herhaald worden. Dit is bijvoorbeeld gedaan in 1985. In dit experiment werden 28 erkende astrologen gevraagd om elk van 100 deelnemers de persoonlijkheden te voorspellen op basis van hun geboortedatum. Hun resultaten werden dan vergeleken met de resultaten van een erkende persoonlijkheidstest. Voordat het experiment begon hebben de wetenschappers de opzet van het experiment doorgenomen met de astrologen en alle astrologen waren het ermee eens dat het een eerlijk experiment was. De resultaten waren overduidelijk. Er was geen relatie gevonden tussen de horoscoop en de persoonlijkheid van de deelnemers. Ondertussen zijn er nog vele andere onderzoeken gedaan en allemaal geven ze hetzelfde resultaat. Dit is hoe de wetenschap een hypothese test. Nu is de uitslag duidelijk. Horoscopen werken niet.

Zelfs wetenschappers kunnen natuurlijk niet ontsnappen aan confirmation bias. Een bekend voorbeeld hiervan is de zogenaamde file drawer problem. Dit verwijst naar het feit dan onderzoeken die niks opleveren vaak (spreekwoordelijk gezien) in een lade verdwijnen en dus niet gepubliceerd worden. Als alleen onderzoeken met een positieve uitkomst gepubliceerd worden, dan kan hierdoor gemakkelijk een verkeerd beeld ontstaan over het fenomeen dat onderzocht wordt. Het is om deze reden belangrijk dat wetenschappers ook onderzoek publiceren waar niets uitgekomen is.




Dubbelblind onderzoek

Als we betrouwbaar onderzoek naar mensen willen doen, dan moeten we de strategie van Bacon uitbreiden tot een zogenaamd dubbelblinde experiment. Dit type onderzoek wordt gezien als de gouden standaard als het gaat om onderzoek naar mensen. Het gaat als volgt in zijn werk. Als eerst delen we de deelnemers op in twee groepen. In een van de groepen wordt de interventie uitgevoerd die we willen onderzoeken. Het zou bijvoorbeeld kunnen zijn dat de deelnemers van deze groep een bepaald medicijn toegedient krijgen. Dit wordt de interventiegroep genoemd. Bij de tweede groep worden zoveel mogelijk dezelfde handelingen getroffen, maar ontbreekt het element waarvan we de effectiviteit willen testen. In het voorbeeld van het medicijn, wordt eenzelfde pilletjes gegeven, alleen dan zonder de werkzame stof. Deze groep wordt de controlegroep genoemd.

Waarom is deze controle groep nodig? Stel dat je een onderzoek naar een medicijn tegen hoofdpijn wil testen. Je zoekt een groep mensen met hoofdpijn en geeft ze het medicijn. Stel dat 80% van de deelnemers na een half uur van zijn hoofdpijn af is. In eerste instantie lijkt het dat het medicijn dus redelijk gewerkt heeft. Zonder een controle groep is dit echter niet zeker. Stel dat mensen gemiddeld na een half uur zowiezo al van hun hoofdpijn afkomen? In dat geval zou dit resultaat dus niet zo bijzonder zijn. Daarnaast is het zo dat een neppilletje vaak ook al kan helpen. Zo'n neppilletje wordt een placebo genoemd. Het placebo laat mensen geloven dat het probleem verholpen wordt en in veel gevallen gaat het lichaam dan aan de slag om het probleem daadwerkelijk te verhelpen. Dit effect wordt het placebo-effect genoemd. Het mechanisme achter dit proces is nog vrijwel onbegrepen. Wel weten we bijvoorbeeld dat hoe meer de deelnemer overtuigt is van de werking van het placebo, hoe beter het werkt. Het beste voorbeeld hiervan is een actief placebo. Dit placebo bevat ook de werkzame stof niet, maar bevat wel een aantal stoffen die de deelnemer bijwerkingen geven. Deze bijwerkingen laten de deelnemer denken dat het pilletje daadwerkelijk zijn werk aan het doen is. Sommige recente studies naar antidepressiva, bijvoorbeeld, laten zien dat actieve placebo's even effectief zijn. De correlatie tussen de controlegroep en de interventiegroep was hier zo groot dat het best een zou kunnen zijn 'dat antidepressiva en placebo's hetzelfde zijn' (D. Burns M.D.).

Om echt te weten of het medicijn effect heeft, is het van belang dat we de interventiegroep vergelijken met de controlegroep. Stel dat in de interventiegroep 80% van zijn probleem afkomt en in de controlegroep 50%, dan weet je zeker dat het medicijn daadwerkelijk een positieve invloed heeft op het resultaat.

Bij het uitvoeren van het experiement is het vanzelfsprekend van belang dat de deelnemers niet weten of ze in de interventiegroep of in de controlegroep zitten. Wat niet zo voor de hand ligt is dat de wetenschappers die in contact komen met de groepen ook niet mogelijk weten in welke groep de deelnemers zitten. Stel dat de wetenschapper weet dat hij een placebo geeft, dan zou hij zich bewust of onbewust anders kunnen gaan gedragen en dit kan weer invloed hebben op het resultaat. Misschien dat de wetenschapper bijvoorbeeld slecht kan liegen en dit op een onbewuste manier communiceert. Je hebt hier dus minimaal twee wetenschappers nodig. Eën wetenschapper weet wie in welke groep zit en de ander voert het experiment uit. Als een onderzoek aan deze eigenschappen voldoet, dan noemen we het experiment dubbelblind. Het woord verwijst naar het feit dat zowel de deelnemers als de wetenschappers die met de deelnemers in contact komen dus niet weten wie in welke groep zit.

Tijd voor een voorbeeld. Stel dat we willen testen of mensen echt gaan lachen van lachgas. De interventiegroep krijgt lachgas toegediend. De controlegroep krijgt een ander gas toegediend in eenzelfde soort fles. Het is belangrijk dat de ervaring van het innemen van het gas hetzelfde aanvoelt. De controlegroep is ook hier nodig, want wellicht beginnen mensen zowiezo al meer te lachen in de veronderstelling dat ze lachgas ingenomen hebben. Ook de wetenschappers die het gas toedienen mogen niet weten welk gas ze toedienen. Als een wetenschapper bijvoorbeeld graag wil dat de lachgas echt werkt, dan kan hij iets enthousiaster zijn instructies geven aan de interventiegroep. Dit soort problemen worden op deze manier voorkomen. Als beide groepen evenveel lachen, dan werkt het lachgas dus niet. Als de groep met lachgas duidelijk meer lacht, dan werkt het lachgas wel.




Logisch positivisme

In de jaren 20 van de vorige eeuw hebben een aantal wetenschapsfilosofen de idealen van Francis Bacon verder uitgewerkt tot een stroming die het logisch positivisme wordt genoemd. Deze stroming had net als Bacon de ambitie om elke vorm van interpretatie uit de wetenschap verwijderen. Een belangrijk basisprincipe van de logisch positivisten was:

Elk cognitief betekenisvolle stelling is analytisch of synthetisch.

Laten we deze zin stap voor stap doorspreken. Volgens de logisch positivisten zijn maar twee type stellingen acceptabel in de wetenschap. De logisch positivisten noemden dit de cognitief betekenisvolle stellingen. Dit zijn stellingen precies geformuleerd zijn, zodat we kunnen achterhalen of deze stellingen waar zijn of niet.

Het eerste type stellingen worden analytische stellingen genoemd. Dit zijn stellingen op logische gronden waar moeten zijn. Een voorbeeld is 'een vrijgezel is niet getrouwd'. Niemand zal dit ontkennen, omdat een vrijgezel per definitie niet getrouwd is. Ook wiskundige stellingen, zoals 1+1=2, horen hierbij. Ook dit is per definitie waar, omdat we dit als mensen met elkaar hebben afgesproken. Voordeel is dat we van deze stellingen kunnen aannemen dat ze waar zijn zonder daarvoor metingen te hoeven verrichten. Nadeel van deze stellingen is dat ze ons niets nieuws vertellen over hoe de wereld werkt.

Het tweede type stellingen worden synthetische stellingen genoemd. Dit zijn stellingen waarbij we met een directe meting kunnen achterhalen of deze klopt. Een voorbeeld is: 'er zijn 25 mensen in dit lokaal'. Deze stelling kan met een simpele meting getest worden. Een ander voorbeeld is: 'een glas breekt bij een kracht van 650N'. We noemen dit type waarneming directe verificatie.

Stellingen die niet analytisch zijn en niet synthetisch zijn, noemden de logisch positivisten metafysische stellingen. Dit zijn stellingen die ons iets vertellen over hoe de wereld werkt, maar die (op dit moment) niet direct door onze waarnemingen bevestigd kunnen worden. De bekendste voorbeelden hiervan zijn religieuze stellingen. De stelling 'engelen bestaan' zegt ons wel iets over de wereld, maar kan niet door waarneming worden bevestigd. Maar ook de wetenschap zit vol met metafysische stellingen. In de tijd van de logisch positivisten waren atomen bijvoorbeeld nog niet direct waargenomen. Er waren destijds alleen indirecte aannamens dat ze bestonden en als gevolg vonden logisch positivisten de uitspraak 'atomen bestaan' problematisch tot het moment dat ze direct waargenomen waren. De logisch positivisten vonden metafysische stellingen onacceptabel in een wetenschappelijke theorie.

Een wetenschappelijke theorie zag er volgens de logisch positivisten uit als een web van analytische en synthetische stellingen. De synthetische stellingen zijn direct gekoppeld aan observaties en de synthetische stellingen worden verder gekoppeld met behulp van analytische stellingen tot een theorie. Op deze manier zijn alle stellingen in de theorie krachtig gekoppeld aan observatie en kunnen we vrij zeker zijn dat onze theorie correct is.

Als je leert over een theorie, dan is het verstandig om een dergelijk web uit te schrijven. Zo kan je goed zien of de theorie goed genoeg overeenkomt met observatie en dus betrouwbaar is. Je zult dan vaakgenoeg tegenkomen dat sommige stellingen die 'zo logisch klonken' eigenlijk metafysische stellingen zijn en dat hele delen van het web van analyitsche stellingen totaal niet gekoppeld zijn aan goede synthetische stellingen. De logisch positivisten noemden het maken van zo'n web een rationele reconstructie.

Laten we als voorbeeld de theorie van Aristoteles nemen. Hieronder is de rationele reconstructie van deze theorie te zien. Op eerste gezicht ziet de constructie er goed uit. De lichtblauwe hokjes bevatten de syntetische stellingen. De donkerblauwe hokjes bevatten wat op eerste oogopslag misschien analytische stellingen lijken. Zoals je ziet had Aristoteles bijvoorbeeld een aantal observaties gebruikt die suggereerden dat de aarde stil stond. Deze waren in de tijd vrij overtuigend. De bolvorm van de aarde en het feit dat voorwerpen terugvallen richting het centrum van de aarde deden hem geloven dat de aarde zich in het midden van het universum bevond en dat aards materiaal de eigenschap had dat het naar het centrum van het universum viel. De sterren en planeten vielen echter niet naar dit centrum en dit was voor Aristoteles aanwijzing dat ze van een ander materiaal gemaakt moesten zijn. Hij noemde dit het vijfde element.

In de onderstaande afbeelding zien we in oranje de syntetische stellingen die ontbraken in de theorie. Zonder deze syntethische stellingen zijn de meeste stellingen die we eerder analytisch hebben genoemd dus eigenlijk metafysisch. Er blijft slechts één analytische stelling over en dat is 'hemels materiaal en aards materiaal zijn verschillend'. Hoewel we nu weten dat deze stelling onzinnig is, volgt deze wel direct uit de (ook incorrecte) stellingen 'aards materiaal staat van nature stil' en 'planeten en sterren staan van nature niet stil'.

Laten we eens kijken naar de metafysische stellignen. Aristoteles had geen direct bewijs dat het universum een centrum had. Je zou misschien kunnen denken dat het feit dat aardse voorwerpen naar één punt vielen bewijs was voor het bestaan van dit centrum, maar deze stap is niet waterdicht. Tegenwoordig weten we namelijk dat alle deeltjes met massa elkaar aantrekken en dat dit de oorzaak is van de bolle vorm van de aarde en het feit dat voorwerpen naar het centrum van de aarde vallen. Ook is nooit bewezen dat materie een 'natuur' heeft en dat deze natuur dicteert of de materie 'het liefst' stilstaat of beweegt. Een ander lastig punt is dat het niet voelen van de beweging niet direct betekent dat we dan ook niet bewegen. Volgens de eerste wet van Newton weten we nu alle voorwerpen die met een constante snelheid bewegen niet merken dat ze bewegen.

Met deze rationale reconstructie hebben we de zwakke punten in de theorie van Aristoteles gevonden. Elk van de metafysische stellingen die in de afbeelding genoemd zijn, bleken in de 17de eeuw onjuist te zijn. Deze problemen bleken heftig genoeg dat de theorie - hoe ingenieus deze ook was - vervangen werd door de Newtoniaanse mechanica.




Inductie en causatie

De logisch positivisten hadden een krachtig manier gevonden om betrouwbare kennis te vergaren. Toch was ook deze theorie niet waterdicht. Twee cruciale lekken in de wetenschappelijke methode werken al gevonden in de 18de eeuw door David Hume. Zo vond hij dat het logisch gezien onmogelijk is om algemeen geldende stellingen te bewijzen. Denk bijvoorbeeld aan de stelling 'koper geleid electriciteit'. Om deze stelling direct te verifiëren, moet eigenlijk alle stukjes koper in het universum testen. Zelfs als we een miljoen stukjes koper testen, dan nog weten we niet of elk stukje koper geleid. Als we dit soort uitspraken toch willen maken, dan moeten we voor lief nemen dat we met een eindig aantal metingen een uitspraak doen over iets wat in alle gevallen geldt. Deze stap van een eindig aantal metingen naar een algemeen geldende regel inductie.

Volgens Hume stamt ons geloof in algemeen geldende stellingen af van ons geloof in de regelmaat van de natuur. Als 100 stukken koper elektriciteit geleiden, dan zullen alle andere stukken dit waarschijnlijk ook doen. In geval van koper zal dit wel kloppen, want dit is immers miljoenen keren getest, maar in andere gevallen kan inductie voor problemen zorgen. Vroeger werd bijvoorbeeld gedacht dat alle zwanen wit waren, omdat zwanen in Europa ook altijd wit waren. Ook deze stellingen was eeuwen lang en duizenden malen getest. Met behulp van inductie werd toen gedacht dat alle zwanen wit zijn. Later bleek echter dat in Australië ook zwarte zwanen leven. Inductie heeft hier dus niet gewerkt.

De onzekerheid van inductie, zo stelden critici van het logisch positivisme, maakt algemeen geldende stellingen metafysisch. Logisch positivisten zouden deze stellingen dus moeten verwerpen. Dit is echter problematisch, want om een theorie te bouwen waar we echt iets aan hebben, hebben we heel frequent dit soort stellingen nodig. Wat heb je aan de stelling 'een paar stukken koper ergens op de wereld geleiden elektriciteit', als je dan niet kan aanmenen dat dit ook geld voor andere stukken koper. Wetenschappelijke maken continue gebruik van dit soort stellingen. Als gevolg zijn wetenschappers daarom automatisch gedwongen om van de meest stricte vorm van het logisch positivisme af te stappen.

David Hume vond een soortgelijk probleem als het gaat om stellingen met een oorzaak-gevolgrelatie. Het idee dat gebeurtenissen plaatsvinden ten gevolge van andere gebeurtenissen noemen we causaliteit. Ook causale verbanden, zo stelde Hume, kunnen niet direct geverifieerd worden. In ons dagelijks leven geven we echter continu blijk van ons geloof in causale relaties. Als we bijvoorbeeld één biljartbal tegen een andere stoten, dan zeggen we dat de impact van de ene bal de oorzaak was van het bewegen van de andere bal. Wat we echter zien is dat de tweede bal gaat bewegen op het moment dat de eerste bal de tweede bal raakt. Wij interpreteren deze situatie correct als oorzaak en gevolg, maar we kunnen niet daadwerkelijk zien dat het een het andere veroorzaakt. Onze conclusie komt voort uit de ervaring die we in ons leven gehad hebben met soortgelijke situaties. Doordat we gedurende ons leven al heel vaak hebben gezien dat de ene situatie de andere opvolgt, gaan we ervan uit dat de een de andere veroorzaakt. We hebben dit zo vaak zien gebeuren dat het ons vertrouwen geeft dat het hier inderdaad om een oorzaak-gevolgrelatie gaat. Het zou wel heel toevallig zijn als de tweede bal altijd precies begint te bewegen als de eerste bal deze raakt, zonder dat er een causaal verband bestaat tussen de twee.

Laten we een realistisch voorbeeld bespreken waarbij dit probleem duidelijk wordt. Stel dat uit onderzoek blijkt dat mensen met die Latijn gehad hebben op de middelbare school betere resultaten behalen in het hoger onderwijs. Op eerste oogopslag lijkt dit erop te wijzen dat het leren van Latijn mensen intelligenter maakt. Het lijkt dan een goede strategie om alle leerlingen Latijn aan te bieden. In werkelijkheid ligt het anders. Latijn wordt aangeboden door gymnasia en gymnasia trekken intelligente leerlingen aan. De juiste oorzaak-gevolgrelatie is dus dat het gaan naar een gymnasia je kansen in het hoger onderwijs vergroot en dat je dan toevallig ook Latijn gedaan hebt. De eerder genoemde interventie - iedereen Latijn aanbieden - zou volgens deze interpretatie dus een grote verspilling van geld en tijd opleveren. In dit voorbeeld zien we duidelijk het probleem dat ontstaat doordat we causale relaties niet direct kunnen observeren. Het enige dat we echt kunnen opmaken uit dit experiment is dat Latijn en goede resultaten in het hoger onderwijs gecorreleerd zijn. Dit betekent dat er een relatie bestaat tussen de twee variabelen, zonder dat dit noodzakelijk een causale relatie is. In dit specifieke probleem bleek dat deze twee variabelen geen oorzakelijke relatie hadden, maar dat er een derde variabele was die de oorzaak was van deze twee variabelen. Dit is een veelvoorkomend probleem in wetenschappelijk onderzoek.

Nog een voorbeeld. Uit onderzoek blijkt dat mensen die over het algemeen optimistisch zijn minder vaak ziek worden en ook sneller herstellen. Het testen van deze stelling lijkt simpel. Je zoekt een groep optimisten en een groep pessimisten en je volgt ze een paar jaar en je houd bij hoe vaak en hoe lang ze ziek zijn. Als dan blijkt dat de optimisten minder vaak en minder lang ziek zijn, dan heb je de stelling toch bewezen. Zo simpel ligt het echter niet. Omdat we voor het onderzoek zochten naar optimisten en dan pas keken of ze minder vaak ziek zijn, denken we vaak automatisch dat het optimisme de oorzaak is en het minder ziek zijn het gevolg. Het kan echter ook precies andersom zijn! Het kan natuurlijk ook dat mensen die minder vaak ziek zijn daardoor juist optimistischer zijn. Oorzaak en gevolg zijn in dit geval dus precies omgekeerd!

Een bekend voorbeeld gaat over het gebruik van autogordels. In de jaren 50 werden autogordels ingevoerd om het aantal verkeersdoden terug te brengen. Uit onderzoek naar botsingen in onderzoekslaboratoria bleek dat gordels bij verscheidene type botsingen heel goed werkten. Het percentage verkeersdoden, zo werd gedacht, kan hiermee drastisch teruggebracht worden. Toen tientallen jaren laten naar het resultaat gekeken werd, bleek het echter totaal anders te werken. Inderdaad was het zo dat men met een gordel veel meer overlevingskans had bij eenzelfde type botsing, maar door het extra gevoel van veiligheid die de autogordel met zich mee bracht, gingen automobilisten onvoorzichtiger rijden. Hierdoor ontstonden zoveel meer botsingen, dat het aantal verkeersdoden onder automobilisten gelijk was gebleven! Elke botsing was dus veiliger gemaakt, maar het aantal botsingen was flink toegenomen. Hier komt nog bovenop dat voetgangers en fietsers niet van de extra veiligheid van de gordel konden profiteren. Voor deze groepen is het aantal verkeersdoden dan ook toegenomen! De wereld is vaak bijzonder complex. Wie had dit kunnen verwachten? In het lab leek het zo simpel: HET WERKT! Door complexe oorzaak-gevolgrelaties bleek het echter toch niet te werken.

Nog een bekend voorbeeld hiervan werd gevonden in een onderzoek naar het effect van verschillende typen verlichting op werknemers in een fabriek. Onderzoekers hadden in een fabriekshal de gloeilampen vervangen door ander type lampen waarvan werd gedacht dat ze beter waren voor de mens. Als gevolg van deze verandering ging de productiviteit omhoog, gaven de werknemers aan dat ze gelukkiger waren en melden de werknemers zich minder vaak ziek. Toen een nog beter type lamp gebruikt werd, gingen al deze factoren nog meer omhoog. Toen de oude lampen echter weer terug werden gehangen, gingen alle factoren nogmaals een beetje omhoog. Het bleek dat het niet de lampen waren die voor het effect zorgde, maar het feit dat de werknemers het gevoel hadden dat er voor ze gezorgd werd. De werknemers vonden het fijn dat er mensen waren die keken of ze hun leven iets prettiger konden maken. Het is van groot belang dat we rekening houden met dit soort fenomenen, want voor je het weet gaat elk bedrijf bakken geld uitgeven aan nieuwe lampen, terwijl het eigenlijk voldoende is de werknemers het gevoel te geven dat er aan ze gedacht wordt.

Het probleem met causaliteit maakt onderzoek in sommige vakgebieden nagenoeg onmogelijk. Stel dat je bijvoorbeeld een nieuwe onderwijsmethode wil testen. Dit lijkt simpel. Je laat een heel aantal docenten de nieuwe techniek testen en je laat een andere groep traditioneel lesgeven. Probleem is echter dat de nieuwe methode wellicht de voorkeur krijgt niet omdat deze beter werkt, maar omdat deze ervaren wordt als nieuw. Het zou dus kunnen zijn dat de test niets zegt over de methode, maar wel iets zegt over dat leerlingen graag variatie zien. Zou je een experiment naar hoe leerlingen met iets nieuws opgaan namelijk niet net zo uitvoeren!? De truck hier is om de methode lang genoeg te gebruiken zodat ook bij deze methode gewenning optreedt, maar hier is vaak geen geld voor. Omdat een goed onderzoek gigantische groepen docenten vereist, wordt het al gauw een dure grap. Als gevolg is dit een probleem waar weinig onderzoek naar onderwijs een antwoord op heeft.

Daarnaast kan het ook zo zijn dat docenten die bereid waren de nieuwe methode te testen, ook betere of enthousiastere docenten zijn. Maar meten we dan de methode of meten we het belang van enthousiasme? Een oplossing zou dan zijn ook minder enthusiaste docenten deel te laten nemen. Maar meten we dan juist niet het effect dat we krijgen als we docenten tegen hun wil in forceren een nieuwe methode te handhaven. Het is bijzonder lastig dit goed uit te voeren.

Tevens is het zo goed als onmogelijk om dit experiment dubbelblind - of zelfs enkelblind - te maken. Een vrij ingenieuze techniek is om leerlingen voor en na de interventie een vragenlijst in te laten vullen die zogenaamd niets met het onderzoek te maken heeft. Handig is om het te laten lijken op een landelijk onderzoek van bijvoorbeeld een overheidsinstantie. Zo weten de leerlingen dat ze deelnemen aan een nieuwe vorm van onderwijs, maar niet dat ze deelnemen aan een meting. Iets soortgelijks zou je ook voor de docenten kunnen doen.




Mill's methoden

De wetenschapsfilosoof John Stuart Mill ontdekte dat we niet geheel in het donker tasten als het gaat om oorzaak-gevolgrelaties. Hij bedacht een aantal methoden waarmee we op een systematische en redelijk betrouwbare manier oorzaak-gevolgrelaties kunnen achterhalen. Helemaal zeker zullen we echter nooit zijn.

De eerste methode van Mill wordt de methode van overeenkomst genoemd. De methode wordt als volgt beschreven:

'Als bij het bestuderen van een fenomeen twee of meerdere gevallen worden gevonden die slechts één omstandigheid met elkaar gemeen hebben, dan is deze omstandigheid de oorzaak of het gevolg van dit fenomeen'.

Laten we dit illustreren met een voorbeeld. Rond het jaar 1900 besmette een huishoudster genaamd Mary 47 mensen met de tyfus. Vreemd genoeg had Mary zelf geen symptomen van deze ziekte en daarom heeft het lang geduurd voordat men erachter kwam dat zij de ziekte verspreidde. Hoe zijn ze hier dan toch achter gekomen? Als je de oorzaak van de besmetting wilt vinden, dan moet je alle besmette mensen vergelijken en zoeken naar dat ene ding dat ze allemaal gemeen hebben. Hoewel Mary zelf geen symptomen had, was een ontmoeting met haar het enige dat de 47 mensen met elkaar gemeen hadden. Mary moest dus de oorzaak zijn! Op deze manier is voor het eerst ontdekt dat het mogelijk is besmet te zijn, zonder dat er symptomen zichtbaar zijn!

De tweede methode van Mill wordt de methode van verschil genoemd genoemd:

'Als in één situatie een fenomeen wel plaatsvindt en in een andere situatie niet en als het enige verschil tussen beide situaties is dat er in de eerste situatie een bepaalde omstandigheid voorkomt, dan is deze omstandigheid (deels) de oorzaak of het gevolg van het fenomeen.'

Laten we ook hier een voorbeeld bespreken. Meer dan een eeuw geleden stierven vrouwen vaker bij een bevalling in het ziekenhuis dan bij een bevalling thuis. Een dokter wilde dit onderzoeken en ging nadenken over het verschil tussen beide locaties. Het grote verschil was dat doctoren in ziekenhuizen vaak in aanraking kwamen met zieken en zelfs overleden patiënten. De dokter geloofde dat dit probleem verholpen zou zijn als doctoren vaker hun handen zouden wassen met zeep. De dokter werd eerst voor gek verklaard, maar bleek later toch gelijk te hebben.

De derde methode van Mill wordt de methode van de restanten genoemd:

'Als uit onderzoek blijkt dat een bepaalde omstandigheid de oorzaak is van bepaalde gevolgen, dan zijn de overgebleven omstandigheden de oorzaak van de overgebleven gevolgen'.

Stel dat we popcorn willen maken in de magnetron, maar dat de meeste popcorn niet ontpopt. Verschillende omstandigheden kunnen hier de oorzaak van zijn. We zouden bijvoorbeeld kunnen testen of we de popcorn te kort in de magnetron hebben gedaan. Als dit geen effect blijkt te hebben, dan kunnen we in ieder geval concluderen dat het niet (of niet alleen) heeft gelegen aan de duur dat de popcorn in de magnetron heeft gelegen. Op deze manier kan je bepaalde factoren dus systematisch uitsluiten. Als het je zo lukt om nog maar één factor over te houden, dan weet je dat dit de oorzaak van het probleem moet zijn.

De laatste methode van Mill wordt de methode van gelijktijdige variatie genoemd:

'Als je een bepaalde variabele varieert en een andere variabele verandert mee, terwijl alle andere omstandigheden gelijk blijven, dan is deze omstandigheid (deels) de oorzaak van het fenomeen.'

Stel we willen weten of het gebruik van kunstmest echt invloed heeft op de snelheid waarmee gras groeit. Door verschillende hoeveelheden kunstmest te gebruiken en alle andere omstandigheden gelijk te houden, kunnen we zien of kunstmest het gras beter laat groeien.

De methoden van Mill zijn bijzonder handig, maar toch geven de methoden geen zekerheid. Hoe weten we bijvoorbeeld dat een ontmoeting met Mary het enige was dat de 47 besmette mensen met elkaar gemeen hadden? Om meer zekerheid te krijgen over deze hypothese is het dus belangrijk om nog meer onderzoek te doen. Het definitieve bewijs werd gevonden toen het lichaam van Mary na haar dood onderzocht werd en er inderdaad tyfusbacteriën werden aangetroffen. Alle methodes hebben op soortgelijke manieren zwakke en sterke punten.




Indirecte verificatie

Een ander probleem met het strict logisch positivistisch model werd gevonden door A. J. Ayer. Hij merkte op dat zelfs de beste wetenschappers continu gebruik maakten van ook indirecte verificatie. Wetenschappers bleken vaak te geloven in allerlei fenomen die ze niet direct konden waarnemen. Als gevolg van deze observatie probeerde Ayer het logisch positivisme uit te breiden door ook de indirecte verificatie toe te staan. In deze paragraaf bespreken we de gevolgen hiervan.

Laten we beginnen met een voorbeeld. In de tijd van de logisch positivisten waren er veel sterke aanwijzingen dat er atomen bestonden, maar het atoom zelf was nog nooit direct waargenomen. Een van de aanwijzingen kwam van Einstein. In het begin van de 20ste eeuw deed hij onderzoek naar het bewegen van vetbolletjes in melk. In het onderstaande filmpje kun je goed zien dat deze bolletjes geheel willekeurig heen en weer lijken te bewegen. Einstein liet zien dat hij deze beweging kon verklaren door aan te nemen dat watermoleculen tegen de vetbolletjes aanbotsten. Hoewel hij de watermoleculen zelf niet kon zien, kon hij uitrekenen dat de bewegingen waren veroorzaakt door deeltjes die de eigenschappen van watermoleculen hadden.

DEMO

Hoewel dit onderwijs werd gezien als definief bewijs voor het bestaat van atomen en moleculen, kunnen we hier totaal niet spreken van directe verificatie maar van indirecte verificatie. Bij dit type verificatie meten we niet direct het fenomeen waarvan we iets willen (de atomen), maar meten we de gevolgen (de rondbewegende vetbolletjes).

Hoewel deze en andere metingen wetenschappers overtuigden van het bestaan van atomen, geven wetenschappers uiteindelijk toch de voorkeur aan directe verificatie. Ondertussen is dit gelukt. Hieronder zien we bijvoorbeeld een aantal atomen die zijn vastgelegd door de zogenaamde 'scanning tunneling microscope'.

Een recent voorbeeld van indirecte verificatie is de ontdekking van zwarte gaten. Dit zijn objecten in het universum die zo zwaar zijn, dat zelfs licht er niet aan kan ontsnappen. Omdat er geen licht uit deze voorwerpen komt, kunnen we ze niet direct waarnemen, maar we kunnen ze wel indirect verifiëren. In het midden van ons melkwegstelsel zien we bijvoorbeeld een aantal sterren met gigantische snelheden om een onzichtbaar object draaien (zie het onderstaande filmpje). Door de banen en de snelheden van deze sterren te observeren, hebben we de grootte en de massa van het object weten te bepalen. Deze eigenschappen vallen tevens in het bereik waarbij we volgens de theorie een zwart gat zouden verwachten. Ook dit is dus een voorbeeld van een succesvolle indirecte verificatie.

DEMO

Bijzonder is dat het bestaan van zwarte gaten door de meeste wetenschappers al geaccepteerd was zelfs voordat deze metingen gedaan werden. Dit komt omdat het bestaan van deze objecten een direct gevolg is van de algemene relativiteitstheorie van Einstein. Omdat deze theorie op zo veel plekken zo krachtig overeenstemt met de realiteit en deze theorie het bestaan van zwarte gaten voorspellde, zagen wetenschappers weinig reden om aan het bestaan van deze objecten te twijfelen. Dit type redenatie staat is erg ver verwijderd van het stricte logisch positivisme! Maar ook hier geldt dat wetenschappers de voorkeur gaven aan een zo direct mogelijke meting.

Het toevoegen van indirecte verificatie lijkt - afgaande op de bovenstaande voorbeelden - een goede stap te zijn. Het brengt echter ook een aantal problemen met zich mee die de logisch positivisten en Francis Bacon juist wilden voorkomen. Bij indirecte verificatie mogen we namelijk vrij filosoferen over de oorzaken van bepaalde fenomenen, zonder dat het nodig is dat we deze oorzaken zelf kunnen waarnemen! Als indirecte verificatie toegestaan is, wie weerhoudt iemand er dan van om te concluderen dat aliens bestaan bij het vinden van een graancirkel? In dit geval zouden wetenschappers alleen met directe verificatie genoegen nemen. Maar hoe kunnen we onderscheid maken tussen stellingen waarbij we indirecte verificatie wel toestaan en welke niet? Dit is lastig te definiëren.




Falsificatie

De filosoof Karl Popper ontdekte dat naast verificatie nog een andere manier om stellingen te bewijzen en dat deze methode in veel gevallen beter werkt in de zoektocht naar betrouwbare informatie. Hij noemde zijn methode falsificatie.

Popper werd bij het ontwikkelen van zijn methode geïnspireerd door het werk van Einstein. Einstein bedacht vaak vergaande theoriën zonder zich direct te bekommeren om elke stelling te gronden in directe verificatie. Op basis van deze theoriën deed hij dan precieze en onverwachte voorspellingen over hoe de wereld werkt. Pas achteraf werd dan onderzocht of deze voorspellingen ook daadwerkelijk correct waren. Als dit het geval was, dan had hij krachtig bewijs gevonden voor de juistheid van zijn theorie. Het is immers moeilijk te geloven dat een theorie onjuist kan zijn als het een onverwacht fenomeen zo nauwkeurig kan voorspellen.

Toen Einstein zijn theorie over de zwaartekracht ontwikkelde, stuitte hij bijvoorbeeld op een merkwaardige eigenschap van licht. Volgens zijn theorie zou licht moeten afbuigen als het langs een object met een grote massa zou bewegen. Einstein kon met zijn theorie zelfs uitrekenen hoeveel het licht zou afbuigen. Deze afbuiging was echter nog nooit gemeten! Een team wetenschappers besloot zijn stelling toen te testen door de afbuiging van sterlicht langs de zon te meten (zie de onderstaande afbeelding). Dit was nog nooit gedaan, omdat we overdag helemaal geen sterren kunnen zien door het felle zonlicht. Om het effect toch te kunnen meten ging de wetenschapper Eddington in 1919 op expeditie naar een plek op aarde waar dat jaar een volledige zonsverduistering optrad. Het verduisteren van de zon maakte het mogelijk overdag de sterren te observeren. Toen de metingen gedaan waren kwamen ze inderdaad exact overeen met de voorspelde waarden van Einstein. Dit was een krachtige aanwijzing dat de theorie van Einstein inderdaad klopte! Dit resultaat maakte Einstein in één klap wereldberoemd.

Buiten dat het bijzonder is dat de voorspellingen uitkwamen, was er volgens Popper nog een ander krachtig element van belang. De voorspellingen van Einstein erg precies en het experiment van Eddington had dus ook gemakkelijk kunnen aantonen dat Einstein ongelijk had. Einstein had door deze voorspelling te doen zijn hele theorie op het spel gezet en dat vond Popper een gedurfde actie. Het feit dat het deze test doorstaan heeft, gecombineerd met het feit dat de voorspelling onverwacht en nauwkeurig was, maakte het experiment een zeer krachtig bewijs voor de theorie van Einstein.

Op basis van dit voorbeeld bedacht Popper dat elke goede wetenschappelijk theorie zo geformuleerd moet zijn dat er een test denkbaar is waarbij de theorie op deze manier op de proef gesteld kan worden. Een theorie waarbij dit mogelijk was, of deze theorie nu uiteindelijk correct blijkt te zijn of niet, noemde Popper een falsifieerbare theorie. Er moet een experiment denkbaar zijn, waarbij de theorie het risico loopt verworpen te worden. We noemen een degelijk experiment ook wel een cruciaal experiment. Een theorie die hier niet aan voldoen, zo stelde Popper, is geen wetenschappelijke theorie.

Een goed voorbeeld van een niet-falsifieerbare theorie is religie. Er is bijvoorbeeld geen onderzoeksinstituut die kan testen of God bestaat of niet of dat een bepaald boek heilig is of niet. Een ander bekend voorbeeld is de astrologie. In de praktijk lukt het astrologen vaak om alle mogelijke fenomenen in termen van hun theorie te verklaren. Een voorspelling dat een persoon bijvoorbeeld deze maand ondanks een paar tegenslagen ook een gelukje zal hebben, zal voor zowat elke persoon op een bepaalde manier bevestigd kunnen worden. Popper merkte op dat astrologen, mits ze slim genoeg waren, zelfs informatie die in strijd was met hun theorie in hun voordeel konden uitleggen. De astrologie was dus in de praktijk niet te falsifiëren en wordt juist door bijna alles bevestigd. Verificatie, in dit voorbeeld, was dus weinig waard. Wat hier ontbreekt, vond Popper, is een openheid tegenover kritiek.

Een goed voorbeeld van een falsifieerbare theorie is de evolutietheorie. Volgens deze theorie zitten alle fossielen van dieren in een evolutionaire 'volgorde' in de grond. Deze claim is gemakkelijk te testen. Als iemand bijvoorbeeld een fossiel van konijn zou vinden in gesteente uit het precambrium, dan zou de evolutietheorie direct verworpen of in ieder geval radicaal aangepast moeten worden. Mensen die niet geloven in de theorie kunnen zelf gaan zoeken naar dit fossiel en als ze het vinden, dan zal de hele theorie op de schop moeten. Van alle miljoenen fossielen die zijn gevonden is dit echter nog nooit gebeurd. De theorie heeft al deze tests doorstaan. Dageljks loopt de evolutietheorie het risico geheel ontkracht te worden, maar dit gebeurt maar niet. Dit maakt deze theorie erg krachtig.

Het volgende voorbeeld laat goed het verschil zien tussen verificatie en falsificatie. Newton deed metingen aan de beweging van de maan en aan metingen van vallende voorwerpen op aarde en vond zo een formule voor de zwaartekracht. Dit is een voorbeeld van verificatie. De theorie is bedacht op basis van metingen. In de 19de eeuw werd ontdekte dat de planeet Uranus niet volledig bewoog volgens de zwaartekrachtswet van Newton. In plaats van te denken dat zijn formule onjuist was, werd voorspeld dat er wellicht een andere planeet was die de baan van Uranus verstoorde. Er werd toen met de zwaartekrachtswet van Newton uitgerekend waar deze planeet zou moeten zijn en toen op deze locatie gekeken werd, werd de planeet ook daadwerkelijk gevonden op slechts 1 graad vanaf de plaats waar deze voorspeld was! Dit is een voorbeeld van falsificatie. Er werd eerst een voorspelling gedaan en op basis daarvan werd een meting verricht.

In het bovenstaande voorbeeld was zowel verificatie als falsificatie effectief. In sommige gevallen is verificatie echter problematisch. Toen ik nog op de universiteit zat kwam een professor vertellen dat hij het probleem van donkere materie opgelost had. Volgens de zwaartekrachtswet van Newton zouden melkwegstelsels meer massa moeten bevatten dan ze in werkelijkheid lijken te doen. Deze ontbrekende massa wordt ook wel donkere materie genoemd. De professor dacht dit probleem opgelost te hebben. Hij vertelde dat als je het bestaan van allerlei hypothetische deeltjes zou aannemen, dan je dan 'precies' op de hoeveelheid donkere materie uitkomt die nodig was. Ik vroeg hem echter of hij eerst de massa van zijn hypothetische deeltjes had opgeteld en toen pas had gekeken of dit overeenkwam met de hoeveelheid donkere materie of dat hij al wist hoeveel donkere materie er nodig was en net zoveel hypothetische deeltjes had voorspeld totdat hij op het juiste getal uit kwam. Oftewel, is dit tot stand gekomen door middel van falsificatie of verificatie. Het laatste was het geval. De professor had met zijn theorie naar het antwoord toegewerkt en dit maakte zijn theorie niet bijzonder betrouwbaar. De volgorde waarin een theorie tot stand is gekomen kan dus invloed hebben op hoe betrouwbaar een theorie is!




Holisme

Het falsificatieprincipe van Popper leek even de heilige graal van de wetenschap, totdat de wetenschapsfilosoof Willard Van Orman Quine aantoonde dat ook dit nadelen heeft. Stel we willen de hypothese 'koper geleidt stroom' testen. Dit lijkt gemakkelijk te doen. We pakken een stuk koper, zetten het onder stroom en meten met een ampèremeter of er een stroom door het koper loopt. Als de ampèremeter aanslaat, dan zouden we volgens Popper moeten concluderen dat het koper geleidt. Als de ampèremeter niet aanslaat, dan zouden we de theorie dat koper geleid moeten verwerpen. Deze proef dient dus als een cruciaal experiment waarmee de stelling op de proef gesteld kan worden. Volgens Quine was dit te kort door de bocht. Als de ampèremeter namelijk niet aanslaat, dan kan het ook betekenen dat de ampèremeter stuk is, de batterij niet werkt, de bedrading niet goed verbinden is of het materiaal niet daadwerkelijk van koper gemaakt is.

Als de ampèremeter dus niet afslaat, dan kunnen we nog vele realistische 'excuses' bedenken, waardoor we onze hypothese niet direct hoeven te verwerpen. Dit komt dus omdat elke hypothese afhankelijk is van een aantal gerelateerde hulphypothesen. Als we meting niet uitpakt zoals we willen, dan zijn we formeel gezien gerechtvaardigd om de schuld ook afschuiven op één van deze hulphypothesen. Natuurlijk kunnen we deze hulphypothese ook weer afzonderlijk testen, maar ook deze hypothese is weer afhankelijk van een serie andere hulphypothesen. Dit betekent dat een stelling niet daadwerkelijk op de proef gesteld kan worden zoals Popper dat graag zag. Het cruciale experiment bestaat dus niet.

Een hypothese is dus nooit op zichzelf kunnen testen, omdat elke hypothese onlosmakelijk afhangt van allerlei hulphypothesen. Dit idee noemde Quine het holisme. Een negatief resultaat vertelt ons dat er een fout in onze theorie zit, maar het vertelt ons niet in welke hypothese deze fout zit. We kunnen het negatieve resultaat van een experiment dus altijd afschuiven op een andere hypothese en het geloof in de juistheid van onze hypothese vasthouden.

Quine zag in dat zijn ontdekking betekende dat je in principe elke hypothese in stand kan houden, welke bewijzen er ook tegen worden gevonden. Geen enkele observatie, geen enkel experiment kan een wetenschapper dus dwingen een bepaalde hypothese op te geven. Dit betekent dat het mogelijk is dat twee wetenschappers naar dezelfde data kijken en de data toch verklaren met een andere theorie. Quine noemde dit idee de onderdeterminatie van de data. De data is nooit genoeg om een theorie volledig vast te leggen ('te determineren').

Quine gebruikte graag het metafoor van een web om dit idee uit te leggen. In de onderstaande afbeelding zien we twee van deze webben. In beide gevallen zijn op de ring dezelfde waarnemingen afgebeeld. De theorieën die deze waarnemingen verbinden zijn echter in beide gevallen anders. Er zijn dus meerdere webben van theoretische stellingen denkbaar waarmee dezelfde waarnemingen kunnen worden verklaard.

In principe kan een wetenschapper elke hypothese verdedigen, maar in de praktijk blijkt dat sommige theorieën veel waarschijnlijker zijn dan andere. Stel dat ik bijvoorbeeld wil vasthouden aan het idee dat licht niet afbuigt als het langs de zon beweegt. Ik zou dan in principe kunnen geloven dat het gebruikte meetinstrument onjuist was ingesteld en daardoor per ongeluk de hoek aangaf die Einstein voorspeld had. Dit is echter niet geloofwaardig. Ten tweede zouden we de hypothese dat het apparaat niet deugt ook weer apart kunnen onderzoeken.

Naast zijn kritiek op de falsificatie, ontdekte Quine ook nog een foute aanname in het logisch positivisme. De logisch positivisten hadden onderscheid gemaakt tussen analytische en synthetische stellingen. De analytische stellingen waren gebaseerd op taalkundige logica. Een simpel voorbeeld hiervan was de definitie. Een definitie is alleen een naam die we aan een proces gegeven hebben, maar bevat geen informatie over de wereld. Een synthetische stelling daarentegen is een uitspraak gebaseerd op een meting. Dit onderscheid lijkt overduidelijk. Er is een duidelijk verschil tussen de stelling 'een vrijgezel is een ongetrouwd persoon' (analytisch) en 'een gemiddelde Amerikaanse vrijgezel weegt 80 kilo'. In het eerste voorbeeld zijn we slechts een taalspelletje aan het spelen. Het woord 'vrijgezel' is gewoon de definitie van iemand die 'niet getrouwd' is. Dit is een definitie die we zelf hebben bedacht en die dus zeker waar is. Voor het tweede voorbeeld moeten we metingen verrichten, om de waarheid van deze stelling te achterhalen. Bij nadere beschouwing ontdekte Quine dat dit verschil echter niet altijd helder was.

Tijd voor een voorbeeld. koper heeft een uniek atoomnummer dus zou gedefinieerd kunnen worden aan de hand van dit atoomnummer: 'koper is de stof die uit atomen bestaat met atoomnummer 29'. Dit is een voorbeeld van een analytische stelling, want het gaat hier gewoon een definitie. Het probleem ligt hier. Het bestaan van koper was al bekend ver voordat we wisten wat een atoomnummer was. In die tijd hadden we o.a. de volgende defintie van koper: 'koper is een zuivere stof met een dichtheid van 8960 kg/m3'. Ook dit is een goede definitie en ook dit is een analytische stelling. Maar toen kwam er een dag dat we het atoomnummer konden bepalen en iemand experimenteel aantoonde dat de stof met een dichtheid van 8960 kg/m3, die we altijd koper genoemd hebben, altijd bestaat uit atomen met atoomnummer 29. Dit is een synthetische stelling! Het is immers met een meting vastgesteld dat koper dit atoomnummer had. De stelling 'koper is de stof gemaakt van atomen met het atoomnummer 29' kan dus zowel een analytische als een synthetische stelling zijn.

Nog een voorbeeld. We kunnen koper definiëren met deze analytische stelling: 'een object is van koper gemaakt als het smelt bij 1357 graden Celsius'. We kunnen koper ook definiëren met deze analytische stelling: 'een object is van koper gemaakt als het een dichtheid heeft van 8960 kg/m3'. Beide stellingen lijken geheel taalkundig. Het lijkt erop dat we simpelweg een label plakken op een voorwerp met een bepaalde eigenschap. Als we deze twee analytische stellingen echter samenvoegen, krijgen we een synthetische stelling: 'Je vindt nooit een stof met een dichtheid van 8960 kg/m3 dat niet smelt bij 1357 graden Celsius'. Dit is een stelling die ons iets vertelt over hoe de wereld werkt.




Demarcatie

Wellicht de belangrijkste project in de wetenschapsfilosofie is om een methode te bedenken waarmee we onderscheid kunnen maken tussen theoriëren die wetenschappelijk zijn en theoriëren die dit niet zijn, de zogenaamde pseudo-wetenschappen.. We noemen het maken van dit onderscheid ook wel demarcatie. Deze vraag is vooral belangrijk omdat wetenschap wordt gezien als een 'speciale' manier van kennis verwerven is, die - beter dan alle andere vormen van denken - in staat is om zo betrouwbaar mogelijke informtatie te vinden. Het lijkt daarom voor de hand te liggen dat de wetenschap precies te definiëren moet zijn. In deze paragraaf gaan we zien dat dit lastiger is dan vaak gedacht wordt.

Een pseudo-wetenschap doet zich voor als een wetenschap, maar is dit in werkelijkheid niet. Een bekend voorbeeld is de astrologie. Uit dubbelblinde experimenten blijkt astrologie niet te werken, maar toch beweren astrologen dat ze betrouwbare voorspellingen kunnen doen over hoe wereld. De astrologie kent allerlei complexe begrippen en zelfs wiskunde wordt veelvuldig toegepast om de beweging van de planeten te kunnen beschrijven. Het heeft dus een aantal eigenschappen die het op eerste oogopslag wetenschappelijk laten lijken, maar bij nader onderzoek voldoet het niet aan de wetenschappelijke standaarden.

Bij astrologie is vrij duidelijk dat het een pseudo-wetenschap is, maar er bestaan ook veel randgevallen waarbij dit niet zo duidelijk is. De stringtheorie bijvoorbeeld is een poging om de relativiteitstheorie en de kwantummechanica met elkaar in overeenstemming te brengen. Het postuleert dat de elementaire deeltjes waar de wereld uit opgebouwd is bestaat uit kleine deeltjes die de vorm hebben van touwtjes. Deze touwtjes zijn immers veels te klein om met huidige meetapparatuur te kunnen meten. Er is dus geen manier om te controleren of de theorie klopt. Is dit een wetenschap of niet? Veel wetenschappers denken van wel.

Voor de logisch positivisten was het antwoord, zoals we gezien hebben, te vinden in directe verificatie. We hebben echter gezien dat deze theorie niet helemaal waterdicht is. Een behoorlijk aantal theoriëren die we in de praktijk wetenschappelijke zouden noemen, vallen buiten de demarcatiestrategie van de logisch positivisten. Een voorbeeld was de atoomtheorie, die Einstein bewezen had ver voordat de atomen daadwerkelijk direct gedetecteerd waren. Ook zijn er theoriën die voldoen aan het logisch positivistische beeld, maar die we juist niet als wetenschap zien. Popper merkte op dat in de astrologie mensen continu een connectie probeerde te maken tussen observaties en de theorie. Astrologen zijn de hele tijd bezig om hun theoriën in overeenstemming te maken met de theorie. Door de eeuwen heen hebben astrologen bijna alle mogelijke fenomenen in termen van hun theorie kunnen verklaren. Mits de astrologen slim genoeg waren, konden we bijna alles wat ze tegenkwamen uitleggen in het voordeel van de pseudowetenschap. Popper zag dit als een groot nadeel van de directe verificatie.

Popper kwam, zoals we al gezien hebben, met een alternatief: de falsificatie. Het was de openheid tegenover kritiek, die cruciaal was voor een echte wetenschap. Een pseudowetenschap, zo stelde hij, kan je niet falsifiëren en wordt juist door bijna alles bevestigd. Een goede theorie maakt verrassende en onverwachte voorspellingen, die makkelijk gefalsifieerd kunnen worden. Als het deze tests doorstaat, dan wordt de theorie geloofwaardiger. Ook de falsificatie is echter problematisch als het gaat om demarcatie. Zo is niet elke falsifieerbare theorie ook direct wetenschappelijk. Een statement als 'morgen landen aliens in mijn tuin' is falsifieerbaar, maar wordt in de praktijk niet gezien als een wetenschappelijke theorie. Ook zijn er theoriën die we wel zouden erkennen als wetenschap, maar die niet falsifieerbaar zijn. Een bekend voorbeeld hiervan is de stringtheorie waarover eerder in deze paragraaf vertelt is. Ook is een stelling als 'atomen bestaan' of ' buitenaards leven bestaat' niet falsifieerbaar. Je kan een atoom of een buitenaards wezen wel vinden (verificatie), maar je kan niet bewijzen dat ze niet bestaan (falsificatie). Om dit te bewijzen moet je namelijk overal in het universum kijken. Ook kunnen sommige problemen met kans niet gefalsifieerd worden. Als ik 10 keer gooi met een dobbelsteen en telkens 6 gooi, dan heb ik hiermee niet bewezen dat de dobbelsteen oneerlijk is. Het kan namelijk gewoon toeval zijn.

Er waren ook filosofen die een andere weg zochten om het demarcatieprobleem om te lossen. Sommige filosofen dachten dat pseudowetenschappen misschien minder vooruitgang maakten dan wetenschappen. Maar al snel bleek dat een theorie als de astrologie juist sterk in de tijd veranderd is. Ook zijn er een aantal vakgebieden die zo goed als klaar zijn en daardoor niet meer veranderen.

Een andere optie is om wetenschappen te beoordelen op basis van de aanwezigheid van mechanische verklaringen. Ook hier stuiten we echter op problemen. De astrologie zou in dit geval keurig als pseudowetenschap erkend worden, maar ook de gravitatiewet van Newton zou deze test niet doorkomen. Net als dat astrologen het mechanisme achter de invloed van de sterren op de mens niet kunnen verklaren, kon ook Newton niet verklaren hoe de zwaartekracht daadwerkelijk werkt. Hoe kan de zon de aarde in zijn baan houden zonder dat de zon en de aarde direct met elkaar in contact zijn? Hier had Newton geen verklaring voor.

Ook de manier van redeneren is geen goede manier om wetenschappen van pseudowetenschappen te scheiden. Sommige pseudowetenschappen gebruiken ook wiskunde, statistische analyse, causale verklaringen en voeren experimenten uit. Denk bijvoorbeeld aan de mensen die geloven dat de aarde plat is. Deze mensen geven vaak redelijk briljante (maar incorrecte) verklaringen om de bewijzen voor een ronde aarde te kunnen verwerpen. Een ander goed voorbeeld is de parapsychologie. In hun ingenieuze onderzoeken wordt statische analyse gebruikt, controle groepen en worden zelfs veel onderzoeken gepubliceerd die niets opgeleverd hebben. Daarnaast is het belangrijk om te realiseren dat de wetenschappen zelf ook vaak onnauwkeurige en onzekere redenatiemethoden gebruiken. Soms is dit het beste wat we op dat moment kunnen doen

We merken dat telkens wanneer we een criterium verzinnen, sommige pseudowetenschappen binnen het criterium vallen en sommige wetenschappen erbuiten. We kunnen hieruit concluderen dat de wetenschappelijke methode - die in de eerste paragraaf nog zo helder klonk - eigenlijk een vrij complex en intuitief proces is. Een goede eenduidige definitie blijkt niet goed mogelijk. Het feit dat ons brein in veel gevallen (maar helaas niet in alle gevallen) in staat is om 'op gevoel' onderscheid te maken tussen wetenschap en pseudo-wetenschap, geeft maar weer blijk van hoe ongelovelijk complex en bijzonder onze hersenen in de tijd geëvolueerd zijn. Hetzelfde geldt voor vragen over oorzaak en gevolg.




Het nieuwe raadsel van de inductie

Hume had laten zien dat inductie problematisch was, omdat we bij inductie een algemeen geldende regel proberen te vinden met behulp van een eindig aantal metingen. Nelson Goodman vond in de 20ste eeuw een ander groot probleem als het gaat om inductie. Hij noemde dit probleem het nieuwe raadsel van de inductie. Goodman merkte op dat het vaak veel te gemakkelijk gaat om patronen te herkennen in meetwaarden. Waar Hume dus dacht dat het problematisch was om echte connecties in de natuur te vinden, liet Goodman juist zien dat het ook vaak te gemakkelijk was om patronen te vinden. Patronen zijn juist in overvloed te vinden, maar niet alle patronen blijken waardevol.

Neem bijvoorbeeld het volgende bizarre idee. Stel een object heeft een kleur die we grauw noemen. Een object heeft deze kleur als het voor het jaar 3000 wordt gemeten en groen is of na het jaar 3000 wordt gemeten en blauw is. Als een bepaald type edelsteen altijd groen is, dan moeten we met deze definitie ook concluderen dat deze edelstenen grue zijn (want ze zijn immers voor het jaar 3000 gevonden). Met behulp van inductie zouden we dan verwachten dat edelstenen na het jaar 3000 ook grue zijn, maar dat zou betekenen dat dezelfde edelstenen dan blauw moeten zijn! Natuurlijk is dit een flauw voorbeeld, maar Goodman wilde hiermee een dieper punt maken. Hoewel deze term vreemd is, is het logisch gezien wel een legitieme term. We zien met dit voorbeeld dat het in principe mogelijk is om logisch consistente concepten te bedenken die onzinnig zijn. In dit geval is het echter duidelijk waar de fout ligt. Probleem is alleen dat we bij ingewikkelde theoriëren vaak niet weten of de termen die we bedenken 'echt' zijn of dat ze onzinnige concepten als 'grauw' zijn. De kans bestaat dus dat veel van de concepten die we gebruiken waardeloos zijn. Goodman concludeerde hiermee dat onze taalkeuze bij het formuleren van termen dus invloed heeft op de inductie en dat is natuurlijk niet wenselijk. Dit zorgt dat de grens tussen feiten en taal vervaagt.

Laten we nog een bizar voorbeeld bespreken. Neem de term 'brocosaxodil'. Dit is een object dat een broccoli, een saxofoon of een krokodil is. Natuurlijk is dit een belachelijke groepering van eigenschappen, maar het is wel een legitieme term. Een meer realistisch voorbeeld is 'roofdier'. Deze groep bestaat uit een behoorlijke diverse groep dieren. Bestaat dit onderscheid echt in de natuur of is dit slechts een handige manier van spreken? Een voorbeeld waar het duidelijk om een handige manier van spreken gaat is de groepering van houtsoorten die gebruikt kan worden om meubelen mee te maken. Voor timmermannen is dit een handige groepering, maar de groep bevat allerlei bomen die niet genetisch niet dicht met elkaar verwant zijn. Het is dus waarschijnlijk niet een term die 'in het echt in de natuur bestaat'. Maar dit betekent dat als een term 'werkt', dat dit nog niet hoeft te betekenen dat de term ook daadwerkelijk bestaat!

Zelfs bij een duidelijk concept als een 'boom' kunnen we nog afvragen of dit een natuurlijk concept is. 'Weet' het universum wat een boom is? Waarschijnlijk niet. Het universum is gevuld met deeltjes en deze deeltjes kunnen bewegen en oefenen krachten op elkaar uit. Dit is alles was het universum lijkt te doen. Dat deze deeltjes af en toe de vorm van een boom aannemen is niet iets wat het universum 'opvalt' of 'doorheeft'. Er wordt hier geen onderscheid gemaakt tussen de atomen die in de boom zitten en de atomen die buiten de boom zitten. Het is ons brein die het patroon 'boom' herkent en hier handig mee kan werken.

Bij de voorbeelden die in de vorige alinea's genoemd zijn heeft iedereen wel een intuitief idee over of deze termen echt zijn of niet, maar dit geldt niet voor de lastigere theoriëren waarover we nog veel vragen hebben. Probleem is dat we daar geen goede manier hebben om te achterhalen aan welke termen het universum 'de voorkeur geeft' en welke termen niet. Welke termen zijn kunstmatig en welke termen zijn juist natuurlijk? Deze vraag is nog onopgelost in de filosofie.

Een wat complexer voorbeeld is de term 'elektromagnetisme'. Vroeger dacht men dat elektriciteit en magnetisme twee totaal verschillende fenomenen waren. In de 19de eeuw werd ontdekt dat beide fenomenen met één set natuurwetten te beschrijven waren (de Maxwellvergelijkingen). Ook werd ontdekts dat je met een magnetisch veld een elektrisch veld kon maken en andersom. Elektriciteit en magnetisme waren onlosmakelijk aan elkaar verbonden. Dit werd nog duidelijker toen Einstein aan het begin van de 20ste eeuw aantoonde dat magnetisme niets anders was dan een relativistische transformatie van het elektrisch veld. Vanaf dat moment was duidelijk dat we naar slechts één fenomeen aan het kijken waren: elektromagnetisme.

Nog een laatste voorbeeld. In de tijd van Aristoteles werd gedacht dat voorwerpen een doel hadden en dat dit doel verstopt zal in de 'essentie' van het voorwerp. Bij een dier zou je hier misschien iets bij voor kunnen stellen. Een dier heeft bijvoorbeeld als doel dat het wil overleven en zijn genen wil doorgeven aan de volgende generatie. Bij de organen in het menselijk lichaam is hier ook iets voor te zeggen. Het hart lijkt bijvoorbeeld als doel te hebben om bloed rond te pompen in het lichaam. Bij een object als een steen is dit echter niet zo duidelijk. Volgens Aristoteles was het doel van een steen om richting het centrum van het universum te vallen en daar stil te liggen. Het doel van een vlam is juist om richting te hemel te wijzen, want zelfs als we een kaars op z'n kop houden, zo redeneerde Aristoteles, wijst de vlam nog steeds omhoog. In de tijd van Aristoteles voelde dit concept natuurlijk. Er werd niet aan getwijfeld. Maar hoe weten we of veel van de concepten die we vandaag de dag hanteren wel 'echt' zijn? Op deze vraag hebben we nog geen algemeen geldend antwoord.




De paradox van de raaf

Zelfs de vraag of een bepaalde meting telt als bewijslast voor een bepaalde stelling is ingewikkeld. De logisch positivisten kwamen met het meest simpele voorstel hiervoor, genaamd het instantial model. Als men een A vindt met eigenschap B, dan dient dit als bewijslast voor 'Alle A's zijn B'. Dit wil natuurlijk niet meteen zeggen dat de stelling waar is. Om hier zekerder van te zijn is het van belang herhaaldelijk te meten.

De filosoof Carl Hempel liet zien dat je zelfs met dit model dingen als bewijslast moet tellen, die we intuitief hier niet toe zouden rekenen. Hij noemde zijn idee hierover de paradox van de raaf. De stelling 'Alle raven zijn zwart' is logisch equivalent aan 'Alle niet-zwarte dingen zijn niet-raven'. Als we waarde hechten aan de logica - wat we natuurlijk doen - dan moet deze tweede stelling ook waar zijn. Maar volgens deze stelling zouden volgens het instantial model alle niet-zwarte dingen, die geen raaf zijn, ook bewijs zijn voor 'alle raven zijn zwart'. Als we bijvoorbeeld een geel potlood vinden, dan zou dit bewijslast moeten leveren voor 'alle raven zijn zwart'. Maar wat heeft het gele potlood nu weet met een raaf te maken? Gekker wordt het nog als we bedenken dat het gele potlood ook bewijslast levert voor 'alle raven zijn rood' en zelfs voor 'elke mier is een olifant'!

Hempel zijn had er trouwens geen probleem mee om het gele potlood te gebruiken als bewijs voor 'alle raven zijn zwart'. Hij beschouwde het als een vooroordeel, dat 'alle raven zijn zwart' alleen over raven moet gaan. Stel namelijk dat je alle niet-zwarte objecten zou bekijken en geen raven zou aantreffen, dan zou men weten dat alle raven zwart zijn!

Ook falsificatie is trouwens problematisch in de paradox van de raaf. Popper dacht dat een stelling falsifieerbaar moest zijn om als bewijs te kunnen dienen. Als wij eerst een zwart object bekijken en pas daarna kijken of het om een raaf gaat, dan kan de stelling niet gefalsifieerd worden. Als het object een raaf blijkt te zijn, dan is de stelling bevestigd (verificatie) en als het geen raaf blijkt te zijn, dan dient de meting niet als bewijslast voor of tegen de stelling. Het wordt op deze manier onmogelijk om raven van een andere kleur te vinden en dus om te falsifiëren. Als we op deze manier duizenden raven zouden meten, dan zou dit volgens de theorie van Popper totaal niets toevoegen aan de bewijslast!

Als men echter een geel object vindt en het blijkt daarna wel of niet een raaf te zijn, dan werkt falsificatie wel. Als het wel een raaf blijkt te zijn, dan is de stelling 'alle raven zijn zwart' gefalsifieerd. Als het geen raaf blijkt te zijn, dan heeft het een test doorstaan en zou dit dus volgens Popper wel moeten dienen als bewijslast. Er bestond immers de mogelijkheid, dat het gele object een raaf was. Zowel de verificatie als de falsificatie heeft dus het probleem dat gele potloden kunnen dienen als bewijslast. Zoals we eerder gelezen hebben is alleen bij falsificatie de volgorde van observatie belangrijk - zien we eerst het voorwerp en dan de kleur of eerst de kleur en dan het voorwerp. De een levert bewijslast en de ander niet.

Als het instantial model als problematisch kan zijn, dan kan je je misschien voorstellen dat het nog vele malen problematischer wordt als je bedenkt dat wetenschappers vaak genoegen nemen met stellingen die voor complexer dat zijn 'Alle A zijn B'. Een meer populair alternatief op dit model is het hypothetico-deductive model. Dit model stelt dat bewijslast is geleverd voor een hypothese, als de consequenties of gevolgen van deze hypothese waar blijken te zijn. Hiermee kunnen we bijvoorbeeld concluderen dat licht een golfkarakter heeft als we met licht een interferentiepatroon kunnen maken (een patroon dat we ook vinden bij bijvoorbeeld golven in water en bij geluidsgolven). Deze conclusie mogen wetenschappers in dit model trekken zonden direct golf van licht gezien te hebben. Het zal je ondertussen niet verbazen dat deze extra vrijheid in veel gevallen ook juist erg problematisch kan zijn.

Dit model wordt soms aangebreid door toe te voegen dat de hypothese de data ook moet kunnen verklaren. De theorie die een set aan data zowel het best kan beschrijven als verklaren krijgt hier de voorkeur. Maar zelfs deze combinatie is problematisch als we bedenken dat theoriën die al eeuwen bestaat vaak heel veel verklaren en nieuwe concurerende theorieën aan het begin nog te kort schieten. Hoewel de bewegingsleer van Aristoteles bijvoord meer verklaarde dan het alternatief van Galileo, betekende dit niet, dat de theorie van Aristoteles beter was. Pas laten - in de tijd van Newton - namen de ideëen van Galileo de overhand. Maar hoe weten we of de theorieën die we nu voor waar aannemen niet uiteindelijk worden ingehaald door nu nog onderontwikkelde alternatieven. Daarnaast is het ook nog zo dat verklaringen vaak moeilijk te vergelijken zijn. Zo had Copernicus bijvoorbeeld laten zien dat als hij aannam dat de aarde om de zon bewoog, dat de geobserveerde banen van de planeten dan veel simpeler werden. Maar is een simpelere baan van een planeet daadwerkelijk bewijs dat hij dan ook gelijk had? Kon het niet zijn dat de planeten wel in de complexere manier bewegen zoals door zijn collega's gedacht werd? En hoe kon een object zo zwaar als de aarde in beweging zijn gekomen en in beweging blijven? En waarom merken we niets van deze beweging? Het was in die tijd lastig te besluiten welke bewijsvoering daadwerkelijk beter was. Pas door het werk van Galileo werden de meeste wetenschappers over de streep getrokken en werd het heliocentrische model geaccepteerd.

Ook in dit geval zien we dat ons intuitieve idee van bewijslast moeilijk vast te leggen is in een precieze defintie. Elk model dat we bedenken laat onzinnigheden binnen en laat degelijk onderzoek buiten. Wederom dwingt dit respect af voor de mogelijkheid van onze hersenen om in dit soort situaties vaak goede beslissingen te maken.




Paradigma's

Nog een grote klap voor zowel het logisch positivisme als het werk over falsificatie van Popper kwam van het werk Thomas Kuhn (1922 – 1996). Kuhn concludeerde dat beide theorieëen weinig te maken hadden met wetenschap er in de praktijk aan toe gaat. Kuhn kwam tot zijn conclusies door niet op zoek te gaan naar een onderliggende methode voor goede wetenschap, maar door te kijken hoe men in de praktijk met wetenschap bezig was.

Door zijn studie van de geschiedenis van de wetenschap kwam Kuhn tot de conclusie dat wetenschappers hun geschiedenis systematisch misrepresenteren. Ze beschrijven hun ontdekkingen in een progressieve, directe en logische lijn van heldere vragen naar antwoorden - naar de belangrijke wetenschappelijke triomfen. Als je kijkt hoe theorieën echt tot stand komen, concludeerde Kuhn, dan zou je deze versie van de geschiedenis best 'brain washing' kunnen noemen. De wetenschappelijke textboeken waren het beste voorbeeld van deze illusie. Ze gaven vaak een Popperiaans plaatje van de wetenschap, met helden, triomfen en onverwachte voorspellingen die precies uitkwamen.

In werkelijkheid zijn de meeste wetenschapper echter hun meeste tijd kwijt met wat Kuhn normale wetenschap noemde. Anders dan de visie van Popper is normale wetenschap vrij dogmatisch en zeker niet zo dramatisch als bij Popperiaanse falsificatie. In plaats van het verleggen van grenzen, was de normale wetenschap volgzaam aan het werk aan de theorieën waarover consensus bestaat. Ze werken binnen het algemeen geaccepteerde wereldbeeld, of zoals Kuhn het noemde, het algemeen geaccepteerde paradigma. De taak van deze wetenschappers is om voorbeelden uit de tekstboeken te leren en soortgelijke redeneringen te gebruiken op nieuwe gevallen. Binnen het paradigma staat dus ook vast op welke manier gedacht mag worden. Er bestaan regels voor welk soort bewijzen wel geaccepteerd worden en welke niet. En met welk doel doen deze wetenschappers dat. De bekende wetenschapsfilosoof Ian Hacking vat het als volgt samen:

'Much normal science is technological application. Some normal science is the experimental elaboration and clarification of facts implied in the theory. Some normal science is refined measurement of quantities that the theory says are important. Often the aim is simply to get a precise number by ingenious means. This is done neither to test nor confirm the theory. Normal science, sad to say, is not in the confirmation, verificaion, falsification or conjecture-and-refutation business at all'.

In plaats van het testen van de theorie, is de normale wetenschap bezig met het oplossen van puzzels, die door het paradigma gedefinieerd zijn. Deze puzzels dienen opgelost te worden met de methoden, die door het paradigma zijn vastgesteld. De puzzels hebben als doel om het paradigma beter aan te laten sluiten aan de observatie. In de praktijk hebben grote theorieën altijd wel een aantal essentiële onbeantwoorde vragen. In Popper's vocabulaire zou je dus zeggen als alle grote theorieën al gefalsifieerd zijn. Het hoofddoel van normale wetenschap is om deze data toch in overeenstemming te brengen met de theorie. Maar dit is jusit precies waar Popper zo op tegen was!

Sommige van de puzzels blijken echter zo hardnekkig dat er een crisis kan ontstaan binnen een wetenschap, waarbij het paradigma zijn grip op de wetenschappers kwijt raakt. Een puzzel die zich bleef verzetten tegen een oplossing noemde Kuhn een anomalie. Deze anomoliën worden vaak ontdekt in periodes van normale wetenschap, omdat men juist in deze periodes heel nauwkeurig en gedetailleerd werkt. Tijdens een crisis kunnen deze anomoliën de theorie dusdanig op de proef stellen dat deze naar de prullenbak verwezen moet worden. Tijdens deze periodes gaat men zich opnieuw afvragen wat de juiste manier is van wetenschap bedrijfen in het desbetreffende vakgebied. In plaats van het oplossen van puzzels, gaat men nu filosoferen en lijkt de wetenschap meer op de wetenschap die Popper beschreven had. In het geval dat een nieuw paradigma de plaats inneemt van de oude, spreken we van een revolutie. Als dit gebeurt is, dan treedt weer een periode van normale wetenschap in en begint het hele verhaal weer opnieuw.

Kuhn merkte op dat het vaak de relatief jongere wetenschappers zijn, die de overstap maken naar een nieuw paradigma. Dit is te begrijpen, omdat ze minder gebonden zijn aan het oude dogma. De natuurkundige Max Planck verwoordde dit effect als volgt:

'A new scientific truth does not triumph by convincing its opponents and making them see the light, but rather because its opponents eventually die.'

Op een ander moment vertelde hij:

'Science changes, funeral by funeral.'

Ook persoonlijkheidsverschillen spelen hier een grote rol. Sommige mensen kunnen gemakkelijker afstand doen of durven sneller de knuppel in het hoenderhok te gooien. In tijden van crisis spelen dus generatieverschillen, persoonlijkheden en persoonlijke voorkeuren een rol. Dit is veel minder het geval tijdens perioden van normale wetenschap, waarin de puzzels en de toegestane denkwijzen vast staan.

Als na een crisis een nieuw paradigma ontstaat, dan heeft het een aantal successen gekend, maar is het in vergelijking met het oude paradigma vaak nog onderontwikkeld. Dit is te verwachten omdat de nieuwe theorie nog geen periode van normale wetenschap achter de rug heeft gehad. Het nieuwe paradigma is in sommige gevallen niet eens in staat om alle belangrijke fenomenen te verklaren die in het oude model nog netjes opgelost waren.

Popper accepteerde dat veel van de conclusies van Kuhn overeenkwamen met hoe wetenschap in de praktijk werkt, maar dat dit voorbeelden waren van slechte wetenschap. Dit was een probleem inherent aan de aanpak van Kuhn. Door naar de praktijk te kijken, bestond het gevaar dat hij zowel goede als slechte wetenschap aan het bestuderen was, terwijl Popper alleen belangstelling had voor 'goede wetenschap'. Kuhn zag echter geen reden om het werk tijdens periodes van normale wetenschap als 'slechte wetenschap' te bestempelen. Normale wetenschap is nodig om de theorieën uit te diepen en zorgt ook voor veel van het wetenschappelijke succes. Hij zag daarom zowel normale wetenschap als revoluties als goede wetenschap.


Incommensurabiliteit

Thomas Kuhn bouwde ook voort op het werk van Quine. Ook hij ervan overtuigt dat er vaak meerdere theorieën zijn waarmee dezelfde geobserveerde data verklaard kan worden. Hoewel in sommige gevallen een theorie duidelijk beter is dan een andere, zijn er ook situaties waarbij beide theorieën hun eigen sterke en zwakke punten hebben en waarbij het dus niet meteen duidelijk is welke theorie juist is. Er is in deze gevallen geen logische wijze tussen paradigma's te kiezen. Kuhn noemde deze onzekerheid incommensurabiliteit

Volgens Kuhn heeft elk paradigma tot op zekere hoogte zijn eigen taal waarin gecommuniceerd wordt. Ook wordt er binnen verschillende paradigma's anders gedacht over wat telt als een degelijk bewijs en zelfs wat telt als een feit. Iets wat in het ene paradigma wordt gezien als een vaststaant feit, kan in het andere paradigma worden verworpen. Elk paradigma kent andere regels en standaarden en evalueert zijn theorieën op een andere manier. Volgens Kuhn is zelfs de betekenis van termen afhankelijk van het paradigma waarvanuit deze term beschouwd wordt. Neem een begrip zoals massa. Newton en Einstein hadden een heel ander idee van wat massa is.

Deze verschillen maken het vaak problematisch om te kiezen tussen alternatieven. Er is namelijk vaak niet een theorieneutrale taal te vinden waarin we beide theorieën kunnen uitdrukken en vergelijken en dit maakt effectieve communicatie tussen voorstanders van beide paradigma's problematisch. In de woorden van Ian Hacking:

'We cannot say that successor T* does the same job better than T, because they do different jobs'.

Als gevolg is de overstap van het ene paradigma naar het andere paradigma vaak geen vloeiend proces - maar meer een shock. Voor Kuhn had de overstap van het ene naar het andere paradigma iets weg van een bekering of een gestalt-switch. Een bekend voorbeel van een gestalt-switch is hieronder te zien. In de afbeelding is zowel een konijn als een eend te zien en het voor het brein een omslag om over te stappen van het ene naar het andere beeld.

Tijd voor een voorbeeld. Zoals we eerder gelezen hebben, waren er in de 15de eeuw twee theorieën over het zonnestelsel. Volgens de ene theorie draaide de zon om de aarde (het geocentrische model) en volgens de andere theorie draaide de aarde om de zon (het heliocentrische model). Zoals we eerder gezien hebben had het geocentrische model een aantal goede voordelen ten opzichte van het geocentrische model. Ten eerste leek het heel onwaarschijnlijk dat een object als de aarde ooit in beweging zou zijn gebracht en ook onwaarschijnlijk dat de aarde in zijn beweging zou voortzetten. Dit was vooral problematisch omdat het vacu¨m nog niet was ontdekt en gedacht werd dat een vacu¨m niet mogelijk was, omdat op aarde elke potentieel vacu¨m direct opgevuld werd met lucht. Daarnaast voelen we ook nog eens niks van de beweging van de aarde.

Een ander bewijs dat de aarde stil zou staan kwam van een nauwkeurige meting aan de positie van de sterren gedurende het jaar. Als de aarde om de zon zou draaien, dan zou - zoals je kunt zien in de onderstaande afbeelding - het patroon van de sterren gedurende het jaar moeten veranderen. Dit gebeurde echter niet, hetgeen werd gezien als een direct bewijs voor het geocentrische model.

Het heliocentrische model ontstond door het bestuderen van de bewegingen van de planeten. De planeten bewegen niet in nette cirkelbanen om de aarde, maar bewegen in vreemde loopjes die epicycles worden genoemd (zie de onderstaande afbeelding). Het geocentrische model kon deze loopjes niet goed verklaren.

Copernicus had laten zien dat deze loopjes wellicht veroorzaakt werden doordat we naar bewegende planeten kijken vanaf een bewegende aarde. Hij liet zien dat als alle planeten, inclusief de aarde, in cirkelbanen om de zon draaide, dat het dan inderdaad vanaf de aarde leek alsof de planeten vreemde loopjes maakten, maar dat dit in werkelijkheid helemaal niet gebeurde. Dit is een sterk punt van het heliocentrische model.

Het heliocentrisch model had echter in zijn tijd ook een heel aantal zwakke punten. Als de aarde om de zon draait, dan bevindt de aarde zich dus niet in het middelpunt van het universum. Maar waarom vallen we dan allemaal toch naar de aarde toe? En waarom heeft de aarde dan toch een bolle vorm? Waren merken we niets van de beweging van de aarde? Al deze problemen waren in het geocentrische paradigma gemakkelijk op te lossen.

Het probleem met de parallax kon Copernicus al oplossen, maar hij moest hiervoor wel aannemen dat de sterren velen malen verder stonden dan tot dusver gedacht werd - omdat in dat geval het parallaxeffect onmeetbaar klein werd. Er waren echter geen aanwijzingen dat de sterren daadwerkelijk zo ver weg stonden. We zien hier precies waar Quine op gewezen had. In plaats van het missende parallax effect te zien als een bewijs dat de aarde stil staat, bedacht Copernicus een hulphypothese om zijn theorie te kunnen redden. Hetzelfde werd gedaan door Galileo betreft het vacu¨m. Om het heliocentrische model te laten overleven besloot hij aan te nemen dat het vacu¨m mogelijk was - hetgeen in zijn tijd door geen enkele meting bevestigd was - en dat er in de ruimte een totaal vacu¨m moest heersen.

Zoals je hebt kunnen zien, hadden beide theorieën dus hun eigen sterke en zwakke kanten en je kan het een wetenschapper uit die tijd dus lastig kwalijk nemen als hij na Copernicus alsnog in het geocentrische model geloofd had. De aanhangers van het heliocentrische model konden dan wel de epicycles verklaren, maar daar moesten ze voor aannemen dat het universum geen centrum had en dat de aarde als geheel met een enorme snelheid door een vacuüm zou moeten bewegen. De aanhangers van het geocentrische model vonden dit destijds terrecht onwaarschijnlijk.

Beide paradigma's vertegenwoordigen dus een compleet andere kijk op hoe de wereld werkt, elk met zijn eigen bewijzen en logica en elk hun sterke en zwakke punten. Hier is duidelijk sprake van incommensurabiliteit. Er was geen logisch manier voor wetenschappers om destijds te kiezen om de oude theorie verder te verbeteren of om op de nieuwe theorie over te stappen.

Toen Galileo en Newton het heliocentrisch model uiteindelijk verder uitwerkte, werd het geocentrische model uiteindelijk onhoudbaar. Volgens Kuhn maakte op dat moment het ene paradigma (het geocentrische model) definitief plaats voor het andere (het heliocentrische model). Op dat moment vond een paradigmaverschuiving plaats.




Feyerabend's radicale conclusie

We zijn begonnen met het ideaal van Francis Bacon om interpretatie uit de wetenschap te bannen, om zo geheel betrouwbare kennis te vergaren. Hoewel dit heeft gezorgd voor de enorme ontwikkeling in de wetenschap, is het nooit mogelijk helemaal zeker te zijn van de kennis die we vinden. Dit hebben we duidelijk gezien in de kritieken van David Hume, Quine en Kuhn. Een aantal wetenschappers besluiten soms zelfs op sommige momenten het principe van Bacon helemaal te verwerpen en weer 'vrij te gaan filosoferen' zoals de oude Grieken dat deden. Dit klinkt een domme zet na wat we allemaal gelezen hebben, maar soms geven zelfs de beste wetenschappers de voorkeur geven aan het vrije denken.

Een voorbeeld hiervan vinden we bijvoorbeeld in het werk van de Nederlandse natuurkundige Simon Stevin. Stevin stelde een willekeurige driehoekig object voor waaromheen een kabel werd gehangen (zie de onderstaande afbeelding). Op gelijke afstanden op de kabel waren stippen gezet. Zijn vraag was of de ketting linksom of linksom zou draaien of misschien wel helemaal stil zou blijven liggen.

Stevin kon dit natuurlijk met een experiment testen, maar dan zou hij te maken hebben met de wrijvingskracht en hij wilde weten ook weten wat er zou gebeuren als er geen wrijvingskracht zou zijn. Daarnaast zou het kunnen zijn dat de kabel zo langzaam in beweging zou komen dat dit lastig te detecteren is. Ook is het lastig een kabel te maken die overal even dik is. Experimenten zijn om dit soort redenen vaak problematisch. Stevin ging daarom liever af op de logica. Hij bedacht dat als de ketting bijvoorbeeld naar rechts zou bewegen, dan dat op een gegeven moment elke stip een plaats opgeschoven zou zijn. Mocht de ketting maar een klein beetje bewegen, dan kan je altijd de stippel veel dichter bij elkaar tekenen. Als de stippen opgeschoven zijn, dan ziet de situatie er weer precies hetzelfde uit als in de afbeelding. We zijn dus weer terug bij de beginsituatie en in deze situatie hadden we aangenomen dat de ketting naar rechts zou bewegen. Als de ketting dus naar rechts zou bewegen, dan zou deze altijd maar door moeten bewegen. Hiermee zou hij een machine hebben gemaakt die oneindig veel energie zou kunnen opwekken en dit soort machines bestaan niet, dus concludeerde Stevin dat de ketting wel stil moest blijven zijn.

Stevin had het experiment natuurlijk ook gewoon uit kunnen voeren. Maar hij gaf dus de voorkeur aan dit filosofisch denken, omdat er bij een experiment allerlei onbekende factoren het resultaat van het experiment kunnen beïnvloeden.

Ook Einstein was een groot voorstander van filosofisch denken. Hij vond sommige ideeën zo mooi, dat hij ze te bijzonder vond om een experiment nodig te hebben. Op een gegeven moment hadden een aantal goede onderzoekers in een nauwkeurig experiment zelfs laten zien dat een voorspelling van zijn relativiteitstheorie onjuist leek te zijn. Einstein's reactie was dat hij het belachelijk vond dat mensen in de uitslag van één experiment, terwijl de logica van zijn theorie zo krachtig was. Einstein negeerde dus gewoon experimentele data, omdat hij geloofde in zijn eigen theorie! Na jaren werd inderdaad gevonden dat de onderzoekers een fout hadden gemaakt en dat Einstein toch gelijk had. Einstein verwees in dit soort situaties keer op keer naar het belang van een logische eenvoud en symmetrie in zijn theorieën, die hij dus soms belangrijker vond dan experimentele verificatie. Hij gaf toe dat deze instelling niet altijd wetenschappelijk was. Hij noemde zijn ideeën vaak 'verzinsels', 'vrije creaties van de menselijke geest of 'diep religieuze overtuigingen'. Toch bleek hij meestal bleek hij gelijk te hebben.

Net als Quine geloofde Einstein ook dat er vaak meerdere theorieën te bedenken zijn op basis van dezelfde set observaties. Maar hoewel Einstein geloofde dat theorieën verzinsels waren, zag hij het wel als het doel van een theorie om de objectieve realiteit te beschrijven. Hij wist dat het niet mogelijk is om met zekerheid te zeggen dat een theorie deze werkelijkheid ook daadwerkelijk beschrijft. Dat hij dit toch deed was zijn 'diep religieuze overtuiging'. In sommige gevallen kunnen hele complexe processen opeens heel simpel verklaard worden. Denk bijvoorbeeld aan het moment dat Copernicus de epicycles kon verklaren met simpele cirkelbewegingen. Het systeem werd opeens zoveel simpeler (zie de volgende afbeelding). Dit kon geen toeval zijn. Einstein noemde zijn iedereen dus 'vrije creaties', maar hij was pas onder de indruk als deze ideeën de observaties op een logisch manier kan ordenen tot een eenvoudige harmonisch geheel.

Toch ging Einstein experimentele resultaten natuurlijk niet helemaal uit de weg. Sterker nog, de theorie van Einstein was beter in overstemming met de data dan zijn voorgangers. Hij vertrouwde er gewoon op dat de paar experimenten die niet overeenkwamen uiteindelijk verbeterd zouden worden in overeenstemming met zijn theorie. Ook voor Einstein waren de metingen immers het uiteindelijke bewijs dat zijn theorie klopt. We moeten volgens Einstein alleen niet te snel onze meest elegante theorieën verwerpen als een experiment misschien tijdelijk het tegendeel beweerd. Zowel de methode van Bacon en de methode van Einstein hebben dus een plaats in de wetenschap. Geen van beide geeft ons zekerheid, maar beide zijn waardevol gebleken.

Het idee dat er meerdere manieren zijn om wetenschap te bedrijven en dat er dus niet één wetenschappelijke methode is, is het best uitgewerkt door de wetenschapsfilosoof Paul Feyerabend. In sommige gevallen kiezen wetenschappers voor directe verificatie en in andere gevallen voor falsificatie. Als beide methoden niet werken kan je altijd nog kiezen voor indirecte verificatie. Soms laten we bij het mislukken van een experiment onze hypothese vallen, terwijl op andere momenten we een hulphypothese veranderen om zo toch nog in onze hypothese te kunnen blijven geloven. Soms leggen we nadruk op het experiment en wantrouwen we het 'vrije denken' en soms leggen we juist de nadruk op logisch denken en wantrouwen we het experiment. We hebben ook gelezen dat Einstein geregeld uitkomsten van experimenteel onderzoek negeerde, omdat hij zo onder de indruk was van de eenvoud en symmetrie van zijn theorie. Andere wetenschappers zijn echter bereid om deze eenvoud en symmetrie op te offeren als dit betekent dat de theorie beter overeenkomt met de data. Al deze verschillende standpunten lijken tegenstrijdig, maar zijn op verschillende momenten toch productief geweest.

Al deze manieren van kijken zijn onmisbaar in de wetenschap, maar geen van deze methoden biedt ons absolute zekerheid. De enige manier om een redelijk vertrouwen te krijgen in een theorie is door overweldigend veel bewijs verzamelen, totdat de theorie duidelijk de voorkeur krijgt boven alle alternatieven. We hebben gezien hoe dit gegaan is bij de overgang van geocentrische naar het heliocentrische model. Deze overweldigende hoeveelheid bewijs is echter niet altijd aanwezig en dan wordt het lastig.

Feyerabend concludeerde dat er in de wetenschap eigenlijk geen enkele vaste methode bleek te bestaan die niet op een of ander tijdstip overtreden wordt. Feyerabend stelde daarom voor dat we niet een te beperkte visie op de wetenschap moeten hebben. Hij vond dit een fijne houding, omdat het ruimte geeft in de wetenschap voor creativiteit, voor verbeelding en voor intuïtie. Dit is precies het omgekeerde van de visie van Bacon, die vond dat theorieën moeten voortvloeien uit onpersoonlijke metingen. Feyerabend ziet hier echter geen probleem. Beide methoden zijn succesvol geweest en beide methoden moeten we blijven inzetten.