Zelfs de vraag of een bepaalde meting telt als bewijslast voor een bepaalde stelling is ingewikkeld. De logisch positivisten kwamen met het meest simpele voorstel hiervoor, genaamd het instantial model. Als men een A vindt met eigenschap B, dan dient dit als bewijslast voor 'Alle A's zijn B'. Dit wil natuurlijk niet meteen zeggen dat de stelling waar is. Om hier zekerder van te zijn is het van belang herhaaldelijk te meten.

De filosoof Carl Hempel liet zien dat je zelfs met dit model dingen als bewijslast moet tellen, die we intuitief hier niet toe zouden rekenen. Hij noemde zijn idee hierover de paradox van de raaf. De stelling 'Alle raven zijn zwart' is logisch equivalent aan 'Alle niet-zwarte dingen zijn niet-raven'. Als we waarde hechten aan de logica - wat we natuurlijk doen - dan moet deze tweede stelling ook waar zijn. Maar volgens deze stelling zouden volgens het instantial model alle niet-zwarte dingen, die geen raaf zijn, ook bewijs zijn voor 'alle raven zijn zwart'. Als we bijvoorbeeld een geel potlood vinden, dan zou dit bewijslast moeten leveren voor 'alle raven zijn zwart'. Maar wat heeft het gele potlood nu weet met een raaf te maken? Gekker wordt het nog als we bedenken dat het gele potlood ook bewijslast levert voor 'alle raven zijn rood' en zelfs voor 'elke mier is een olifant'!

Hempel zijn had er trouwens geen probleem mee om het gele potlood te gebruiken als bewijs voor 'alle raven zijn zwart'. Hij beschouwde het als een vooroordeel, dat 'alle raven zijn zwart' alleen over raven moet gaan. Stel namelijk dat je alle niet-zwarte objecten zou bekijken en geen raven zou aantreffen, dan zou men weten dat alle raven zwart zijn!

Ook falsificatie is trouwens problematisch in de paradox van de raaf. Popper dacht dat een stelling falsifieerbaar moest zijn om als bewijs te kunnen dienen. Als wij eerst een zwart object bekijken en pas daarna kijken of het om een raaf gaat, dan kan de stelling niet gefalsifieerd worden. Als het object een raaf blijkt te zijn, dan is de stelling bevestigd (verificatie) en als het geen raaf blijkt te zijn, dan dient de meting niet als bewijslast voor of tegen de stelling. Het wordt op deze manier onmogelijk om raven van een andere kleur te vinden en dus om te falsifiëren. Als we op deze manier duizenden raven zouden meten, dan zou dit volgens de theorie van Popper totaal niets toevoegen aan de bewijslast!

Als men echter een geel object vindt en het blijkt daarna wel of niet een raaf te zijn, dan werkt falsificatie wel. Als het wel een raaf blijkt te zijn, dan is de stelling 'alle raven zijn zwart' gefalsifieerd. Als het geen raaf blijkt te zijn, dan heeft het een test doorstaan en zou dit dus volgens Popper wel moeten dienen als bewijslast. Er bestond immers de mogelijkheid, dat het gele object een raaf was. Zowel de verificatie als de falsificatie heeft dus het probleem dat gele potloden kunnen dienen als bewijslast. Zoals we eerder gelezen hebben is alleen bij falsificatie de volgorde van observatie belangrijk - zien we eerst het voorwerp en dan de kleur of eerst de kleur en dan het voorwerp. De een levert bewijslast en de ander niet.

Als het instantial model als problematisch kan zijn, dan kan je je misschien voorstellen dat het nog vele malen problematischer wordt als je bedenkt dat wetenschappers vaak genoegen nemen met stellingen die voor complexer dat zijn 'Alle A zijn B'. Een meer populair alternatief op dit model is het hypothetico-deductive model. Dit model stelt dat bewijslast is geleverd voor een hypothese, als de consequenties of gevolgen van deze hypothese waar blijken te zijn. Hiermee kunnen we bijvoorbeeld concluderen dat licht een golfkarakter heeft als we met licht een interferentiepatroon kunnen maken (een patroon dat we ook vinden bij bijvoorbeeld golven in water en bij geluidsgolven). Deze conclusie mogen wetenschappers in dit model trekken zonden direct golf van licht gezien te hebben. Het zal je ondertussen niet verbazen dat deze extra vrijheid in veel gevallen ook juist erg problematisch kan zijn.

Dit model wordt soms aangebreid door toe te voegen dat de hypothese de data ook moet kunnen verklaren. De theorie die een set aan data zowel het best kan beschrijven als verklaren krijgt hier de voorkeur. Maar zelfs deze combinatie is problematisch als we bedenken dat theoriën die al eeuwen bestaat vaak heel veel verklaren en nieuwe concurerende theorieën aan het begin nog te kort schieten. Hoewel de bewegingsleer van Aristoteles bijvoord meer verklaarde dan het alternatief van Galileo, betekende dit niet, dat de theorie van Aristoteles beter was. Pas laten - in de tijd van Newton - namen de ideëen van Galileo de overhand. Maar hoe weten we of de theorieën die we nu voor waar aannemen niet uiteindelijk worden ingehaald door nu nog onderontwikkelde alternatieven. Daarnaast is het ook nog zo dat verklaringen vaak moeilijk te vergelijken zijn. Zo had Copernicus bijvoorbeeld laten zien dat als hij aannam dat de aarde om de zon bewoog, dat de geobserveerde banen van de planeten dan veel simpeler werden. Maar is een simpelere baan van een planeet daadwerkelijk bewijs dat hij dan ook gelijk had? Kon het niet zijn dat de planeten wel in de complexere manier bewegen zoals door zijn collega's gedacht werd? En hoe kon een object zo zwaar als de aarde in beweging zijn gekomen en in beweging blijven? En waarom merken we niets van deze beweging? Het was in die tijd lastig te besluiten welke bewijsvoering daadwerkelijk beter was. Pas door het werk van Galileo werden de meeste wetenschappers over de streep getrokken en werd het heliocentrische model geaccepteerd.

Ook in dit geval zien we dat ons intuitieve idee van bewijslast moeilijk vast te leggen is in een precieze defintie. Elk model dat we bedenken laat onzinnigheden binnen en laat degelijk onderzoek buiten. Wederom dwingt dit respect af voor de mogelijkheid van onze hersenen om in dit soort situaties vaak goede beslissingen te maken.