We zijn ondertussen bijna anderhalf jaar verder en trouw klop ik de gegevens van elk brouwsel in mijn spreadsheet in. Deze berekent de voorspellingen met het model van Geert en met het lineaire regressiemodel. Nog steeds levert het lineaire regressiemodel met 6 variabelen een iets beter resultaat (met 45 brouwsels). Hieronder twee grafiekjes: eentje van het regressiemodel en eentje van het model van Geert. Op de x-as het voorspelde eind SG en op de Y-as het berekende eind SG. De zwarte lijnen geven de ideale fit weer (voorspeld = gemeten) en de blauwe lijn is de beste fit door de puntenwolk. In het ideale geval liggen zowel de blauwe lijn als de blauwe ruitjes op de zwarte lijn.


De gemiddelde afwijking tussen berekend en gemeten is bij het regressiemodel 1,58 SG punt en bij het model van Geert 1,61 SG punt. Voor beide een uitstekend resultaat dus, vind ik. Wel heb ik bij beide modellen vijf sterk afwijkende brouwsels uit de dataset verwijderd.
Bij de data van de Vier Broeders (38 bieren) voldoet het model van Geert iets beter (gemiddelde afwijking 1,61 SG punt) dan het regressiemodel (gemiddelde afwijking 1,69 SG punt). Beide modellen zijn dus heel goed bruikbaar voor het voorspellen van het eind SG.