Ik heb de gegevens van de Vier Broeders (39 brouwsels) eens vergeleken met die van Het Witte Paard (30 brouwsels). Twee brouwerijen, dezelfde brouwer.
Wat opvalt (en dat was me al eerder opgevallen) is dat de vergistingsgraden bij De Vier Broeders hoger zijn dan die bij Het Witte Paard. Geen idee waar dat aan ligt. Ik zou eerder het omgekeerde verwachten, omdat de Vier Broeders brouwsels meestal minder gist krijgen (per ml wort). Bij de voorspelling van de schijnbare vergistingsgraad scheelt het ongeveer 8% procentpunten! Bij een bier van 1048 komt dat neer op 3 SG punten verschil in de einddichtheid. Kan het liggen aan de thermometer? Wellicht wordt het mysterie opgelost als de Vier Broedersbrouwerij in Zupthen staat.
Als ik naar de grafiekjes kijk in Geerts model, zie ik andere relaties tussen parameters en de vergistingsgraad (of eigenlijk de berekende index). Beslagdikte komt bij beide brouwerijen als niet significant uit de bus (r² is zeer laag), net als de amylasetijd. Het percentage caramout komt alleen bij de Vier Broeders een beetje belangrijk uit de bus (r²=0,11). % suiker komt bij Het Witte Paard als zeer belangrijk uit de bus (r²=0,34), maar niet bij De Vier Broeders (r²=0,009). De amylasetemepratuur is bij beide belangrijk, maar de afgeleide kwadratische functie ziet er heel anders uit. Bij Het Witte Paard loopt ie vanaf 63 graden licht naar beneden tot een minimum bij 67,5 graden en loopt dan weer een beetje op. Bij de Vier Broeders ligt de top bij 65 graden (wat je theoretisch verwacht).
Ook heb ik gekeken naar de lineaire regressie. Ook hier wijken de voorspellingen tussen de twee brouwerijen af. De beste regressie is die met 6 variabelen en de uitbijters verwijderd. Deze geeft bij beide brouwerijen een fout in de voorspelde SVG van 2% en iets meer dan 1 SG-punt. Bij het model van De-Geert is dat 4% en 2,2 SG-punten c.q. 3% en 1,9 SG-punten.
Bij beide brouwerijen geeft de lineaire regressie met drie variabelen een vergelijkbaar resultaat. Hierbij zijn alleen de (gewogen gemiddelde) versuikeringstemperatuur, de vergistingsgraad van de gist en het percentage suiker meegenomen. Deze voorspellingen doen iets beter dan het model van Geert.
Conclusies:
1. Elk model moet geijkt worden per brouwerij.
2. Het simpelste model (lineaire regressie met drie variabelen) voldoet iets beter dan het ingewikkeldste model (model van Geert).
3. Het lineaire regressiemodel met 6 variabelen voldoet iets beter dan die met 3 variabelen, maar niet zodanig dat het de extra ingewikkeldheid rechtvaardigt.