Kartan är en PCA plott av deriverade NIR-transmissionsspektra. Att derivera spektra före PCA analysen är ett vanligt sätt att korrigera för hur grumliga proverna är. Och tyvärr visade sej grumligheten vara något som äventyrar hela projektet - i alla fall om jag skall fortsätta frysa proverna. Eftersom det inte finns några kvalitetsviner som är kylstabiliserade hade salter och syror fällt ut i de flesta av proverna. Syrorna är säkert en av de viktigaste parametrarna i analysen, och eftersom jag inte kan mäta på dem i partikelform blir bilden troligen inte helt korrekt.
Om man skall ge sej på en kort analys av kartan i alla fall så kan man säga att skillnaderna mellan vita viner (gröna punkter) och röda viner (röda punkter) var betydligt mindre än vad jag hade väntat mej.
1. Det ser ut som att väl mogna viner (som Clerc Milon 1990 och Ogier Côte-Rôtie 1995) är på väg över i fältet för vita viner.
2. Unga och oförlösta rödviner som Beaucastel 2006 och Rocca Guicciarda 2006 placerar sej i fullständigt motsatt riktning från de mest syrahaltiga och icke-malolaktiskt jästa vinerna som Champagnen och Alvarinhoproverna.
3. Nebbiolovinerna verkar ha hittat en helt egen plats på kartan! Och de ligger helt i motsatt riktning från de röda Bourgognerna, som de ofta liknas vid.
4. Det enda vitvinet som genomgått fullständig malolaktisk jäsning, Neudorf Chardonnay, placerar sej på en helt annan plats än de andra vitvinerna.
Ett försök till visualisering av metoden:
Varje typ av molekyl som finns i ett vin, låt det vara t.ex äppelsyra, citronsyra, glukos, etylacetat, brett eller etanol, absorberar ljus vid olika våglängder. Om man sänder en stråle ljus genom ett vin kommer varje molekyl i vinet att påverka det ljus som till slut kommer igenom provet. Man har då fått ett spektrum som beskriver provets kemiska sammansättning. Ett spektrum i numerisk form är helt enkelt ett absorbansvärde för varje våglängd. Noll betyder att ingen molekyl har fångat upp den våglängden. Ett värde över noll betyder att någon molekyl i provet har fastnat för den våglängden. Storleken på absorbansen beskriver hur mycket av den molekylen som finns i provet. En plott med våglängder på x-axeln och absorbansen på y-axeln kallas för ett spektrum.
Nu kommer PCA-analysen in i bilden. Säg att vi mäter vid tre våglängder och får ett absorbansvärde för varje våglängd. Säg att varje våglängd är en axel i ett vanligt rätvinkligt koordinatsystem (xyz). Då kan vi plotta varje spektrum som en punkt i detta koordinatsystem (ett värde per axel). En punkt i en xyz-rymd. Sen kan vi gå med en ficklampa i detta rummet och lysa på pricken i olika vinklar. Skuggan av pricken kommer att synas på en "duk" som är tvådimensionell (kartan). Vi människor kan inte tänka oss mer än tre rätvinkliga axlar i ett koordinatsystem (tre dimensioner), men rent matematiskt är det inga problem att räkna med ett oändligt antal rätvinkliga axlar eller dimensioner. Varenda av de 3000 våglängder som jag mäter får en egen rätvinklig axel, och varje vin kan då plottas som en punkt i detta ofattbara koordinatsystem. Sen gäller det att "lysa med ficklampan" i rätt vinkel för att få en bra tvådimensionell bild. Allt sker såklart via en mjukvara som optimerar vinkeln på "lampan".
Kort sagt: viner som är lika i sin kemiska sammansättning kommer att ligga nära varandra i den tvådimensionella bild som uppträder. Viner som är olika långt ifrån varandra.
Busenkelt. Men sen drar vi till med en gymnasie-A-derivering av spektra för att dra bort den konstanta absorbans som partiklar i prover medför.
10 kommentarer:
Kartan såg perfekt ut på jobbdatorn, men på min hemmafator ser det för j-vligt ut. Kan ni se det OK?
Det ser OK ut, lite överlappande text bara men det funkar.
Carobric´en sticker verkligen ut, spännande - du kan vara något på spåret här.
/Patrik
Galet coolt.
Min första tanke var "vill se samma plot fast normaliserad för syran", sen läste jag igen och insåg att det var i princip det den är... Kanske inte det du tänkt dig men för mig är det roligare att se korrelationerna för komponenter man inte känner så lätt själv - det är liksom trivialt att viner med hög syra annars hamnar nära varann... Eller?
I vilken form finns datan? Skulle gärna testa att visualisera den på ett alternativt sätt. Antingen spektrumen, eller en matris med parvisa korrelationer skulle vara kanon :)
Kan du göra en tolkning "for dummies". Jag begriper ingenting.
Hej alla,
Jag tror hela bilden har blivit helt fel pga av de utfällda ämnena, och jag skall starta om från början med prover som förvarats i rumstemperatur. Men då måste jag köra detta en gång per vecka, minst. Vi skall komma ihåg att denna analysen inte fångar "stalldoft" eller "rökt korv". Det är de vanligaste ämnena i vinet som mäts, typ socker, olika organiska syror, alkohol, tanniner etc.
Datan ligger i form av ett enormt excelark (26 viner med 3000 olika våglängder).
Tommy - jag skall försöka lägga ut en populärvetenskaplig version av metoden - men den är rätt krånglig om man inte har bra koll på matematiken.
Strålande och intressant!
Det blir väl till att samla ihop prover snabbare och förvara i kylen istället?
En mässprovning hade väl varit perfekt men det funkar väl inte med svenska lagar?
Verkligen spännande, fast jag undrar om du kan få åldrandet av slattarna under kontroll. Ett tag höll vi på att ta med vin i en fylld 5-cl flaska till varandra för att prova, men ofta smakade vinet bara kylskåp. Vissa ämnen ändras väl inte, men syror och tanniner kan väl vara lättpåverkade av syre.
Förslaget med en vinmässa är bra, och sedan får du komplettera med kvävgas, eller kanske samla upp tomflaskor med några cl kvar och täta med vacuvin.
Förresten, du kan ju ta samma vin nyöppnat och en vecka gammalt och se om det ändras. Mitt intryck är för övrigt att röd bourgogne aldrig är lika bra dagen efter, medan riesling är svår att påverka.
Det är en bra idé att testa ett vin direkt efter öppnande och några dagar senare. Skulle det visa sej att det flyttar runt vinet väsentligt kan jag nog lägga ner idén... eller öppna fredagsvinet på jobbet.
Vet inte om jag hajjar deriveringssteget. Är inte spektrum mer av en "kategoriaxel" där frekvens x och x+1 inte har något egentligt samband? Hur kan man då derivera om man inte har en funktion? (eller diskret serie)
Om du har lust, maila mig excelbladet på per snabela peblin.nu, så får man leka med lite korrelationsgeometri :)
Man brukar sammanfoga punkterna till en kurva, men visst är det diskreta värden. Själva deriveringen av kurvan görs i mjukvaran - som bekant försvinner då alla konstanter (som den jämna absorbans som grumlighet ger).
Jag kan skicka excelarket i morgon, den ligger på jobbdatorn.
Skicka en kommentar